DeepSeek R2難產:近期 DeepSeek-V3.1 發布,邁向 Agent 時代的第一步

DeepSeek R2難產:近期 DeepSeek-V3.1 發布,邁向 Agent 時代的第一步

要說 AI 模型的江湖,這一年簡直就是 「大模型修羅場」
前腳 R2 傳出難產的風聲,后腳 DeepSeek 就甩出了一張大招牌:DeepSeek-V3.1

這波操作不僅沒有掉隊,反倒像是提前踩進了 Agent 時代的大門
作為一只長年蹲在模型圈的貓頭虎,看完更新細節后,忍不住和大家聊聊:
👉 這次升級到底意味著什么?
DeepSeek R2難產:近期 DeepSeek-V3.1 發布,邁向 Agent 時代的第一步

文章目錄

  • DeepSeek R2難產:近期 DeepSeek-V3.1 發布,邁向 Agent 時代的第一步
    • 🌟 V3.1 三大核心升級
    • 🛠? Agent 能力:更強的工具人
      • 💻 編程智能體
      • 🔍 搜索智能體
    • ? 思考效率:同樣的智商,更少的字
    • 📂 模型開源 & 部署須知
    • 💰 價格調整:9月6日見
    • 🦉 貓頭虎的思考
    • 🎯 總結


🌟 V3.1 三大核心升級

1?? 混合推理架構
一個模型同時支持 思考模式非思考模式,隨時切換,更靈活。

2?? 思考效率提升
相比 R1-0528,V3.1-Think 輸出 token 數減少 20%-50%,在更短時間內給出答案。
👉 省字、省錢、省時間。

3?? Agent 能力進化
后訓練優化后,V3.1 在 工具調用任務執行 上有了顯著提升,Agent 味越來越濃。

📌 官方 App & 網頁端已同步升級;
📌 API 支持 deepseek-chat(非思考模式) 和 deepseek-reasoner(思考模式);
📌 新增 Anthropic API 格式支持,可無縫接入 Claude Code 框架。

DeepSeek R2難產:近期 DeepSeek-V3.1 發布,邁向 Agent 時代的第一步


🛠? Agent 能力:更強的工具人

💻 編程智能體

圖片

V3.1 在 代碼修復(SWE)終端任務(Terminal-Bench) 中明顯優于前代,所需輪數更少。
👉 寫代碼、跑命令行的場景里,Agent 變得更實用。

🔍 搜索智能體

圖片

復雜搜索(browsecomp)多學科難題(HLE) 測試中,V3.1 大幅領先 R1-0528。
👉 檢索+多步推理能力顯著增強,更像個“知識獵手”。


? 思考效率:同樣的智商,更少的字

圖片

測試顯示:

  • 表現基本持平 R1-0528(AIME 2025: 87.5/88.4,GPQA: 81/80.1,liveCodeBench: 73.3/74.8);
  • token 消耗下降 20%-50%
  • 非思考模式下,輸出也更簡潔,不啰嗦。

👉 簡而言之:更聰明的省話精


📂 模型開源 & 部署須知

DeepSeek 繼續保持開放態度:

🔹 Base 模型(新增 840B tokens 訓練)

  • Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
  • 魔搭: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

🔹 后訓練模型

  • Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1
  • 魔搭: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1

?? 注意事項:

  • V3.1 使用 UE8M0 FP8 Scale 精度,與 V3 不完全兼容;
  • 分詞器 & chat template 變動較大,部署需看新版文檔。

💰 價格調整:9月6日見

圖片

2025 年 9 月 6 日凌晨起

  • 按新版價格表計費;
  • 取消夜間優惠

👉 在此之前,仍按老價格執行。
同時,DeepSeek 也擴容了 API 服務,調用更順暢。


🦉 貓頭虎的思考

  1. R2 難產,V3.1 扛旗
    這波算是戰略補位,穩住用戶心智。

  2. Agent 化是大趨勢
    編程、搜索、工具調用都變強,說明 DeepSeek 已經在鋪設 下一代 AI 工作流

  3. 價格與開源的平衡術
    一邊漲價,一邊開源,本質是 降成本、擴生態 的兩手抓。


🎯 總結

DeepSeek-V3.1 不是一鳴驚人的“天花板式”大模型,但它足夠 實用且前瞻

? 效率更高,省錢省時
? Agent 能力更強,場景更廣
? 開源透明,生態友好

在 AI Agent 的賽道上,DeepSeek 已經穩穩邁出第一步。


🦉 貓頭虎觀點:
別糾結 R2 了,V3.1 已經在布一盤更大的棋。


本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/96366.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/96366.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/96366.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

element-plus:el-tree ref初始化異常記錄

文章目錄描述問題解決記錄一個tsx 下el-tree的小問題描述 <Dialog v-model"showEdit" :title"t(button.edit)" width"900" :maxHeight"650"><el-form :model"nowdata" class"dialog"><el-form-ite…

Linux軟件安裝(JDK,Mysql,Nginx)

安裝方式介紹一、安裝JDKtar -zxvf jdk-17.0.10_linux-x64_bin.tar.gz -C /usr/localexport JAVA_HOME/usr/local/jdk-17.0.10export PATH$JAVA_HOME/bin:$PATHsource /etc/profile1、操作步驟二、mysql黑馬視頻已經安裝好了我們只需開放指定端口就可以在navicat中連接了&#…

公有地址和私有地址

在計算機網絡中&#xff0c;私有地址和公有地址是IP地址的兩大重要分類&#xff0c;二者在網絡通信中承擔著不同角色。下面從定義、聯系、區別和應用四個維度進行詳細說明&#xff1a; 一、定義 1. 公有地址&#xff08;Public IP Address&#xff09; 公有地址是全球唯一且可在…

分治思想在系統分流削峰中的實踐與Golang前沿實現

分治思想在系統分流削峰中的實踐與Golang前沿實現 1. 分治思想概述 分治(Divide and Conquer)是計算機科學中一種重要的算法設計思想&#xff0c;其核心在于"分而治之"——將復雜問題分解為若干個規模較小的相同或相似子問題&#xff0c;遞歸地解決這些子問題&#x…

移動端視口終極解決方案:使用 Visual Viewport封裝一個優雅的 React Hook

前言 在移動端開發中&#xff0c;視口高度一直是一個令人頭疼的問題。尤其是在 iOS Safari 瀏覽器中&#xff0c;還有三星手機的導航遮擋&#xff0c;當虛擬鍵盤彈出時&#xff0c;視口高度的變化會導致固定定位元素錯位、全屏布局異常等問題。本文將深入分析這個問題的本質&a…

react中key的作用

在 React 中&#xff0c;key 是一個特殊的屬性&#xff08;prop&#xff09;&#xff0c;它的主要作用是幫助 React 識別哪些元素發生了變化、被添加或被移除&#xff0c;從而高效地更新和重新渲染列表中的元素。以下是 key 的具體作用和注意事項&#xff1a;1. 高效更新虛擬 D…

Lua學習記錄 - 自定義模塊管理器

為人所知的是lua自帶的require函數加載腳本只會加載一次(就像unity里面的資源管理和AB包管理)&#xff0c;而主播調試習慣是用Odin插件的Button在unity編輯器模式里調試而非進入播放模式后調試&#xff0c;今天主播在做熱更新相關的時候企圖多次調用腳本打印以調試功能&#xf…

MongoDB 分片集群復制數據庫副本

文章目錄一、登錄MongoDB查詢數據庫及集合分片情況二、登錄MongoDB先創建副本數據庫并設置數據庫及集合分片功能三、登錄MongoDB查詢emop_slinkmain數據庫main_repetition集合和四、使用mongodump壓縮備份emop_slinkmain數據庫中的main_repetition集合和shard_repetition 集合五…

SQLite 加密與不加密性能對比與優化實踐

在項目中&#xff0c;為了保證數據安全&#xff0c;我們可能會對 SQLite 數據庫進行加密&#xff08;例如使用 SQLiteMC/SQLCipher&#xff09;。然而&#xff0c;加密數據庫在帶來安全性的同時&#xff0c;也會帶來顯著的性能損耗。本文結合實測與源碼分析&#xff0c;介紹 SQ…

Azure官網為何沒直接體現專業服務

微軟Azure官網沒有直接、醒目地展示其專業服務&#xff08;如遷移、定制化解決方案咨詢等&#xff09;&#xff0c;確實容易讓人疑惑。這背后其實是微軟Azure特定的市場策略和商業模式。下面我為你解釋原因&#xff0c;并告訴你怎么找到這些服務。&#x1f9e9; 核心原因&#…

人體生理參數信號采集項目——心電信號

1.硬件——焊接調試趣事&#xff1a;由于測量手法問題&#xff0c;以及對示波器不太熟悉&#xff0c;差點以為沒信號&#xff0c;都打算重焊一塊板子了&#xff0c;但&#xff0c;實際上&#xff0c;信號輸出是相對完美的&#xff1b;遇到的疑難雜癥&#xff1a;1&#xff09;5…

Go1.25的源碼分析-src/runtime/runtime1.go(GMP)g

1. 主要組成部分 Go語言的GMP調度器基于四個核心數據結構&#xff1a;g、m、p和schedt。 1.1 主要常量解讀 1.1.1G 狀態常量 const (_Gidle iota //剛分配尚未初始化的 G_Grunnable//已在運行隊列上&#xff0c;未執行用戶代碼&#xff1b;棧未被該 G 擁有_Grunning//正在…

使用jwt+redis實現單點登錄

首先理一下登錄流程 前端登錄—>賬號密碼驗證—>成功返回token—>后續請求攜帶token---->用戶異地登錄---->本地用戶token不能用&#xff0c;不能再訪問需要攜帶token的網頁 jwt工具類 package com.nageoffer.shortlink.admin.util;import cn.hutool.core.util.…

Trae配置rules與MCP

這個文章不錯&#xff0c;不過如果只是看&#xff0c;還感受不到作者的震撼&#xff0c;所以我自己實操了一下&#xff0c;深受震動&#xff0c;也希望看到這篇文章的人也自己實操一下。 與Cursor結對編程的四個月&#xff0c;我大徹大悟了&#xff01; 學到了什么 無論是熟悉…

對抗攻擊與防御:如何保護視覺模型安全?

對抗攻擊與防御:如何保護視覺模型安全? 前言 一、對抗攻擊的基本原理 二、對抗攻擊的主要類型 2.1 白盒攻擊 2.2 黑盒攻擊 三、對抗攻擊的常見形式 3.1 定向攻擊 3.2 非定向攻擊 四、對抗防御的核心思路 五、常見的對抗防御方法 5.1 對抗訓練 5.2 輸入預處理 5.3 防御蒸餾 六…

區塊鏈開發:Solidity 智能合約安全審計要點

本文聚焦區塊鏈開發中 Solidity 智能合約的安全審計要點。首先概述智能合約安全審計的重要性&#xff0c;接著詳細介紹常見的安全漏洞&#xff0c;如重入攻擊、整數溢出與下溢等&#xff0c;以及對應的審計方法。還闡述了審計的具體流程&#xff0c;包括自動化工具檢測、手動代…

C++ 新手第一個練手小游戲:井字棋

1. 引言 介于身邊有特別多沒有學習過編程&#xff0c;或者有一定C語言、python或是Java基礎的但是沒有接觸過C的新手朋友&#xff0c;我想可以通過一個很簡單的小項目作為挑戰&#xff0c;幫助大家入門C。 今天&#xff0c;我們將挑戰一個對新手來說稍微復雜一點&#xff0c;…

透射TEM 新手入門:快速掌握核心技能

目錄 簡介? 一、TEM 基本知識 1. 核心原理&#xff08;理解圖像本質&#xff09;? 2. 關鍵結構與成像模式&#xff08;對應圖像類型&#xff09;? 二、TEM 數據處理 1. 預處理&#xff08;通用步驟&#xff09;? 2. 衍射花樣&#xff08;SAED&#xff09;處理&#x…

day075-MySQL數據庫服務安裝部署與基礎服務管理命令

文章目錄0. 老男孩思想-老男孩名言警句1. 數據庫服務安裝部署1.1 下載安裝包1.2 系統環境準備1.2.1 關閉防火墻1.2.2 關閉selinux1.2.3 安裝依賴軟件1.2.4 卸載沖突軟件1.3 安裝程序1.3.1 上傳軟件包1.3.2 配置環境變量1.3.3 創建數據庫存儲數據目錄1.3.4 創建數據庫程序管理用…

Qt二維碼生成器項目開發教程 - 從零開始構建專業級QR碼生成工具

Qt二維碼生成器項目開發教程 - 從零開始構建專業級QR碼生成工具 項目概述 本項目是一個基于Qt框架開發的專業級二維碼生成器&#xff0c;集成了開源的qrencode庫&#xff0c;提供完整的QR碼生成、預覽、保存和分享功能。項目采用C語言開發&#xff0c;使用Qt的信號槽機制實現…