DeepSeek R2難產：近期 DeepSeek-V3.1 發布，邁向 Agent 時代的第一步

要說 AI 模型的江湖，這一年簡直就是 「大模型修羅場」。
前腳 R2 傳出難產的風聲，后腳 DeepSeek 就甩出了一張大招牌：DeepSeek-V3.1。

這波操作不僅沒有掉隊，反倒像是提前踩進了 Agent 時代的大門。
作為一只長年蹲在模型圈的貓頭虎，看完更新細節后，忍不住和大家聊聊：
👉 這次升級到底意味著什么？
DeepSeek R2難產：近期 DeepSeek-V3.1 發布，邁向 Agent 時代的第一步

1?? 混合推理架構
一個模型同時支持 思考模式 與 非思考模式，隨時切換，更靈活。

2?? 思考效率提升
相比 R1-0528，V3.1-Think 輸出 token 數減少 20%-50%，在更短時間內給出答案。
👉 省字、省錢、省時間。

3?? Agent 能力進化
后訓練優化后，V3.1 在 工具調用 和 任務執行 上有了顯著提升，Agent 味越來越濃。

📌 官方 App & 網頁端已同步升級；
📌 API 支持 deepseek-chat（非思考模式）和 deepseek-reasoner（思考模式）；
📌 新增 Anthropic API 格式支持，可無縫接入 Claude Code 框架。

DeepSeek R2難產：近期 DeepSeek-V3.1 發布，邁向 Agent 時代的第一步

V3.1 在 代碼修復（SWE） 與 終端任務（Terminal-Bench） 中明顯優于前代，所需輪數更少。
👉 寫代碼、跑命令行的場景里，Agent 變得更實用。

在 復雜搜索（browsecomp） 與 多學科難題（HLE） 測試中，V3.1 大幅領先 R1-0528。
👉 檢索+多步推理能力顯著增強，更像個“知識獵手”。

測試顯示：

表現基本持平 R1-0528（AIME 2025: 87.5/88.4，GPQA: 81/80.1，liveCodeBench: 73.3/74.8）；
token 消耗下降 20%-50%；
非思考模式下，輸出也更簡潔，不啰嗦。

👉 簡而言之：更聰明的省話精。

DeepSeek 繼續保持開放態度：

🔹 Base 模型（新增 840B tokens 訓練）

🔹 后訓練模型

?? 注意事項：

自 2025 年 9 月 6 日凌晨起：

👉 在此之前，仍按老價格執行。
同時，DeepSeek 也擴容了 API 服務，調用更順暢。

DeepSeek-V3.1 不是一鳴驚人的“天花板式”大模型，但它足夠 實用且前瞻：

? 效率更高，省錢省時
? Agent 能力更強，場景更廣
? 開源透明，生態友好

在 AI Agent 的賽道上，DeepSeek 已經穩穩邁出第一步。

🦉 貓頭虎觀點：
別糾結 R2 了，V3.1 已經在布一盤更大的棋。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/96366.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/96366.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/96366.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！