DeepSeek R2難產:近期 DeepSeek-V3.1 發布,邁向 Agent 時代的第一步
要說 AI 模型的江湖,這一年簡直就是 「大模型修羅場」。
前腳 R2 傳出難產的風聲,后腳 DeepSeek 就甩出了一張大招牌:DeepSeek-V3.1。
這波操作不僅沒有掉隊,反倒像是提前踩進了 Agent 時代的大門。
作為一只長年蹲在模型圈的貓頭虎,看完更新細節后,忍不住和大家聊聊:
👉 這次升級到底意味著什么?
文章目錄
- DeepSeek R2難產:近期 DeepSeek-V3.1 發布,邁向 Agent 時代的第一步
- 🌟 V3.1 三大核心升級
- 🛠? Agent 能力:更強的工具人
- 💻 編程智能體
- 🔍 搜索智能體
- ? 思考效率:同樣的智商,更少的字
- 📂 模型開源 & 部署須知
- 💰 價格調整:9月6日見
- 🦉 貓頭虎的思考
- 🎯 總結
🌟 V3.1 三大核心升級
1?? 混合推理架構
一個模型同時支持 思考模式 與 非思考模式,隨時切換,更靈活。
2?? 思考效率提升
相比 R1-0528,V3.1-Think 輸出 token 數減少 20%-50%,在更短時間內給出答案。
👉 省字、省錢、省時間。
3?? Agent 能力進化
后訓練優化后,V3.1 在 工具調用 和 任務執行 上有了顯著提升,Agent 味越來越濃。
📌 官方 App & 網頁端已同步升級;
📌 API 支持deepseek-chat
(非思考模式) 和deepseek-reasoner
(思考模式);
📌 新增 Anthropic API 格式支持,可無縫接入 Claude Code 框架。
🛠? Agent 能力:更強的工具人
💻 編程智能體
V3.1 在 代碼修復(SWE) 與 終端任務(Terminal-Bench) 中明顯優于前代,所需輪數更少。
👉 寫代碼、跑命令行的場景里,Agent 變得更實用。
🔍 搜索智能體
在 復雜搜索(browsecomp) 與 多學科難題(HLE) 測試中,V3.1 大幅領先 R1-0528。
👉 檢索+多步推理能力顯著增強,更像個“知識獵手”。
? 思考效率:同樣的智商,更少的字
測試顯示:
- 表現基本持平 R1-0528(AIME 2025: 87.5/88.4,GPQA: 81/80.1,liveCodeBench: 73.3/74.8);
- token 消耗下降 20%-50%;
- 非思考模式下,輸出也更簡潔,不啰嗦。
👉 簡而言之:更聰明的省話精。
📂 模型開源 & 部署須知
DeepSeek 繼續保持開放態度:
🔹 Base 模型(新增 840B tokens 訓練)
- Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
- 魔搭: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
🔹 后訓練模型
- Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1
- 魔搭: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1
?? 注意事項:
- V3.1 使用 UE8M0 FP8 Scale 精度,與 V3 不完全兼容;
- 分詞器 & chat template 變動較大,部署需看新版文檔。
💰 價格調整:9月6日見
自 2025 年 9 月 6 日凌晨起:
- 按新版價格表計費;
- 取消夜間優惠。
👉 在此之前,仍按老價格執行。
同時,DeepSeek 也擴容了 API 服務,調用更順暢。
🦉 貓頭虎的思考
-
R2 難產,V3.1 扛旗
這波算是戰略補位,穩住用戶心智。 -
Agent 化是大趨勢
編程、搜索、工具調用都變強,說明 DeepSeek 已經在鋪設 下一代 AI 工作流。 -
價格與開源的平衡術
一邊漲價,一邊開源,本質是 降成本、擴生態 的兩手抓。
🎯 總結
DeepSeek-V3.1 不是一鳴驚人的“天花板式”大模型,但它足夠 實用且前瞻:
? 效率更高,省錢省時
? Agent 能力更強,場景更廣
? 開源透明,生態友好
在 AI Agent 的賽道上,DeepSeek 已經穩穩邁出第一步。
🦉 貓頭虎觀點:
別糾結 R2 了,V3.1 已經在布一盤更大的棋。