DeepSeek-Reasoner推理模型示例

《DEEPSEEK原生應用與智能體開發實踐 王曉華 書籍 圖書》【摘要 書評 試讀】- 京東圖書

在之前講解的示例中(指這個示例:通過Prompt提示構建思維鏈-CSDN博客),無論是進行日常對話還是調用特定工具,我們所依賴的底層技術均是DeepSeek普通對話模型。這一模型以其高效和穩定的性能,為我們的交流提供了堅實的基礎。然而,技術的探索永無止境,DeepSeek團隊在此基礎上更進一步,推出了一種創新的輸出方案—— DeepSeek-Reasoner推理模型,為我們與大模型的對話體驗增添了新的維度。

DeepSeek-Reasoner,作為DeepSeek家族中的新成員,是一款專為復雜推理任務設計的模型。它不僅僅滿足于給出一個直接的答案,而是在生成最終回答之前,會精心構建一段詳盡的思維鏈內容。這段思維鏈,就像是模型在解題過程中的“草稿紙”,記錄了它從問題出發,逐步分析、推理,直至得出結論的全過程。通過這種方式,DeepSeek-Reasoner顯著提升了最終答案的準確性和可信度,讓用戶不僅知其然,更知其所以然。

為了增強透明度和互動性,DeepSeek API特別向用戶開放了DeepSeek-Reasoner的思維鏈內容。這意味著,用戶不僅可以獲得最終的回答,還能深入查看模型是如何一步步得出這個結論的。這一特性對于教育、研究以及需要高度解釋性的應用場景來說,無疑是一大福音。用戶可以根據需要,選擇查看、展示甚至進一步蒸餾這些思維鏈內容,以更好地理解和利用模型的推理過程。具有思維鏈的多輪對話如圖4-3所示。

圖4-3? 具有思維鏈的多輪對話

在具體的應用場景中,當我們使用DeepSeek-Reasoner進行每一輪對話時,模型都會輸出兩部分內容:一部分是思維鏈內容(reasoning_content),它詳細記錄了模型的推理步驟;另一部分是最終回答(content),即模型基于思維鏈得出的結論。值得注意的是,為了保持對話的連貫性和簡潔性,在下一輪對話中,之前輪次輸出的思維鏈內容并不會被直接拼接到上下文中。這樣的設計既保證了每輪對話的獨立性,又避免了信息冗余,使得對話更加高效和流暢。

下面我們演示一下如何使用DeepSeek推理模型訪問思維鏈和最終回答,以及如何在多輪對話中進行上下文拼接的方法,代碼如下所示:

from openai import OpenAI
client = OpenAI(api_key="sk-dfd742ec38dc4ede96977974085485b0", base_url="https://api.deepseek.com")# Round 1
messages = [{"role": "user", "content": "9.11 與 9.8, 哪個數字比較大?"}]
response = client.chat.completions.create(model="deepseek-reasoner",messages=messages
)reasoning_content = response.choices[0].message.reasoning_content
content = response.choices[0].message.content
print("Answer 1:",content)# Round 2
messages.append({'role': 'assistant', 'content': content})
messages.append({'role': 'user', 'content': "一斤的鐵和一斤的棉花哪個重?"})
response = client.chat.completions.create(model="deepseek-reasoner",messages=messages
)
content = response.choices[0].message.content
print("Answer 2:",content)

這個示例首先比較一個經典的數學題,之后又使用一個腦筋急轉彎問題考察推理模型的思考能力,結果如下:

Answer 1: 在數值比較中,9.8 比 9.11 大。具體分析如下:1. **整數部分相同**:兩數的整數部分均為 9,因此需比較小數部分。
2. **小數部分比較**:- 9.8的小數部分為 **0.8**(等價于 0.80)。- 9.11的小數部分為 **0.11**。- 由于 **0.80 > 0.11**,因此 **9.8 > 9.11**。**結論**:9.8 更大。  
(若比較版本號,則 9.11 可能代表更高版本,但按數值計算時 9.8 更大。)Answer 2: **答案:兩者重量相同,都是一斤。**
1. **單位明確**:  在標準單位下,1斤(市斤)= 500克。無論是鐵還是棉花,若均為“一斤”,則其質量均為500克,重量相等。2. **常見誤解解析**:  鐵密度大、體積小,棉花密度小、體積大,容易讓人誤以為“棉花更輕”。但**重量與體積無關**,僅取決于質量。因此,**一斤鐵 = 一斤棉花**。3. **擴展思考(若考慮復雜因素)**:  - **空氣浮力**:體積大的棉花受空氣浮力影響略多,實際稱重可能極輕微減少,但日常可忽略。  - **單位差異**:若使用非標準“斤”(如臺斤600克),需確認單位,但通常按市斤計算。**結論**:嚴格按照質量單位比較,兩者一樣重。

從上面結果可以看到,相對于原有的輸出,在問題的解答上推理模型使用了更多的推理過程與解答,并且對結果進行更細密的分析,從而獲得對邏輯和推理步驟進行說明的結果。有興趣的讀者可以自行嘗試更多的內容。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/88445.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/88445.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/88445.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

常說的電源芯片到底指什么?

電源芯片是電子系統中用于管理、轉換和分配電能的集成電路,根據功能和應用場景的不同,主要分為以下幾類: 一、線性穩壓器(LDO, Low Dropout Regulator) LDO內部的基本電路情況如下: LDO內部主要分為四大部…

【大模型學習】項目練習:套殼DeepSeek

這里是阿川的博客,祝您變得更強 ? 個人主頁:在線OJ的阿川 💖文章專欄:AI入門到進階 🌏代碼倉庫: 寫在開頭 現在您看到的是我的結論或想法,但在這背后凝結了大量的思考、經驗和討論 &#x1f4…

筆記03:布線-過孔的調用與添加

布線-過孔的調用與添加 (1)在進行PCB設計時,都必須使用到過孔,對走線進行換層處理。在走線進行打過孔之前,必須先要添加過孔,這樣在PCB布線時才可以使用過孔。 (2)需要使用pad des…

在vscode中,Python程序的內置對象、關鍵字、自定義函數名/類名、字符串進行著色,說明分別是什么顏色?

在 VS Code 中,Python 代碼的著色完全取決于你當前使用的主題。不同主題(如 Dark, Monokai, Solarized Dark, Light, Quiet Light 等)對不同類型的代碼元素會使用不同的顏色。 一、Default Dark(默認的深色主題) impo…

Visual Studio 中使用 AddressSanitizer 指南

Visual Studio 中使用 AddressSanitizer 指南 基于 Microsoft Visual Studio 2022,支持 MSVC 和 Clang 編譯器鏈,本文詳細說明如何在 VS 中配置和使用 AddressSanitizer,用于檢測內存誤用,如消息釋放后訪問、超界讀寫等類型錯誤。…

Flink Sink函數深度解析:從原理到實踐的全流程探索

在Flink的數據流處理體系中,Sink函數作為數據處理的最終出口,肩負著將處理后的數據寫入外部存儲引擎的關鍵使命。它如同數據旅程的終點站,決定著數據的最終歸宿與應用價值。深入理解Sink函數的工作原理、核心概念及實現方式,對構建…

Codex+ 自建中轉 API 部署教程(Windows 版)

📌 一、前置環境準備 安裝 Node.js 和 Codex CLI: npm install -g openai/codex準備 OpenAI API Key 確保你已有的中轉接口兼容 OpenAI 格式, 📌 二、設置 PowerShell 環境變量 # 設置你的 API Key(使用哪家的看你的…

Centos 7離線部署Nginx 高效省時

給腳本執行權限:chmod x install_nginx.sh以root用戶運行:sudo ./install_nginx.sh 腳本如下: #!/bin/bash # Nginx一鍵化部署腳本(修復版本開機自啟) # 需要以root權限運行set -e # 任何命令失敗時立即退出腳本# 定…

P7915 [CSP-S 2021] 回文

題目描述 給定正整數 n n n 和整數序列 a 1 , a 2 , … , a 2 n a_1, a_2, \ldots, a_{2 n} a1?,a2?,…,a2n?,在這 2 n 2 n 2n 個數中, 1 , 2 , … , n 1, 2, \ldots, n 1,2,…,n 分別各出現恰好 2 2 2 次。現在進行 2 n 2 n 2n 次操作&#xf…

小智AI -- ESP32-S3 DIY面包板WIFI-LCD彩屏

DIY 所需硬件 開發板:ESP32-S3-DevKitC-1(選擇 WROOM N16R8 模組) Goouuu ESP32-S3-N16R8開發板數字麥克風:INMP441 INMP441全向麥克風模塊功放:MAX98357A MAX98357 I2S 音頻放大器模塊腔體喇叭:8Ω 2~3W 或…

家用網絡進行DNS優選

家用網絡進行DNS優選的好處主要體現在以下幾個方面: 提升網絡訪問速度: DNS優選通過選擇響應時間更快的DNS服務器,減少域名解析的延遲,從而加快網頁加載和應用訪問速度。尤其在訪問國內外網站時,選擇合適的DNS服務器可…

刷題 | 牛客 - js中等題-下 (更ing)45/54知識點解答

JS45 數組去重 描述 為 Array 對象添加一個去除重復項的方法 示例1 輸入: [false, true, undefined, null, NaN, 0, 1, {}, {}, a, a, NaN] 復制輸出: [false, true, undefined, null, NaN, 0, 1, {}, {}, a] Array.prototype.uniq function () …

vue3使用krpano1.22

官方文檔鏈接 https://krpano.com/docu/js/#top 例子 https://krpano.com/releases/1.22/viewer/examples/javascript-interface/js-api-examples.html https://krpano.com/viewsource.html?releases/1.22/viewer/examples/javascript-interface/js-api-examples.html 注…

2025年AI面試推薦榜單,數字化招聘轉型優選

一、AI面試為何成為2025招聘標配? 2025年企業對AI面試的需求從“效率工具”升級為“戰略級招聘伙伴”。數據顯示,超7成企業計劃年內全面引入AI面試,其中技術崗、全球化招聘及藍領用工場景需求增速顯著。以下以綜合技術實力、行業口碑及落地能…

人機協作新篇章:艾利特按摩機器人如何重塑健康生活

引言:按摩機器人的需求爆發 在快節奏的現代生活中,亞健康人群比例持續攀升。據《全球健康產業白皮書》顯示: 85%的都市人群存在肌肉勞損問題專業理療師供需缺口達1:3200精準按摩服務成本年均增長18% 這一背景下,按摩…

從代碼學習深度學習 - 情感分析:使用循環神經網絡 PyTorch版

文章目錄 前言1. 加載與預處理數據集數據讀取與詞元化構建詞匯表截斷、填充與數據迭代器2. 構建循環神經網絡模型雙向RNN模型(BiRNN)詳解權重初始化3. 加載預訓練詞向量構建詞向量加載器將預訓練向量注入模型4. 訓練與評估模型定義訓練函數可視化訓練過程5. 模型預測編寫預測…

化于無形的 lambda 語法

針對數據集合的每個成員進行計算是很常見的任務,用循環語句當然能實現,但比較麻煩,算個簡單的求和都要寫很多句代碼。 編程語言經常把這些運算封裝成函數,比如 Python 的 sum 函數,求訂單價格總和是這樣寫的&#xff…

day42

1. 回調函數:把一個函數當成“任務清單”交給另一個函數,等后者干完活,就按清單執行這個函數。比如點外賣后留電話,騎手送到了就打電話(執行回調)通知你。 2. lambda函數:臨時寫的超短函數&…

百度日志中臺前端重構實踐

日志中臺是百度內部針對打點數據的全生命周期管理平臺,作為公司日志數據的唯一入口,承擔以下核心職能:1.功能覆蓋:提供從數據采集、傳輸、存儲到查詢分析的一站式服務,支持產品運營分析、研發性能監控、運維管理等多元…

資訊安全 (Information Security)3大 “CIA“要素

資訊安全之3大要素,業界慣用"CIA"稱之,包括機密性 (Confidentiality)、完整性(Integrity)與可用性(Availability);更應增加諸如鑑別性、可歸責性、不可否認性與可靠性。 1.機密性 (Confidentiality) 機密性是指採用適當的安全機制…