DeepSeek從入門到精通：全面掌握AI大模型的核心能力

文章目錄

一、DeepSeek是什么？
- 性能對齊OpenAI-o1正式版
二、Deepseek可以做什么？
- 能力圖譜
- 文本生成
- 自然語言理解與分析
- 編程與代碼相關
- 常規繪圖
三、如何使用DeepSeek？
四、DeepSeek從入門到精通
- 推理模型
- - 推理大模型
  - 非推理大模型
- 快思慢想：效能兼顧全局視野
- 提示語策略差異
- - 推理模型
  - 通用模型
- 關鍵原則
- - 模型選擇
  - 提示語設計
  - 避免誤區
- 從“下達指令”到“表達需求”
- 任務需求與提示語策略
- 如何向AI表達需求
五、提示語（Prompt）
- 提示語示例
- 提示語類型
- - 提示語的本質
  - 提示語的類型
六、總結

引用
清華大學新聞與傳播學院新媒體研究中心, 宇宙文化實驗室. (2025). DeepSeek從入門到精通. 余夢瓏（博士后主筆）. 北京: 清華大學.

一、DeepSeek是什么？

DeepSeek是中國一家專注通用人工智能（AGI）研發的科技公司，基于自主研發的大模型核心技術，提供智能對話助手（如深度求索）、開放平臺API接口及企業級解決方案，涵蓋智能客服、數據分析、內容生成等場景應用。

性能對齊OpenAI-o1正式版

DeepSeek-R1在后訓練階段大規模使用了強化學習技術，在僅有極少標注數據的情況下，極大提升了模型推理能力在數學、代碼、自然語言推理等任務上，性能比肩OpenAI o1正式版。
性能對齊OpenAi-o1正式版

二、Deepseek可以做什么？

DeepSeek直接面向用戶或者支持開發者，提供智能對話、文本生成、語義理解、計算推理、代碼生成補全等應用場景，支持聯網搜索與深度思考模式，同時支持文件上傳，能夠掃描讀取各類文件及圖片中的文字內容。

能力圖譜

文本生成

文本創作

文章/故事/詩歌寫作
營銷文案、廣告語生成
社交媒體內容（如推文、帖子）劇本或對話設計

摘要與改寫

長文本摘要（論文、報告）
文本簡化（降低復雜度）
多語言翻譯與本地化

結構化生成

表格、列表生成（如日程安排、菜譜）
代碼注釋、文檔撰寫

自然語言理解與分析

語義分析

語義解析
情感分析（評論、反饋）
意圖識別（客服對話、用戶查詢）
實體提取（人名、地點、事件）

知識推理

知識推理
邏輯問題解答（數學、常識推理）
因果分析（事件關聯性）

文本分類

文本分類
主題標簽生成（如新聞分類）
垃圾內容檢測

編程與代碼相關

代碼生成

根據需求生成代碼片段（Python、JavaScript）
自動補全與注釋生成

代碼調試

錯誤分析與修復建議
代碼性能優化提示

技術文檔處理

API文檔生成
代碼庫解釋與示例生成

常規繪圖

SVG矢量圖
基礎圖形/圖標/簡單插圖/流程圖/組織架構圖
Mermaid圖表
流程圖/時序圖/類圖/狀態圖/實體關系圖/思維導圖
React圖表
折線圖/柱狀圖/餅圖/散點圖/雷達圖/組合圖表

三、如何使用DeepSeek？

官網：DeepSeek官網
如何使用DeepSeek

四、DeepSeek從入門到精通

推理模型

推理大模型

推理大模型是指能夠在傳統的大語言模型基礎上，強化推理、邏輯分析和決策能力的模型。它們通常具備額外的技術，比如強化學習、神經符號推理、元學習等，來增強其推理和問題解決能力。
例如：DeepSeek-R1，GPT-o3在邏輯推理、數學推理和實時問題解決方面表現突出。

非推理大模型

適用于大多數任務，非推理大模型一般側重于語言生成、上下文理解和自然語言處理，而不強調深度推理能力。此類模型通常通過對大量文本數據的訓練，掌握語言規律并能夠生成合適的內容，但缺乏像推理模型那樣復雜的推理和決策能力。
例如：GPT-3、GPT-4（OpenAI），BERT（Google），主要用于語言生成、語言理解、文本分類、翻譯等任務。

維度	推理模型	通用模型
優勢領域	數學推導、邏輯分析、代碼生成、復雜問題拆解	文本生成、創意寫作、多輪對話、開放性問答
劣勢領域	發散性任務（如詩歌創作）	需要嚴格邏輯鏈的任務（如數學證明）
性能本質	專精于邏輯密度高的任務	擅長多樣性高的任務
強弱判斷	并非全面更強，僅在其訓練目標領域顯著優于通用模型	通用場景更靈活，但專項任務需依賴提示語補償能力

快思慢想：效能兼顧全局視野

1	概率預測（快速反應模型，如 ChatGPT 4o）	鏈式推理（慢速思考模型，如 OpenAI o1）
性能表現	響應速度快，算力成本低	慢速思考，算力成本高
運算原理	基于概率預測，通過大量數據訓練來快速預測可能的答案	基于鏈式思維（Chain - of - Thought），逐步推理問題的每個步驟來得到答案
決策能力	依賴預設算法和規則進行決策	能夠自主分析情況，實時做出決策
創造力	限于模式識別和優化，缺乏真正的創新能力	能夠生成新的創意和解決方案，具備創新能力
人機互動能力	按照預設腳本響應，較難理解人類情感和意圖	更自然地與人互動，理解復雜情感和意圖
問題解決能力	擅長解決結構化和定義明確的問題	能夠處理多維度和非結構化問題，提供創造性的解決方案
倫理問題	作為受控工具，幾乎沒有倫理問題	引發自主性和控制問題的倫理討論

CoT鏈式思維的出現將大模型分為了兩類：“概率預測（快速反應）”模型和“鏈式推理（慢速思考）”模型。前者適合快速反饋，處理即時任務；后者通過推理解決復雜問題。了解它們的差異有助于根據任務需求選擇合適的模型，實現最佳效果。

提示語策略差異

推理模型

提示語更簡潔，只需明確任務目標和需求（因其已內化推理邏輯）。
無需逐步指導，模型自動生成結構化推理過程（若強行拆解步驟，反而可能限制其能力）。

通用模型

需顯式引導推理步驟（如通過CoT提示），否則可能跳過關鍵邏輯。
依賴提示語補償能力短板（如要求分步思考、提供示例）。

關鍵原則

模型選擇

優先根據任務類型而非模型熱度選擇（如數學任務選推理模型，創意任務選通用模型）。

提示語設計

推理模型：簡潔指令，聚焦目標，信任其內化能力。（“要什么直接說”）。
通用模型：結構化、補償性引導（“缺什么補什么”）。

避免誤區

不要對推理模型使用“啟發式”提示（如角色扮演），可能干擾其邏輯主線。
不要對通用模型“過度信任”（如直接詢問復雜推理問題，需分步驗證結果）。

從“下達指令”到“表達需求”

策略類型	定義與目標	適用場景	示例（推理模型適用）	優勢與風險
指令驅動	直接給出明確步驟、格式要求	簡單任務、需快速執行	“用 Python 編寫快速排序函數，輸出需包含注釋。”	結果精準高效；限制模型自主優化空間
需求導向	描述問題背景與目標，由模型規劃解決路徑	復雜問題、需模型自主推理	我需要優化用戶登錄流程，請分析當前瓶頸并提出 3 種方案。”	激發模型深層推理；需清晰定義需求邊界
混合模式	結合需求描述與關鍵約束條件	平衡靈活性與可控性	“設計一個杭州三日游計劃，要求包含西湖和靈隱寺，且預算控制在 2000 元內。”	兼顧目標與細節；需避免過度約束
啟發式提問	通過提問引導模型主動思考（如 “為什么”“如何”）	探索性問題、需模型解釋邏輯	“為什么選擇梯度下降法解決此優化問題？請對比其他算法。”	觸發模型自解釋能力；可能偏離核心目標

任務需求與提示語策略

任務類型	通用模型	提示語句重點	示例（有效提示）	需避免的提示策略
數學證明	推理模型	直接提問，無需分步引導	“證明勾股定理”	冗余拆解（如“先畫圖，再列公式”）
	通用模型	顯式要求分步思考，提供示例	“請分三步推導勾股定理，參考：1. 畫直角三角形…”	直接提問（易跳過關鍵步驟）
創意寫作	推理模型	鼓勵發散性，設定角色/風格	“以海明威的風格寫一個冒險故事”	過度約束邏輯（如“按時間順序列出”）
	通用模型	需明確約束目標，避免自由發揮	“寫一個包含‘量子’和‘沙漠’的短篇小說，不超過200字”	開放式指令（如“自由創作”）
代碼生成	推理模型	簡潔需求，信任模型邏輯	“用Python實現快速排序”	分步指導（如“先寫遞歸函數”）
	通用模型	細化步驟，明確輸入輸出格式	“先解釋快速排序原理，再寫出代碼并測試示例”	模糊需求（如“寫個排序代碼”）
多輪對話	通用模型	自然交互，無需結構化指令	“你覺得人工智能的未來會怎樣？”	強制邏輯鏈條（如“分三點回答”）
	推理模型	需明確對話目標，避免開放發散	“從技術、倫理、經濟三方面分析AI的未來”	情感化提問（如“你害怕AI嗎？”）
邏輯分析	推理模型	直接抽出復雜問題	“分析‘電車難題’中的功利主義與道德主義沖突”	添加主觀引導（如“你認為哪種對？”）
	通用模型	需拆分問題，逐步追問	“先解釋電車難題的定義，再對比兩種倫理觀的差異”	一次性提問復雜度提

如何向AI表達需求

需求類型	特點	需求表達公式	推理模型適配策略	通用模型適配策略
決策需求	需權衡選項、評估風險、選擇最優解	目標+選項+評估標準	要求邏輯推演和量化分析	直接建議，依賴模型經驗歸納
分析需求	需深度理解數據/信息、發現模式或因果關系	問題+數據/信息+分析方法	觸發因果鏈推導與假設驗證	表層總結或分類
創造性需求	需生成新穎內容（文本/設計方案）	主題+風格/約束+創新方向	結合邏輯框架生成結構化創意	自由發散，依賴示例引導
驗證需求	需檢查邏輯自洽性、數據可靠性或方案可行性	結論方案+驗證方法+風險點	自主設計驗證路徑并排查矛盾	簡單確認，缺乏深度推演
執行需求	需完成具體操作（代碼/計算/流程）	任務+步驟約束+輸出格式	自主優化步驟，兼顧效率與正確性	嚴格按指令執行，無自主優化

五、提示語（Prompt）

提示語示例

提示語（Prompt）是用戶輸入給AI系統的指令或信息，用于引導AI生成特定的輸出或執行特定的任務。簡單來說，提示語就是我們與AI“對話”時所使用的語言，它可以是一個簡單的問題，一段詳細的指令，也可以是一個復雜的任務描述。

提示語的基本結構包括指令、上下文和期望

指令（Instruction)： 這是提示語的核心，明確告訴AI你希望它執行什么任務。
上下文（Context)： 為AI提供背景信息，幫助它更準確地理解和執行任務。
期望（Expectation)： 明確或隱含地表達你對AI輸出的要求和預期。

提示語
提示語組成部分

需求類型	實戰技巧示例
決策需求	* 為降低物流成本，現有兩種方案： ①自建區域倉庫（初期投入高，長期成本低） ②與第三方合作（按需付費，靈活性高）請根據ROI計算模型，對比5年內的總成本并推薦最優解。
分析需求	* 分析近三年新能源汽車銷量數據（附CSV），說明： ①增長趨勢與政策關聯性； ②預測2025年市占率，需使用ARIMA模型并解釋參數選擇依據。
創造性需求	* 設計一款智能家居產品，要求： ①解決獨居老人安全問題； ②結合傳感器網絡和AI預警； ③提供三種不同技術路線的原型草圖說明。
驗證性需求	* 以下是某論文結論：“神經網絡模型A優于傳統方法B”，請驗證： ①實驗數據是否支持該結論； ②檢查對照組設置是否存在偏差； ③重新計算p值并判斷顯著性。
執行需求	* 將以下C語言代碼轉換為Python，要求： ①保持時間復雜度不變； ②使用numpy優化數組操作； ③輸出單元測試案例的完整代碼。

提示語類型

提示語的本質

特征	描述	示例
溝通橋梁	連接人類意圖和AI理解	“將以下內容翻譯為法語：Hello, world”
上下文提供者	為AI提供必要的背景信息	“假設你是一位10世紀的歷史學家，評論拿破侖的崛起”
任務定義器	明確指定AI需要完成的任務	“為一篇關于氣候變化的文章寫一個引言，長度200字”
輸出塑造器	影響AI輸出的形式和內容	“用簡單的語言解釋量子力學，假設你在跟一個10歲的孩子說話”
AI能力引導器	引導AI使用特定的能力或技能	“使用你的創意寫作能力，創作一個關于時間旅行的短篇故事”

提示語的類型

指令型提示語
直接告訴AI需要執行的任務。
示例： “生成一張2023年全球碳排放量的柱狀圖”。
問答型提示語
向AI提出問題，期望得到相應的答案。
示例： “量子糾纏的基本原理是什么？”。
角色扮演型提示語
要求AI扮演特定角色，模擬特定場景。
示例： “假設你是莎士比亞，寫一首關于人工智能的十四行詩”。
創意型提示語
引導AI進行創意寫作或內容生成。
示例： “創作一個未來城市中人與機器人共存的科幻故事”。
分析型提示語
要求AI對給定信息進行分析和推理。
示例： “根據過去十年的股票數據，預測明年科技股的走勢”。
多模態提示語
結合文本、圖像等多種形式的輸入。
示例： “為這張風景照片（附鏈接）配一首五言絕句”。

六、總結

DeepSeek是中國一家專注于通用人工智能（AGI）研發的科技公司，其核心產品基于自主研發的大模型技術（如推理模型DeepSeek-R1和通用模型），在數學推理、代碼生成、邏輯分析等復雜任務上性能比肩OpenAI頂級模型。公司提供智能對話助手、API接口及企業級解決方案，覆蓋文本生成（創意寫作、摘要翻譯）、自然語言理解（語義分析、知識推理）、編程輔助（代碼生成與調試）、多模態繪圖（SVG、Mermaid圖表）等多樣化場景，并支持文件解析與聯網搜索。用戶可通過官網快速接入，其核心使用策略強調“任務導向型提示語設計”：推理模型需簡潔指令以釋放內化邏輯能力，通用模型依賴結構化引導（如分步示例）；同時，文檔系統梳理了從需求分類（決策、分析、創造、驗證、執行）到提示語類型（指令型、角色扮演、多模態等）的適配方法，助力用戶高效利用AI能力，規避過度約束或模糊指令的常見誤區，實現從基礎操作到復雜問題解決的全面覆蓋。