文章目錄
- 一、DeepSeek是什么?
- 性能對齊OpenAI-o1正式版
- 二、Deepseek可以做什么?
- 能力圖譜
- 文本生成
- 自然語言理解與分析
- 編程與代碼相關
- 常規繪圖
- 三、如何使用DeepSeek?
- 四、DeepSeek從入門到精通
- 推理模型
- 推理大模型
- 非推理大模型
- 快思慢想:效能兼顧 全局視野
- 提示語策略差異
- 推理模型
- 通用模型
- 關鍵原則
- 模型選擇
- 提示語設計
- 避免誤區
- 從“下達指令”到“表達需求”
- 任務需求與提示語策略
- 如何向AI表達需求
- 五、提示語(Prompt)
- 提示語示例
- 提示語類型
- 提示語的本質
- 提示語的類型
- 六、總結
引用
清華大學新聞與傳播學院新媒體研究中心, 宇宙文化實驗室. (2025). DeepSeek從入門到精通. 余夢瓏(博士后主筆). 北京: 清華大學.
一、DeepSeek是什么?
DeepSeek是中國一家專注通用人工智能(AGI)研發的科技公司,基于自主研發的大模型核心技術,提供智能對話助手(如深度求索)、開放平臺API接口及企業級解決方案,涵蓋智能客服、數據分析、內容生成等場景應用。
性能對齊OpenAI-o1正式版
DeepSeek-R1在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。
二、Deepseek可以做什么?
DeepSeek直接面向用戶或者支持開發者,提供智能對話、文本生成、語義理解、計算推理、代碼生成補全等應用場景,支持聯網搜索與深度思考模式,同時支持文件上傳,能夠掃描讀取各類文件及圖片中的文字內容。
能力圖譜
文本生成
文本創作
- 文章/故事/詩歌寫作
- 營銷文案、廣告語生成
- 社交媒體內容(如推文、帖子)劇本或對話設計
摘要與改寫
- 長文本摘要(論文、報告)
- 文本簡化(降低復雜度)
- 多語言翻譯與本地化
結構化生成
- 表格、列表生成(如日程安排、菜譜)
- 代碼注釋、文檔撰寫
自然語言理解與分析
語義分析
- 語義解析
- 情感分析(評論、反饋)
- 意圖識別(客服對話、用戶查詢)
- 實體提取(人名、地點、事件)
知識推理
- 知識推理
- 邏輯問題解答(數學、常識推理)
- 因果分析(事件關聯性)
文本分類
- 文本分類
- 主題標簽生成(如新聞分類)
- 垃圾內容檢測
編程與代碼相關
代碼生成
- 根據需求生成代碼片段(Python、JavaScript)
- 自動補全與注釋生成
代碼調試
- 錯誤分析與修復建議
- 代碼性能優化提示
技術文檔處理
- API文檔生成
- 代碼庫解釋與示例生成
常規繪圖
SVG矢量圖
基礎圖形/圖標/簡單插圖/流程圖/組織架構圖
Mermaid圖表
流程圖/時序圖/類圖/狀態圖/實體關系圖/思維導圖
React圖表
折線圖/柱狀圖/餅圖/散點圖/雷達圖/組合圖表
三、如何使用DeepSeek?
官網:DeepSeek官網
四、DeepSeek從入門到精通
推理模型
推理大模型
推理大模型是指能夠在傳統的大語言模型基礎上,強化推理、邏輯分析和決策能力的模型。它們通常具備額外的技術,比如強化學習、神經符號推理、元學習等,來增強其推理和問題解決能力。
例如:DeepSeek-R1,GPT-o3在邏輯推理、數學推理和實時問題解決方面表現突出。
非推理大模型
適用于大多數任務,非推理大模型一般側重于語言生成、上下文理解和自然語言處理,而不強調深度推理能力。此類模型通常通過對大量文本數據的訓練,掌握語言規律并能夠生成合適的內容,但缺乏像推理模型那樣復雜的推理和決策能力。
例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于語言生成、語言理解、文本分類、翻譯等任務。
維度 | 推理模型 | 通用模型 |
---|---|---|
優勢領域 | 數學推導、邏輯分析、代碼生成、復雜問題拆解 | 文本生成、創意寫作、多輪對話、開放性問答 |
劣勢領域 | 發散性任務(如詩歌創作) | 需要嚴格邏輯鏈的任務(如數學證明) |
性能本質 | 專精于邏輯密度高的任務 | 擅長多樣性高的任務 |
強弱判斷 | 并非全面更強,僅在其訓練目標領域顯著優于通用模型 | 通用場景更靈活,但專項任務需依賴提示語補償能力 |
快思慢想:效能兼顧 全局視野
1 | 概率預測(快速反應模型,如 ChatGPT 4o) | 鏈式推理(慢速思考模型,如 OpenAI o1) |
---|---|---|
性能表現 | 響應速度快,算力成本低 | 慢速思考,算力成本高 |
運算原理 | 基于概率預測,通過大量數據訓練來快速預測可能的答案 | 基于鏈式思維(Chain - of - Thought),逐步推理問題的每個步驟來得到答案 |
決策能力 | 依賴預設算法和規則進行決策 | 能夠自主分析情況,實時做出決策 |
創造力 | 限于模式識別和優化,缺乏真正的創新能力 | 能夠生成新的創意和解決方案,具備創新能力 |
人機互動能力 | 按照預設腳本響應,較難理解人類情感和意圖 | 更自然地與人互動,理解復雜情感和意圖 |
問題解決能力 | 擅長解決結構化和定義明確的問題 | 能夠處理多維度和非結構化問題,提供創造性的解決方案 |
倫理問題 | 作為受控工具,幾乎沒有倫理問題 | 引發自主性和控制問題的倫理討論 |
CoT鏈式思維的出現將大模型分為了兩類:“概率預測(快速反應)”模型和“鏈式推理(慢速思考)”模型。前者適合快速反饋,處理即時任務;后者通過推理解決復雜問題。了解它們的差異有助于根據任務需求選擇合適的模型,實現最佳效果。
提示語策略差異
推理模型
- 提示語更簡潔,只需明確任務目標和需求(因其已內化推理邏輯)。
- 無需逐步指導,模型自動生成結構化推理過程(若強行拆解步驟,反而可能限制其能力)。
通用模型
- 需顯式引導推理步驟(如通過CoT提示),否則可能跳過關鍵邏輯。
- 依賴提示語補償能力短板(如要求分步思考、提供示例)。
關鍵原則
模型選擇
優先根據任務類型而非模型熱度選擇(如數學任務選推理模型,創意任務選通用模型)。
提示語設計
推理模型:簡潔指令,聚焦目標,信任其內化能力。(“要什么直接說”)。
通用模型:結構化、補償性引導(“缺什么補什么”)。
避免誤區
不要對推理模型使用“啟發式”提示(如角色扮演),可能干擾其邏輯主線。
不要對通用模型“過度信任”(如直接詢問復雜推理問題,需分步驗證結果)。
從“下達指令”到“表達需求”
策略類型 | 定義與目標 | 適用場景 | 示例(推理模型適用) | 優勢與風險 |
---|---|---|---|---|
指令驅動 | 直接給出明確步驟、格式要求 | 簡單任務、需快速執行 | “用 Python 編寫快速排序函數,輸出需包含注釋。” | 結果精準高效;限制模型自主優化空間 |
需求導向 | 描述問題背景與目標,由模型規劃解決路徑 | 復雜問題、需模型自主推理 | 我需要優化用戶登錄流程,請分析當前瓶頸并提出 3 種方案。” | 激發模型深層推理;需清晰定義需求邊界 |
混合模式 | 結合需求描述與關鍵約束條件 | 平衡靈活性與可控性 | “設計一個杭州三日游計劃,要求包含西湖和靈隱寺,且預算控制在 2000 元內。” | 兼顧目標與細節;需避免過度約束 |
啟發式提問 | 通過提問引導模型主動思考(如 “為什么”“如何”) | 探索性問題、需模型解釋邏輯 | “為什么選擇梯度下降法解決此優化問題?請對比其他算法。” | 觸發模型自解釋能力;可能偏離核心目標 |
任務需求與提示語策略
任務類型 | 通用模型 | 提示語句重點 | 示例(有效提示) | 需避免的提示策略 |
---|---|---|---|---|
數學證明 | 推理模型 | 直接提問,無需分步引導 | “證明勾股定理” | 冗余拆解(如“先畫圖,再列公式”) |
通用模型 | 顯式要求分步思考,提供示例 | “請分三步推導勾股定理,參考:1. 畫直角三角形…” | 直接提問(易跳過關鍵步驟) | |
創意寫作 | 推理模型 | 鼓勵發散性,設定角色/風格 | “以海明威的風格寫一個冒險故事” | 過度約束邏輯(如“按時間順序列出”) |
通用模型 | 需明確約束目標,避免自由發揮 | “寫一個包含‘量子’和‘沙漠’的短篇小說,不超過200字” | 開放式指令(如“自由創作”) | |
代碼生成 | 推理模型 | 簡潔需求,信任模型邏輯 | “用Python實現快速排序” | 分步指導(如“先寫遞歸函數”) |
通用模型 | 細化步驟,明確輸入輸出格式 | “先解釋快速排序原理,再寫出代碼并測試示例” | 模糊需求(如“寫個排序代碼”) | |
多輪對話 | 通用模型 | 自然交互,無需結構化指令 | “你覺得人工智能的未來會怎樣?” | 強制邏輯鏈條(如“分三點回答”) |
推理模型 | 需明確對話目標,避免開放發散 | “從技術、倫理、經濟三方面分析AI的未來” | 情感化提問(如“你害怕AI嗎?”) | |
邏輯分析 | 推理模型 | 直接抽出復雜問題 | “分析‘電車難題’中的功利主義與道德主義沖突” | 添加主觀引導(如“你認為哪種對?”) |
通用模型 | 需拆分問題,逐步追問 | “先解釋電車難題的定義,再對比兩種倫理觀的差異” | 一次性提問復雜度提 |
如何向AI表達需求
需求類型 | 特點 | 需求表達公式 | 推理模型適配策略 | 通用模型適配策略 |
---|---|---|---|---|
決策需求 | 需權衡選項、評估風險、選擇最優解 | 目標+選項+評估標準 | 要求邏輯推演和量化分析 | 直接建議,依賴模型經驗歸納 |
分析需求 | 需深度理解數據/信息、發現模式或因果關系 | 問題+數據/信息+分析方法 | 觸發因果鏈推導與假設驗證 | 表層總結或分類 |
創造性需求 | 需生成新穎內容(文本/設計方案) | 主題+風格/約束+創新方向 | 結合邏輯框架生成結構化創意 | 自由發散,依賴示例引導 |
驗證需求 | 需檢查邏輯自洽性、數據可靠性或方案可行性 | 結論方案+驗證方法+風險點 | 自主設計驗證路徑并排查矛盾 | 簡單確認,缺乏深度推演 |
執行需求 | 需完成具體操作(代碼/計算/流程) | 任務+步驟約束+輸出格式 | 自主優化步驟,兼顧效率與正確性 | 嚴格按指令執行,無自主優化 |
五、提示語(Prompt)
提示語示例
提示語(Prompt)是用戶輸入給AI系統的指令或信息,用于引導AI生成特定的輸出或執行特定的任務。簡單來說,提示語就是我們與AI“對話”時所使用的語言,它可以是一個簡單的問題,一段詳細的指令,也可以是一個復雜的任務描述。
提示語的基本結構包括指令、上下文和期望
- 指令(Instruction): 這是提示語的核心,明確告訴AI你希望它執行什么任務。
- 上下文(Context): 為AI提供背景信息,幫助它更準確地理解和執行任務。
- 期望(Expectation): 明確或隱含地表達你對AI輸出的要求和預期。
需求類型 | 實戰技巧示例 |
---|---|
決策需求 | * 為降低物流成本,現有兩種方案: ①自建區域倉庫(初期投入高,長期成本低) ②與第三方合作(按需付費,靈活性高) 請根據ROI計算模型,對比5年內的總成本并推薦最優解。 |
分析需求 | * 分析近三年新能源汽車銷量數據(附CSV),說明: ①增長趨勢與政策關聯性; ②預測2025年市占率,需使用ARIMA模型并解釋參數選擇依據。 |
創造性需求 | * 設計一款智能家居產品,要求: ①解決獨居老人安全問題; ②結合傳感器網絡和AI預警; ③提供三種不同技術路線的原型草圖說明。 |
驗證性需求 | * 以下是某論文結論:“神經網絡模型A優于傳統方法B”,請驗證: ①實驗數據是否支持該結論; ②檢查對照組設置是否存在偏差; ③重新計算p值并判斷顯著性。 |
執行需求 | * 將以下C語言代碼轉換為Python,要求: ①保持時間復雜度不變; ②使用numpy優化數組操作; ③輸出單元測試案例的完整代碼。 |
提示語類型
提示語的本質
特征 | 描述 | 示例 |
---|---|---|
溝通橋梁 | 連接人類意圖和AI理解 | “將以下內容翻譯為法語:Hello, world” |
上下文提供者 | 為AI提供必要的背景信息 | “假設你是一位10世紀的歷史學家,評論拿破侖的崛起” |
任務定義器 | 明確指定AI需要完成的任務 | “為一篇關于氣候變化的文章寫一個引言,長度200字” |
輸出塑造器 | 影響AI輸出的形式和內容 | “用簡單的語言解釋量子力學,假設你在跟一個10歲的孩子說話” |
AI能力引導器 | 引導AI使用特定的能力或技能 | “使用你的創意寫作能力,創作一個關于時間旅行的短篇故事” |
提示語的類型
-
指令型提示語
直接告訴AI需要執行的任務。
示例: “生成一張2023年全球碳排放量的柱狀圖”。 -
問答型提示語
向AI提出問題,期望得到相應的答案。
示例: “量子糾纏的基本原理是什么?”。 -
角色扮演型提示語
要求AI扮演特定角色,模擬特定場景。
示例: “假設你是莎士比亞,寫一首關于人工智能的十四行詩”。 -
創意型提示語
引導AI進行創意寫作或內容生成。
示例: “創作一個未來城市中人與機器人共存的科幻故事”。 -
分析型提示語
要求AI對給定信息進行分析和推理。
示例: “根據過去十年的股票數據,預測明年科技股的走勢”。 -
多模態提示語
結合文本、圖像等多種形式的輸入。
示例: “為這張風景照片(附鏈接)配一首五言絕句”。
六、總結
DeepSeek是中國一家專注于通用人工智能(AGI)研發的科技公司,其核心產品基于自主研發的大模型技術(如推理模型DeepSeek-R1和通用模型),在數學推理、代碼生成、邏輯分析等復雜任務上性能比肩OpenAI頂級模型。公司提供智能對話助手、API接口及企業級解決方案,覆蓋文本生成(創意寫作、摘要翻譯)、自然語言理解(語義分析、知識推理)、編程輔助(代碼生成與調試)、多模態繪圖(SVG、Mermaid圖表)等多樣化場景,并支持文件解析與聯網搜索。用戶可通過官網快速接入,其核心使用策略強調“任務導向型提示語設計”:推理模型需簡潔指令以釋放內化邏輯能力,通用模型依賴結構化引導(如分步示例);同時,文檔系統梳理了從需求分類(決策、分析、創造、驗證、執行)到提示語類型(指令型、角色扮演、多模態等)的適配方法,助力用戶高效利用AI能力,規避過度約束或模糊指令的常見誤區,實現從基礎操作到復雜問題解決的全面覆蓋。