DeepSeek從入門到精通:全面掌握AI大模型的核心能力

文章目錄

  • 一、DeepSeek是什么?
    • 性能對齊OpenAI-o1正式版
  • 二、Deepseek可以做什么?
    • 能力圖譜
    • 文本生成
    • 自然語言理解與分析
    • 編程與代碼相關
    • 常規繪圖
  • 三、如何使用DeepSeek?
  • 四、DeepSeek從入門到精通
    • 推理模型
      • 推理大模型
      • 非推理大模型
    • 快思慢想:效能兼顧 全局視野
    • 提示語策略差異
      • 推理模型
      • 通用模型
    • 關鍵原則
      • 模型選擇
      • 提示語設計
      • 避免誤區
    • 從“下達指令”到“表達需求”
    • 任務需求與提示語策略
    • 如何向AI表達需求
  • 五、提示語(Prompt)
    • 提示語示例
    • 提示語類型
      • 提示語的本質
      • 提示語的類型
  • 六、總結

引用
清華大學新聞與傳播學院新媒體研究中心, 宇宙文化實驗室. (2025). DeepSeek從入門到精通. 余夢瓏(博士后主筆). 北京: 清華大學.

一、DeepSeek是什么?

DeepSeek是中國一家專注通用人工智能(AGI)研發的科技公司,基于自主研發的大模型核心技術,提供智能對話助手(如深度求索)、開放平臺API接口及企業級解決方案,涵蓋智能客服、數據分析、內容生成等場景應用。

性能對齊OpenAI-o1正式版

DeepSeek-R1在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。
性能對齊OpenAi-o1正式版

二、Deepseek可以做什么?

DeepSeek直接面向用戶或者支持開發者,提供智能對話、文本生成、語義理解、計算推理、代碼生成補全等應用場景,支持聯網搜索與深度思考模式,同時支持文件上傳,能夠掃描讀取各類文件及圖片中的文字內容。

能力圖譜

能力圖譜


文本生成

文本創作

  • 文章/故事/詩歌寫作
  • 營銷文案、廣告語生成
  • 社交媒體內容(如推文、帖子)劇本或對話設計

摘要與改寫

  • 長文本摘要(論文、報告)
  • 文本簡化(降低復雜度)
  • 多語言翻譯與本地化

結構化生成

  • 表格、列表生成(如日程安排、菜譜)
  • 代碼注釋、文檔撰寫

自然語言理解與分析

語義分析

  • 語義解析
  • 情感分析(評論、反饋)
  • 意圖識別(客服對話、用戶查詢)
  • 實體提取(人名、地點、事件)

知識推理

  • 知識推理
  • 邏輯問題解答(數學、常識推理)
  • 因果分析(事件關聯性)

文本分類

  • 文本分類
  • 主題標簽生成(如新聞分類)
  • 垃圾內容檢測

編程與代碼相關

代碼生成

  • 根據需求生成代碼片段(Python、JavaScript)
  • 自動補全與注釋生成

代碼調試

  • 錯誤分析與修復建議
  • 代碼性能優化提示

技術文檔處理

  • API文檔生成
  • 代碼庫解釋與示例生成

常規繪圖

SVG矢量圖
基礎圖形/圖標/簡單插圖/流程圖/組織架構圖
Mermaid圖表
流程圖/時序圖/類圖/狀態圖/實體關系圖/思維導圖
React圖表
折線圖/柱狀圖/餅圖/散點圖/雷達圖/組合圖表

三、如何使用DeepSeek?

官網:DeepSeek官網
如何使用DeepSeek

四、DeepSeek從入門到精通

推理模型

推理大模型

推理大模型是指能夠在傳統的大語言模型基礎上,強化推理、邏輯分析和決策能力的模型。它們通常具備額外的技術,比如強化學習、神經符號推理、元學習等,來增強其推理和問題解決能力。
例如:DeepSeek-R1,GPT-o3在邏輯推理、數學推理和實時問題解決方面表現突出。

非推理大模型

適用于大多數任務,非推理大模型一般側重于語言生成、上下文理解和自然語言處理,而不強調深度推理能力。此類模型通常通過對大量文本數據的訓練,掌握語言規律并能夠生成合適的內容,但缺乏像推理模型那樣復雜的推理和決策能力。
例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于語言生成、語言理解、文本分類、翻譯等任務。

維度推理模型通用模型
優勢領域數學推導、邏輯分析、代碼生成、復雜問題拆解文本生成、創意寫作、多輪對話、開放性問答
劣勢領域發散性任務(如詩歌創作)需要嚴格邏輯鏈的任務(如數學證明)
性能本質專精于邏輯密度高的任務擅長多樣性高的任務
強弱判斷并非全面更強,僅在其訓練目標領域顯著優于通用模型通用場景更靈活,但專項任務需依賴提示語補償能力

快思慢想:效能兼顧 全局視野

1概率預測(快速反應模型,如 ChatGPT 4o)鏈式推理(慢速思考模型,如 OpenAI o1)
性能表現響應速度快,算力成本低慢速思考,算力成本高
運算原理基于概率預測,通過大量數據訓練來快速預測可能的答案基于鏈式思維(Chain - of - Thought),逐步推理問題的每個步驟來得到答案
決策能力依賴預設算法和規則進行決策能夠自主分析情況,實時做出決策
創造力限于模式識別和優化,缺乏真正的創新能力能夠生成新的創意和解決方案,具備創新能力
人機互動能力按照預設腳本響應,較難理解人類情感和意圖更自然地與人互動,理解復雜情感和意圖
問題解決能力擅長解決結構化和定義明確的問題能夠處理多維度和非結構化問題,提供創造性的解決方案
倫理問題作為受控工具,幾乎沒有倫理問題引發自主性和控制問題的倫理討論

CoT鏈式思維的出現將大模型分為了兩類:“概率預測(快速反應)”模型和“鏈式推理(慢速思考)”模型。前者適合快速反饋,處理即時任務;后者通過推理解決復雜問題。了解它們的差異有助于根據任務需求選擇合適的模型,實現最佳效果。


提示語策略差異

推理模型

  • 提示語更簡潔,只需明確任務目標和需求(因其已內化推理邏輯)。
  • 無需逐步指導,模型自動生成結構化推理過程(若強行拆解步驟,反而可能限制其能力)。

通用模型

  • 需顯式引導推理步驟(如通過CoT提示),否則可能跳過關鍵邏輯。
  • 依賴提示語補償能力短板(如要求分步思考、提供示例)。

關鍵原則

模型選擇

優先根據任務類型而非模型熱度選擇(如數學任務選推理模型,創意任務選通用模型)。

提示語設計

推理模型:簡潔指令,聚焦目標,信任其內化能力。(“要什么直接說”)。
通用模型:結構化、補償性引導(“缺什么補什么”)。

避免誤區

不要對推理模型使用“啟發式”提示(如角色扮演),可能干擾其邏輯主線。
不要對通用模型“過度信任”(如直接詢問復雜推理問題,需分步驗證結果)。


從“下達指令”到“表達需求”

策略類型定義與目標適用場景示例(推理模型適用)優勢與風險
指令驅動直接給出明確步驟、格式要求簡單任務、需快速執行“用 Python 編寫快速排序函數,輸出需包含注釋。”結果精準高效;限制模型自主優化空間
需求導向描述問題背景與目標,由模型規劃解決路徑復雜問題、需模型自主推理我需要優化用戶登錄流程,請分析當前瓶頸并提出 3 種方案。”激發模型深層推理;需清晰定義需求邊界
混合模式結合需求描述與關鍵約束條件平衡靈活性與可控性“設計一個杭州三日游計劃,要求包含西湖和靈隱寺,且預算控制在 2000 元內。”兼顧目標與細節;需避免過度約束
啟發式提問通過提問引導模型主動思考(如 “為什么”“如何”)探索性問題、需模型解釋邏輯“為什么選擇梯度下降法解決此優化問題?請對比其他算法。”觸發模型自解釋能力;可能偏離核心目標

任務需求與提示語策略

任務類型通用模型提示語句重點示例(有效提示)需避免的提示策略
數學證明推理模型直接提問,無需分步引導“證明勾股定理”冗余拆解(如“先畫圖,再列公式”)
通用模型顯式要求分步思考,提供示例“請分三步推導勾股定理,參考:1. 畫直角三角形…”直接提問(易跳過關鍵步驟)
創意寫作推理模型鼓勵發散性,設定角色/風格“以海明威的風格寫一個冒險故事”過度約束邏輯(如“按時間順序列出”)
通用模型需明確約束目標,避免自由發揮“寫一個包含‘量子’和‘沙漠’的短篇小說,不超過200字”開放式指令(如“自由創作”)
代碼生成推理模型簡潔需求,信任模型邏輯“用Python實現快速排序”分步指導(如“先寫遞歸函數”)
通用模型細化步驟,明確輸入輸出格式“先解釋快速排序原理,再寫出代碼并測試示例”模糊需求(如“寫個排序代碼”)
多輪對話通用模型自然交互,無需結構化指令“你覺得人工智能的未來會怎樣?”強制邏輯鏈條(如“分三點回答”)
推理模型需明確對話目標,避免開放發散“從技術、倫理、經濟三方面分析AI的未來”情感化提問(如“你害怕AI嗎?”)
邏輯分析推理模型直接抽出復雜問題“分析‘電車難題’中的功利主義與道德主義沖突”添加主觀引導(如“你認為哪種對?”)
通用模型需拆分問題,逐步追問“先解釋電車難題的定義,再對比兩種倫理觀的差異”一次性提問復雜度提

如何向AI表達需求

需求類型特點需求表達公式推理模型適配策略通用模型適配策略
決策需求需權衡選項、評估風險、選擇最優解目標+選項+評估標準要求邏輯推演和量化分析直接建議,依賴模型經驗歸納
分析需求需深度理解數據/信息、發現模式或因果關系問題+數據/信息+分析方法觸發因果鏈推導與假設驗證表層總結或分類
創造性需求需生成新穎內容(文本/設計方案)主題+風格/約束+創新方向結合邏輯框架生成結構化創意自由發散,依賴示例引導
驗證需求需檢查邏輯自洽性、數據可靠性或方案可行性結論方案+驗證方法+風險點自主設計驗證路徑并排查矛盾簡單確認,缺乏深度推演
執行需求需完成具體操作(代碼/計算/流程)任務+步驟約束+輸出格式自主優化步驟,兼顧效率與正確性嚴格按指令執行,無自主優化

五、提示語(Prompt)

提示語示例

提示語(Prompt)是用戶輸入給AI系統的指令或信息,用于引導AI生成特定的輸出或執行特定的任務。簡單來說,提示語就是我們與AI“對話”時所使用的語言,它可以是一個簡單的問題,一段詳細的指令,也可以是一個復雜的任務描述。

提示語的基本結構包括指令、上下文和期望

  • 指令(Instruction): 這是提示語的核心,明確告訴AI你希望它執行什么任務。
  • 上下文(Context): 為AI提供背景信息,幫助它更準確地理解和執行任務。
  • 期望(Expectation): 明確或隱含地表達你對AI輸出的要求和預期。

提示語
提示語組成部分

需求類型實戰技巧示例
決策需求* 為降低物流成本,現有兩種方案:
①自建區域倉庫(初期投入高,長期成本低)
②與第三方合作(按需付費,靈活性高)
請根據ROI計算模型,對比5年內的總成本并推薦最優解。
分析需求* 分析近三年新能源汽車銷量數據(附CSV),說明:
①增長趨勢與政策關聯性;
②預測2025年市占率,需使用ARIMA模型并解釋參數選擇依據。
創造性需求* 設計一款智能家居產品,要求:
①解決獨居老人安全問題;
②結合傳感器網絡和AI預警;
③提供三種不同技術路線的原型草圖說明。
驗證性需求* 以下是某論文結論:“神經網絡模型A優于傳統方法B”,請驗證:
①實驗數據是否支持該結論;
②檢查對照組設置是否存在偏差;
③重新計算p值并判斷顯著性。
執行需求* 將以下C語言代碼轉換為Python,要求:
①保持時間復雜度不變;
②使用numpy優化數組操作;
③輸出單元測試案例的完整代碼。

提示語類型

提示語的本質

特征描述示例
溝通橋梁連接人類意圖和AI理解“將以下內容翻譯為法語:Hello, world”
上下文提供者為AI提供必要的背景信息“假設你是一位10世紀的歷史學家,評論拿破侖的崛起”
任務定義器明確指定AI需要完成的任務“為一篇關于氣候變化的文章寫一個引言,長度200字”
輸出塑造器影響AI輸出的形式和內容“用簡單的語言解釋量子力學,假設你在跟一個10歲的孩子說話”
AI能力引導器引導AI使用特定的能力或技能“使用你的創意寫作能力,創作一個關于時間旅行的短篇故事”

提示語的類型

  1. 指令型提示語
    直接告訴AI需要執行的任務。
    示例: “生成一張2023年全球碳排放量的柱狀圖”。

  2. 問答型提示語
    向AI提出問題,期望得到相應的答案。
    示例: “量子糾纏的基本原理是什么?”。

  3. 角色扮演型提示語
    要求AI扮演特定角色,模擬特定場景。
    示例: “假設你是莎士比亞,寫一首關于人工智能的十四行詩”。

  4. 創意型提示語
    引導AI進行創意寫作或內容生成。
    示例: “創作一個未來城市中人與機器人共存的科幻故事”。

  5. 分析型提示語
    要求AI對給定信息進行分析和推理。
    示例: “根據過去十年的股票數據,預測明年科技股的走勢”。

  6. 多模態提示語
    結合文本、圖像等多種形式的輸入。
    示例: “為這張風景照片(附鏈接)配一首五言絕句”。

六、總結

DeepSeek是中國一家專注于通用人工智能(AGI)研發的科技公司,其核心產品基于自主研發的大模型技術(如推理模型DeepSeek-R1和通用模型),在數學推理、代碼生成、邏輯分析等復雜任務上性能比肩OpenAI頂級模型。公司提供智能對話助手、API接口及企業級解決方案,覆蓋文本生成(創意寫作、摘要翻譯)、自然語言理解(語義分析、知識推理)、編程輔助(代碼生成與調試)、多模態繪圖(SVG、Mermaid圖表)等多樣化場景,并支持文件解析與聯網搜索。用戶可通過官網快速接入,其核心使用策略強調“任務導向型提示語設計”:推理模型需簡潔指令以釋放內化邏輯能力,通用模型依賴結構化引導(如分步示例);同時,文檔系統梳理了從需求分類(決策、分析、創造、驗證、執行)到提示語類型(指令型、角色扮演、多模態等)的適配方法,助力用戶高效利用AI能力,規避過度約束或模糊指令的常見誤區,實現從基礎操作到復雜問題解決的全面覆蓋。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/895194.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/895194.shtml
英文地址,請注明出處:http://en.pswp.cn/news/895194.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

洛谷P3397 地毯(二維差分加暴力法)

題目難度:普及一 題目傳送門 地毯 題目描述 在 n n n\times n nn 的格子上有 m m m 個地毯。 給出這些地毯的信息,問每個點被多少個地毯覆蓋。 輸入格式 第一行,兩個正整數 n , m n,m n,m。意義如題所述。 接下來 m m m 行&#…

使用OBS推流,大華攝像頭 srs服務器播放

說明: ffmpeg可以推流,但是是命令行方式不太友好,還可以使用主流的OBS開源推流軟件,可從官網Open Broadcaster Software | OBS 下載最新版本,目前很多網絡主播都是用它做直播。該軟件支持本地視頻文件以及攝像頭推流。…

從大規模惡意攻擊 DeepSeek 事件看 AI 創新隱憂:安全可觀測體系建設刻不容緩

作者:羿莉(蕭羿) 全球出圈的中國大模型 DeepSeek 作為一款革命性的大型語言模型,以其卓越的自然語言處理能力和創新性成本控制引領行業前沿。該模型不僅在性能上媲美 OpenAI-o1,而且在推理模型的成本優化上實現了突破…

mac下dify+deepseek部署,實現私人知識庫

目前deepseek 十分火爆,本地部署實現私有知識庫,幫助自己日常工作,上一篇使用工具cherry studio可以做到私人知識庫。今天學習了一下,使用Dify鏈接deepseek,實現私人知識庫,也非常不錯,這里分享…

C++性能優化—人工底稿版

C以高性能著稱,性能優化是C程序員繞不過去的一個話題,性能優化是一個復雜、全局而又細節的問題,本文總結C性能分析中常用的知識。 性能優化的時機 大部分關于性能優化的文章都強調:不要過早的進行性能優化。 C編碼層面 數據結…

react概覽webpack基礎

react概覽 課程介紹 webpack 構建依賴圖->bundle 首屏渲染: 減少白屏等待時間 數據、結構、樣式都返回。需要服務器的支持 性能優化 ***webpack干的事情 模塊化開發 優勢: 多人團隊協作開發 可復用 單例:全局沖突 閉包 模塊導入的順序 req…

ASP.NET Core SignalR實踐指南

Hub類的生命周期是瞬態的,每次調用集線器的時候都會創建一個新的Hub類實例,因此不要在Hub類中通過屬性、成員變量等方式保存狀態。如果服務器的壓力比較大,建議把ASP.NET Core程序和SignalR服務器端部署到不同服務器上,以免它們互…

常見的九種二極管

常見的九種二極管 文章目錄 常見的九種二極管1、普通二極管2、光電二極管(LED)3、變容二級管4、發光二極管5、恒流二極管6、快恢復二極管(FRD)7、肖特基二極管8、瞬態電壓抑制二極管(TVS)9、齊納二極管(穩壓&#xff0…

LabVIEW在呼吸機測試氣體容量計算

在呼吸機測試中,精確測量氣體容量變化是評估設備性能的關鍵步驟。通過監測呼吸機氣道內的壓力變化,并結合流阻和肺順應性等參數,可以計算出單位時間內的氣體容量變化。本案例基于LabVIEW實現該計算過程,以確保測試數據的準確性和一…

本地部署DeepSeek R1 + 界面可視化open-webui

本地部署DeepSeek R1 界面可視化open-webui ollama是物理機本地安裝 open-webui是容器啟動 另外,用docker 部署ollama也很方便ollama docker 安裝部署ollama ollama官網 安裝 Linux上安裝: curl -fsSL https://ollama.com/install.sh | sh使用命令行管理 拉…

第四十九章:橫店之旅:穿越時空的歡樂時光

自黃山之行結束后,小冷一家又回歸到了忙碌而又溫馨的日常生活中。小冷在杭州灣研發總部的工作愈發忙碌,項目一個接著一個,時常需要加班加點,但每當他回到家中,看到小澤澤可愛的笑臉和小一充滿活力的身影,一…

Python3 ImportError: cannot import name ‘XXX‘ from ‘XXX‘

個人博客地址&#xff1a;Python3 ImportError: cannot import name XXX from XXX | 一張假鈔的真實世界 例如如下錯誤&#xff1a; $ python3 git.py Traceback (most recent call last):File "git.py", line 1, in <module>from git import RepoFile &quo…

使用C語言實現MySQL數據庫的增刪改查操作指南

使用C語言與MySQL數據庫進行交互,通常涉及使用MySQL提供的C API庫。這套API允許開發者在C/C++程序中執行SQL查詢,從而實現數據庫的增刪改查操作。下面,我將詳細介紹如何在C語言中實現這些基本操作。 準備工作 安裝MySQL開發庫:確保你的系統上安裝了MySQL服務器以及MySQL開發…

局域網使用Ollama(Linux)

解決局域網無法連接Ollama服務的問題 在搭建和使用Ollama服務的過程中&#xff0c;可能會遇到局域網內無法連接的情況。經過排查發現&#xff0c;若開啟了代理軟件&#xff0c;尤其是Hiddify&#xff0c;會導致此問題。這一發現耗費了我數小時的排查時間&#xff0c;希望能給大…

在CT107D單片機綜合訓練平臺上實現外部中斷控制LED閃爍

引言 在單片機開發中&#xff0c;外部中斷是一個非常重要的功能&#xff0c;它可以讓單片機在檢測到外部信號變化時立即做出響應。本文將詳細介紹如何在CT107D單片機綜合訓練平臺上使用外部中斷來控制LED燈的閃爍。我們將使用兩種不同的方式來實現這一功能&#xff1a;一種是在…

重磅發布!AI 驅動的 Java 開發框架:Spring AI Alibaba

*本文作者系阿里云云原生微服務技術負責人&#xff0c;Spring AI Alibaba 發起人彥林&#xff0c;望陶和隆基對可觀測和 RocketMQ 部分內容亦有貢獻。 * 摘要 隨著生成式 AI 的快速發展&#xff0c;基于 AI 開發框架構建 AI 應用的訴求迅速增長&#xff0c;涌現出了包括 Lang…

防御保護作業二

拓撲圖 需求 需求一&#xff1a; 需求二&#xff1a; 需求三&#xff1a; 需求四&#xff1a; 需求五&#xff1a; 需求六&#xff1a; 需求七&#xff1a; 需求分析 1.按照要求進行設備IP地址的配置 2.在FW上開啟DHCP功能&#xff0c;并配置不同的全局地址池&#xff0c;為…

react 路由配置:從入門到精通

前言 在現代Web開發中&#xff0c;React憑借其高效的組件化開發模式和虛擬DOM技術&#xff0c;已成為構建用戶界面的首選庫之一。然而&#xff0c;僅掌握React的核心概念并不足以應對復雜的單頁應用&#xff08;SPA&#xff09;開發需求。路由管理作為連接各個頁面、實現視圖切…

CPLD實現SPI通信

在 CPLD 中編寫 SPI 程序時,需根據具體需求(主/從設備、時鐘極性、數據位寬等)設計邏輯。以下提供一個 SPI 主控制器的 Verilog 實現示例,支持 模式 0(CPOL=0, CPHA=0),適用于控制外設(如 ADC、DAC、存儲器等)。 SPI 主控制器模塊設計(Verilog) 模塊功能 支持 8/16…

MapReduce簡單應用(三)——高級WordCount

目錄 1. 高級WordCount1.1 IntWritable降序排列1.2 輸入輸出格式1.3 處理流程 2. 代碼和結果2.1 pom.xml中依賴配置2.2 工具類util2.3 高級WordCount2.4 結果 參考 本文引用的Apache Hadoop源代碼基于Apache許可證 2.0&#xff0c;詳情請參閱 Apache許可證2.0。 1. 高級WordCo…