DeepSeek實戰--各版本對比

1.對比

版本參數量優勢劣勢使用場景競品
DeepSeek-V36710億(MoE架構,激活370億)開源、高效推理(60 TPS)、低成本(API費用低)、中文處理能力突出(90%準確率多模態能力有限通用任務(聊天、編碼、多語言翻譯)、長文本處理、編程競賽GPT-4o(通用性稍弱,但成本更低)、Claude 3.5 Sonnet
DeepSeek-R1(滿血版)6710億(全激活)復雜邏輯推理(數學、編程)、支持多模態、展示推理過程部署成本高、推理速度慢、代碼生成穩定性欠佳科研前沿、決策支持、教育工具(如數學競賽、密碼解密)OpenAI o1(推理能力接近)、Google Gemini Advanced
DeepSeek-R1(蒸餾版)1.5B–32B低成本部署、響應速度快、適合資源受限環境推理能力弱于滿血版,精度有所犧牲企業客服、移動端應用(如智能家居)、實時交互場景GPT-3.5 Turbo(性價比更高)、Llama 2-7B
DeepSeek-V22360億中文能力領先開源模型、輕量化設計、訓練成本低(GPT-4的1%)多模態支持有限、推理速度較慢中文NLP任務(法律分析、醫學研究)、多任務場景GPT-4(中文能力更強)、LLaMA3-70B(英文相當)
DeepSeek-VL10億–45億(多規格)多模態融合(圖文聯合處理)、小參數高性能參數規模較小,復雜任務處理有限視覺問答(VQA)、文檔理解、OCRLLaVA(性能更優)、GPT-4V(多模態能力更強)
DeepSeek-Coder670億代碼生成準確性高(HumanEval通過率65.2%)、支持多編程語言復雜推理能力弱于通用模型代碼補全、糾錯、生成(軟件開發、教育)GitHub Copilot(功能相似但更靈活)、CodeLlama

截止:2025/05/02

2.什么是蒸餾?

1)知識遷移機制
大模型蒸餾借鑒“師生教學”模式,教師模型通過輸出軟標簽(概率分布)、中間層特征或注意力權重,指導學生模型的學習。軟標簽不僅包含類別信息,還傳遞類別間的關系,使學生模型能捕捉更復雜的決策邏輯。

  • 軟標簽:教師模型輸出的概率分布,通過溫度參數(Temperature)調整平滑程度,增強學生模型對模糊邊界的理解。
  • 中間層對齊:模仿教師模型的隱藏層激活或注意力機制,提升學生模型的內部特征表達能力。

2)實施步驟

  • 訓練教師模型:先訓練一個高性能的大模型(如GPT-4、DeepSeek-R1)。
  • 生成軟標簽:用教師模型對訓練數據推理,生成包含知識輸出的軟標簽。
  • 訓練學生模型:結合軟標簽和真實標簽,通過損失函數(如KL散度與交叉熵的加權組
    合)優化學生模型。

3.DeepSeek 可以做什么 ?

借用清華大學的總結,說明一下

在這里插入圖片描述
鏈接:https://pan.quark.cn/s/3e804ec46889#/share/doc/560b7613c3f84a3c8c88baad0f25dbfd

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/79372.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/79372.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/79372.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

從0開始建立Github個人博客(hugoPaperMod)

從0開始建立Github個人博客(hugo&PaperMod) github提供給每個用戶一個網址,用戶可以建立自己的靜態網站。 一、Hugo hugo是一個快速搭建網站的工具,由go語言編寫。 1.安裝hugo 到hugo的github標簽頁Tags gohugoio/hugo選擇一個版本&#xff0c…

【AI論文】WebThinker:賦予大型推理模型深度研究能力

摘要:大型推理模型(LRMs),如OpenAI-o1和DeepSeek-R1,展示了令人印象深刻的長期推理能力。 然而,他們對靜態內部知識的依賴限制了他們在復雜的知識密集型任務上的表現,并阻礙了他們生成需要綜合各…

Linux_sudo命令的使用與機制

1、sudo命令的作用 sudo(全稱 superuser do)是 Linux/Unix 系統中權限管理的核心工具。 允許普通用戶在授權下以其他用戶(默認是 root)的權限執行命令,而無需直接登錄賬戶。 2、sudo命令的典型使用場景 sudo 覆蓋了系…

Scrapy框架之 中間件的使用

爬蟲中間件 特點:主要處理蜘蛛(Spider)和下載器(Downloader)之間的請求和響應。可以對蜘蛛生成的請求進行攔截、修改或過濾,也可以對下載器返回給蜘蛛的響應進行處理。適用場景: 請求過濾與修改…

供應鏈算法整理(一)--- 銷量預估

在供應鏈管理領域有較多的預估場景,例如送達時長預估、銷量預估、用電量預估。特別的在智能供應鏈領域,銷量和庫存的管理的智能化也依賴銷量預估,因此在本文我們整理了 銷量預估的算法詳細的技術方案。 時間序列預測在最近兩年內發生了巨大的…

第4篇:服務層抽象與復用邏輯

在業務系統復雜度指數級增長的今天,服務層(Service Layer)的合理設計直接影響著系統的可維護性和擴展性。本文將深入剖析 Egg.js 框架中的服務層架構設計,從基礎實現到高級封裝,全方位講解企業級應用的開發實踐。 一、…

Java學習手冊:Spring 數據訪問

一、Spring JDBC JdbcTemplate :Spring JDBC 提供了 JdbcTemplate 類,它簡化了數據庫操作,提供了豐富的 API 來執行數據庫訪問任務。JdbcTemplate 可以自動處理數據庫連接的獲取、釋放,SQL 語句的執行,結果集的處理等…

遞歸、搜索和回溯算法《遞歸》

在之前的優選算法當中我們已經學習了一些基本的算法,那么接下來我們就要來學習算法當中的一大重要章節——遞歸、搜索和回溯算法,其實也就是大家常常聽到的dfs、bfs;其實本質就是遞歸,在學習搜索、回溯等算法的過程當中我們會先來…

Java進階--設計模式

設計模式是一套被反復使用的、多數人知曉的、經過分類編目的、代碼設計經驗的總結。使用設計模式是為了重用代碼、讓代碼更容易被他人理解、保證代碼可靠性。設計模式使代碼編制真正工程化,設計模式是軟件工程的基石,如同大廈的一塊塊磚石一樣&#xff0…

如何禁止AutoCAD這類軟件聯網

推薦二、三方法,對其他軟件影響最小 一、修改Hosts文件 Hosts文件是一個存儲域名與IP地址映射關系的文本文件,通過修改Hosts文件可以將AutoCAD的域名指向本地回環地址(127.0.0.1),從而實現禁止聯網的目的。具體步驟如…

深度學習框架搭建(Vscode/Anaconda/CUDA/Pytroch)

目錄 ??????一 Vscode安裝 二、Anaconda安裝 三、更新顯卡驅動 四、安裝CUDA 五、安裝Pytorch 六、Vscode配置 七、出現的問題匯總 ??????一 Vscode安裝 在 Windows 上安裝 訪問 VS Code 官網 https://code.visualstudio.com/,點擊 "Downl…

結構模式識別理論與方法

我們在前文《模式識別的基本概念與理論體系》中就已經提及“模式分類”。 具體內容看我的CSDN文章:模式識別的基本概念與理論體系-CSDN博客 模式的識別方法主要有統計模式識別方法和結構模式識別方法兩大類。統計模式識別方法提出得較早,理論也較成熟…

12.多邊形的三角剖分 (Triangulation) : Fisk‘s proof

目錄 1.Fisks proof Trangulation Coloring Domination Pigeon-Hold Principle Generation 2.Orthogonal Polygons (正交多邊形) Necessity of floor(n4) Sufficiency by convex Quadrilateralization Generalization 1.Fisks proof Trangulation 引入內對角線&…

面經-計算機網絡——OSI七層模型與TCP/IP四層模型的對比詳解

OSI七層模型與TCP/IP四層模型的對比詳解 一、圖示解析:分層封裝結構 你提供的圖清晰展示了網絡通信中從應用層到物理層的封裝過程,每一層都會對上層的數據加上自己的頭部信息(Header): 應用層: 應用…

React Native本地存儲方案總結

1. AsyncStorage(鍵值對存儲) 適用場景:簡單鍵值對存儲(如用戶配置、Token、緩存數據)。特點:異步、輕量、API 簡單,但性能一般,不推薦存儲大量數據。安裝:npm install …

Arduino程序函數詳解與實際案例

一、Arduino程序的核心架構與函數解析 Arduino程序的核心由兩個函數構成:setup() 和 loop()。這兩個函數是所有Arduino代碼的骨架,它們的合理使用決定了程序的結構和功能。 1.1 setup() 函數:初始化階段 setup() 函數在程序啟動時僅執行一次,用于完成初始化配置,例如設置…

【Unity】使用Socket建立客戶端和服務端并進行通信的例子

Socket服務端: using System; using System.Collections.Generic; using System.Net; using System.Net.Sockets; using System.Text; using System.Threading; public class SocketServer { public static Socket listenSocket;//監聽Socket public static List<Socket>…

Qt connect第五個參數

在 Qt 中&#xff0c;QObject::connect 函數的第五個參數用于指定 連接類型&#xff08;Qt::ConnectionType&#xff09;&#xff0c;它決定了信號與槽之間的通信方式。以下是各枚舉值的詳解及使用場景&#xff1a; 1. Qt::AutoConnection&#xff08;默認值&#xff09; 行為…

【2025域適應科研日報】

本筆記主要為了記錄自己的科研日報&#xff0c;前段時間剛開始想寫的初衷也是為了自己的思考不跑偏&#xff0c;但是有幾天又沒有堅持下來&#xff0c;看到一位學長的文章&#xff0c;發現這種形式還是很有必要的&#xff0c;所以自己也打算堅持記錄下來&#xff0c;由于還正在…

XrayR啟動失敗

公司要用服務器之間進行數據加密&#xff0c;這里用的XrayR 我使用的Centos 7。 我這里使用一鍵腳本安裝后&#xff0c;/etc/XrayR目錄下沒有配置文件。 解決方案 XrayR安裝時&#xff0c;系統沒有unzip工具&#xff0c;也是會安裝失敗的&#xff0c;因為Centos7已經停止維…