DeepSeek 沖擊(含本地化部署實踐)

DeepSeek無疑是春節檔最火爆的話題,上線不足一月,其全球累計下載量已達4000萬,反超ChatGPT成為全球增長最快的AI應用,并且完全開源。那么究竟DeepSeek有什么魔力,能夠讓大家趨之若鶩,他又將怎樣改變世界AI格局和我們的生活,本篇文章將進行簡要解析。

DeepSeek與ChatGPT對比

說到人工智能就不得不提OpenAI和ChatGPT,這是繞不開的話題,要分析DeepSeek的實力,最簡單的方式就是跟ChatGPT進行對比。

模型分類

ChatGPT目前有兩種大模型,分別是面向普通用戶,解決日常應用問題的4-OMNI,以及面向專業用戶,處理深度思考問題的O1,DeepSeek與之對標的分別是V3模型以及R1模型。





實用效果

據我目前的使用體驗下來,DeepSeek的實際體驗效果完全不輸ChatGPT,甚至在解決數學、物理和推理問題方面表現出色,響應速度比ChatGPT還要快,且能夠完整地展示其思考和給出答案的過程,例如最經典的,讓絕大多數AI翻車的“1.11和1.9誰大?”的問題,ChatGPT給出的回答是:





前言不搭后語,而反觀DeepSeek:

















可以看到DeepSeek不僅給出了正確答案,而且展示了詳細的解題思路,甚至有最后的驗證。我也測試了許多其他的問題,DeepSeek完全不拉垮,相對于ChatGPT,他在中文領域的問題理解和處理更加到位,使用體驗非常好。

這無疑也使得蘋果公司柳暗花明又一村,為彌補apple intelligence上在中國區無法使用ChatGPT提供了完美的解決方案。

成本

成本分為兩部分:硬件成本和訓練成本。AI大模型構建算法絕大部分都是基于公開的論文,所以市場上的大模型,底層邏輯都大同小異,訓練數據也來自于互聯網,所以主要的成本體現在硬件上,也就是提供AI算力的芯片,自從AI大爆發以來,大家的共識就是堆砌的芯片越多,大模型的表現就越優秀。我先簡單介紹一下為什么提升AI的性能就要堆砌大量的芯片。

AI算力的芯片領域是英偉達(Nvidia)一家獨大,芯片價格非常昂貴,目前該公司最先進的B200芯片單張的價格就高達4萬美金,而且對于AI公司來說你還必須買,因為芯片的產能有限,如果你不搶就會被競爭對手買走,導致你的大模型算力不如他的。





英偉達公司為自家的芯片研發了一種叫CUDA的核心的技術,其全名叫做Compute Unified Device Architecture(統一計算設備架構)。





這是一種并行計算平臺和編程模型。開發者通過它,可以間接利用GPU的處理能力,大幅提升計算性能。簡單的說,CUDA核心就像是一間間的海水提純工廠,它可以把如海洋般的GPU算力轉換成AI開發者可以直接使用的AI算力,越多的CUDA核心數量就意味著更大的AI算力。





這也就是為什么AI行業越發展,芯片的需求量越大,英偉達的市值就越高。美國也多次通過英偉達“鎖算力”以及限制芯片出口,阻礙中國的AI發展。AI行業的發展被一家公司扼住喉嚨的現象顯然極度不合理,英偉達可謂是真正的萬惡之源。

OpenAI不受限制,所以囤積了大量的英偉達芯片,訓練ChatGPT據傳用到了5萬張英偉達的芯片,而DeepSeek作為中國公司,在這方面相比自然相去甚遠。

DeepSeek沖擊

由于CUDA技術被英偉達牢牢掌握,所以間接提高了所有AI大模型的使用成本,阻礙了AI的發展。以ChatGPT為例,4-OMNI和O1兩個大模型的研發成本高達數十億美金,免費用戶使用有諸多限制,付費用戶每月20美金,專業用戶每月200美金,如果企業想要接入OpenAI的人工智能服務,調用API做客服等用途,則更是按字符收費,雖然比人工客服省錢,但也是一筆不小的開銷。這些收入中,絕大多數都是用來平衡購買芯片帶來的巨大成本。

DeepSeek之所以引起全球矚目,就是因為他在“芯片”受限的前提下,達到了與ChatGPT近似的使用體驗,甚至在某些領域還遠遠超過了。OpenAI和它的母公司微軟囤積了大量的高端芯片,而DeepSeek手里的芯片,不論從數量還是質量上都不占優勢,甚至可以說遠遠落后。

在深度解析DeepSeek開源的模型代碼之后,研究人員發現,DeepSeek之所以能夠絕地反擊,秘訣就在于他繞過了CUDA核心的限制,使用了完全創新的技術訓練大模型,直接利用英偉達的底層技術調用了GPU的算力,相當于能直接使用如大海般的GPU資源,所以才能使用低端的芯片,在極短的時間內完成了模型的訓練,達到了與ChatGPT近似的效果。

而且此技術成功解除了AI模型對英偉達芯片的依賴,使DeepSeek可以使用華為的芯片進行訓練。DeepSeek服務調用的費用只有ChatGPT的十分之一,具有非常高的性價比和廣闊的應用前景。

整體來說,DeepSeek用了很少的錢,很低端的工具,就把美國投入上百億美元的事給辦了。自從DeepSeek爆火之后,市場普遍認為英偉達的芯片估值過高,要實現高性能的AI并不需要如此之貴的芯片,最高端的芯片也并不值那個價錢,這直接導致英偉達的股價當天就暴跌17%,創造了美國股市歷史上單日最大跌幅,截至目前英偉達市值蒸發近6000億美元。

技術曝光的第二天,英偉達,微軟和亞馬遜的計算平臺都宣布接入DeepSeek模型,堪稱AI界的“斯普特尼克時刻”,就如同當年蘇聯率先成功發射人造衛星時一樣,讓一直以為自己在技術上遙遙領先的西方世界陷入了一片混亂,世界AI市場的格局就此改變。

本地化部署R1模型

DeepSeek雖然好,但是用過的同學都知道他有個致命的問題,就是萬惡的資本主義經常組織針對DeepSeek的網絡攻擊,導致使用時出現“服務器繁忙的問題”。





為了避免被攻擊,降低延遲和卡頓,規避共享敏感信息的風險,同時更靈活的進行微調和實驗,我們可以把R1模型部署到本地。

安裝Ollama

首先登陸Ollama官網:https://ollama.com/。打開官網,然后點擊下載,之后安裝到本地。





拉取 DeepSeek R1 模型

然后打開Ollama 的模型列表: https://ollama.com/library/deepseek-r1 ,搜索到DeepSeek R1:





顯卡需求

各個模型版本需求的顯卡檔次大致如下表

模型(DeepSeek-R1)顯卡檔次顯存需求
1.5bGTX1050以上1GB
7bRTX2050、RTX3060以上4GB
8bRTX2060、RTX3070以上5GB
14bRTX3080、RTX4070以上8GB
32bRTX4080以上18GB
70bRTX4090、RTX5080以上36GB以上

我們普通的電腦安裝1.5B,7B就可以使用,然后在【右上角的的代碼】復制,打開終端,輸入上述下載命令回車后,會出現模型下載進度,當進度為100%就說明該模型已經下載到本地了。





輸入ollama list可以查看安裝的模型。





此時已經可以在控制臺使用R1模型進行問答了。

包裝GUI

只能在命令行中使用既不美觀也特別的不方便,所以我們可以使用現成的GUI進行包裝,相當于包上圖形用戶界面。這里以Cherry Studio為例,下載對應版本后打開。





在設置中選擇模型服務,選中Ollama





填入對應的本地模型信息:





然后就可以使用了!希望本篇文章能夠幫到大家!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/71510.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/71510.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/71510.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

顯微鏡下的人體結構

顯微鏡下的人體結構,看完以后,你還覺得人類是進化而來的嗎?...... 第一張:電子顯微鏡所觀察到的人類血管,可以非常清楚的看到里面的白細胞和紅細胞 第二張:正在分泌耳垢(耳屎)的耳道…

DApp 開發入門指南

DApp 開發入門指南 🔨 1. DApp 基礎概念 1.1 什么是 DApp? 去中心化應用(DApp)是基于區塊鏈的應用程序,特點是: 后端運行在區塊鏈網絡前端可以是任何框架使用智能合約處理業務邏輯數據存儲在區塊鏈上 1…

鴻蒙狀態管理概述 v2

狀態管理v2 概述狀態管理之v2ObservedV2 和 Trace狀態管理V1版本對嵌套類對象屬性變化直接觀測的局限性ObservedV2 和 Trace 使用場景 Local狀態管理V1版本State裝飾器的局限性 Param狀態管理V1版本接受外部傳入的裝飾器的局限性 OnceEventComputedComputed 使用場景 TypePersi…

Git中revert和reset區別?

git revert 和 git reset 都用于撤銷 Git 中的提交,但它們的作用和使用場景不同: git revert: 作用:創建一個新的提交,撤銷指定的提交內容。使用場景:用于“回滾”已推送到遠程倉庫的提交。這種方法不會改變提交歷史&a…

LabVIEW開發中的電機控制與相機像素差

在電機控制系統中,我們需要精確控制電機運動與相機拍攝畫面之間的關系。理想情況下,當電機帶動相機移動同樣的距離時,相機拍攝畫面中兩點之間的像素差應當是一個固定值。然而,在實際應用中,我們發現這一像素差并非固定…

從零到一:構建現代 React 應用的完整指南

1. create-react-app (CRA) 簡介: create-react-app 是官方推薦的 React 項目腳手架工具,提供了一個開箱即用的開發環境,幫助開發者快速啟動 React 應用。它會自動配置 Webpack、Babel、ESLint 等工具,讓你專注于開發而不需要手動配置工具鏈。 特點: 零配置:CRA 自動配…

rman 備份恢復1

前提: rman用戶必須具有sysdba權限 使用常用連接方式如下: rman target / rman target sys/oracle rman target sys/oracleprod1 catalog dav/oracledav_db 一個rman連接會產生兩個進程,action字段為空的就是rman的監控進程,另…

Qt程序退出相關資源釋放問題

目錄 問題背景: aboutToQuit 代碼舉例 closeEvent事件 代碼舉例 程序退出方式 quit() exit(int returnCode 0) close() 問題背景: 實際項目中程序退出前往往需要及進行一些資源釋放、配置保存、線程中斷等操作,避免資源浪費&#xff…

【DeepSeek】Mac m1電腦部署DeepSeek

一、電腦配置 個人電腦配置 二、安裝ollama 簡介:Ollama 是一個強大的開源框架,是一個為本地運行大型語言模型而設計的工具,它幫助用戶快速在本地運行大模型,通過簡單的安裝指令,可以讓用戶執行一條命令就在本地運…

[生活雜項][運動教程]自由泳

https://v.youku.com/v_show/id_XMzgzMjkwMzg0MA.html?spma2h0k.11417342.soresults.dtitle https://v.youku.com/v_show/id_XMzgxNjM2NjY4NA.html?spma2h0k.11417342.soresults.dtitle

Linux的指令與熱鍵

一.指令 1.pwd :顯示一個用戶當前所處的目錄 2.ls :顯示當前目錄下的文件(顯示當前文件屬性) ls -l :顯示當前目錄下文件的屬性及更多內容(ll是ls -l的別名,用法相同) ls -l 目錄:顯示指定目錄內容 ls…

【Dubbo+Zookeeper】——SpringBoot+Dubbo+Zookeeper知識整合

🎼個人主頁:【Y小夜】 😎作者簡介:一位雙非學校的大二學生,編程愛好者, 專注于基礎和實戰分享,歡迎私信咨詢! 🎆入門專欄:🎇【MySQL&#xff0…

【OS安裝與使用】part5-ubuntu22.04基于conda安裝pytorch+tensorflow

文章目錄 一、待解決問題1.1 問題描述1.2 解決方法 二、方法詳述2.1 必要說明2.2 應用步驟2.2.1 明確pytorch安裝依賴2.2.2 conda創建虛擬環境2.2.3 安裝pytorch2.2.4 驗證pytorch安裝2.2.5 安裝Tensorflow2.2.6 驗證Tensorflow安裝 三、疑問四、總結 一、待解決問題 1.1 問題…

馬拉車算法

Manacher算法 ,用于處理最長回文字符串的問題,可以在O(n)的情況下,求出一個字符串的最長回文字符串 回文串的基礎解法: 以每個點為中心對稱點,看左右兩邊的點是否相同。這種算法的時間復雜度為O&#xff0…

氣象學中的CDO插值(多方法+多分辨率)

文章目錄 說明CDO代碼 說明 需要新建.sh腳本文件,將下面的CDO代碼復制到.sh腳本中,然后運行插值程序。 CDO代碼 #!/bin/bash # # 用戶配置區(按實際需求修改) # input_directory"2m_temperature" # 自定義路徑 gr…

計算機網絡:應用層 —— 動態主機配置協議 DHCP

文章目錄 什么是 DHCP?DHCP 的產生背景DHCP 的工作過程工作流程地址分配機制 DHCP 中繼代理總結 什么是 DHCP? 動態主機配置協議(DHCP,Dynamic Host Configuration Protocol)是一種網絡管理協議,用于自動分…

【OS安裝與使用】part3-ubuntu安裝Nvidia顯卡驅動+CUDA 12.4

文章目錄 一、待解決問題1.1 問題描述1.2 解決方法 二、方法詳述2.1 必要說明2.2 應用步驟2.2.1 更改鏡像源2.2.2 安裝NVIDIA顯卡驅動:nvidia-550(1)查詢顯卡ID(2)PCI ID Repository查詢顯卡型號(3&#xf…

數據導入AI訓練步驟——人工智能訓練

一、人工操作轉化 數據導入過程 整理excel表格,通過數據庫管理工具導入數據,補充數據格式,調整sql語句 復制數據到目標數據 二、整理表格 三、導入數據 通過數據庫導入數據 四、合并 五、驗證更新數據 六、 更新數據 update temp_cus_hmz…

我國首條大型無人機城際低空物流航線成功首航

首航震撼開場:羊肉 “飛” 越 540 公里 在夜色的籠罩下,榆陽馬合通用機場的跑道上,一架大型固定翼無人機蓄勢待發,機身被燈光照亮,宛如一只即將展翅翱翔的鋼鐵巨鳥。它的貨艙里,滿滿裝載著新鮮的榆林羊肉&a…

《跟李沐學 AI》AlexNet論文逐段精讀學習心得 | PyTorch 深度學習實戰

前一篇文章,使用 AlexNet 實現圖片分類 | PyTorch 深度學習實戰 本系列文章 GitHub Repo: https://github.com/hailiang-wang/pytorch-get-started 本篇文章內容來自于學習 9年后重讀深度學習奠基作之一:AlexNet【下】【論文精讀】】的心得。 《跟李沐…