小白windows系統從零開始本地部署大模型全記錄

大家好,最近兩年大語言模型風靡全球,最近,不少開源大模型,將模型部署到自己的電腦上,用個性化的數據微調想必是不少人的愿望,這次,讓我來分享從hugging face上下載部署chatglm3-6b中的經驗。

1.硬件準備

具體參考這條帖子: https://zhuanlan.zhihu.com/p/655948272

結論:一般RTX 3060 6GB顯卡是最小模型的門檻

補充“7B”指的是7億參數。大語言模型參數量是指模型中可調整的參數的數量,通常用來衡量模型的大小和復雜程度,一般參數量越大的模型性能越強。商業化的模型一般在10B-100B之間,chatgpt4 13.3B。

我的配置:(查看方法:聯想電腦管家,魯大師)

很勉強,為了照顧顯卡不行的小伙伴,這個帖子先用CPU進行部署

2.運算環境準備
2.1 安裝anaconda

什么?你還不知道anaconda是啥?Conda是一個開源的包、環境管理器,可以用于在同一個機器上安裝不同版本的軟件包及其依賴,并能夠在不同的環境之間切換。

網上已經有很多下載安裝教程,比如:https://blog.csdn.net/ABV09876543210/article/details/101194476

https://zhuanlan.zhihu.com/p/647523947

備注:現在最好python版本安裝到3.8或者3.9,版本過低后面安裝庫的時候庫的版本會過低。

我的報錯解析:

  1. 如果你已經安裝,但在cmd使用conda 卻報沒有此命令,可以看看是不是沒加入你的環境變量

如何配置環境變量?Win11方法在此: https://blog.csdn.net/weixin_46483785/article/details/131163456

2.2 配置軟件環境

用conda create -n env python==3.8 命令創建名為“env”的新虛擬環境,用activate env或者conda activate env進入新建的虛擬環境(前面會出現新環境的名字)

并在新虛擬環境中使用conda下載(下載方法在剛剛conda教程中有)transformers>=4.38.2(為啥是這個或者以上的版本?后面會考!),tensorflow和pytorch。Pytorch安裝比較麻煩,分為CPU版本和GPU版,具體教程看這里:https://www.jb51.net/python/302744e4p.htm

我是使用這個命令安裝CPU版的 #安裝pytorch conda install pytorch torchvision torchaudio cpuonly -c pytorch。使用conda list可以看見所有下載了的庫:

然后虛擬環境導入到jupyter中(這時要保證自己在新的環境中!) https://blog.csdn.net/m0_56075892/article/details/130005168 首先要確保環境中有ipykernel ipython 庫,沒有的話進行安裝

安裝ipykernel ipython

pip install ipykernel ipython

查看jupyter下面有多少個kernels

jupyter kernelspec list

ipython kernel install --user --name pytorch1.6(虛擬環境名字)

最后,進入jupyter notebook,將kernel 調整成對應的虛擬環境將驗證安裝好了的包

新建一個notebook文檔,然后輸入 import torch import transformers 如果沒有報錯說明你已經安裝好了。

3.下載大模型:

Hugging face官網是要科學上網滴:https://huggingface.co/ 在網站上chatglm3的官方下載方式是:from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained(“THUDM/chatglm3-6b”, trust_remote_code=True) model = AutoModel.from_pretrained(“THUDM/chatglm3-6b”, trust_remote_code=True).half().cuda()

按照它的代碼輸入,你就會報這個錯:

意思是:被墻了

這咋辦?解決方法:國內鏡像!https://hf-mirror.com/ https://aliendao.cn/#/ #我用的是這個

將所有文件下載到本地后,新建文件夾,命名,在本地加載 https://hf-mirror.com/

https://aliendao.cn/#/

例如,我將其放在這個文件夾下:

然后通過cd函數將工作路徑調整到models文件夾后,就可以導入模型了:

from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained(“THUDM/chatglm3-6b”, trust_remote_code=True) model = AutoModel.from_pretrained(“THUDM/chatglm3-6b”, trust_remote_code=True).half() model = model.eval()

response, history = model.chat(tokenizer, “你好”, history=[]) print(response) 出現這樣一句話說明你成功啦!你好!我是人工智能助手 ChatGLM-6B,很高興見到你,歡迎問我任何問題。

如果報錯:DLL load failed while importing _imaging: 找不到指定的模塊的解決方法 是你安裝的庫的版本有問題,解決方法可以詳見這個帖子:https://blog.csdn.net/qq_45510888/article/details/121446878

4.更簡單,更快的部署方法:

一鍵下載安裝!一鍵本地部署!

教程:https://zhuanlan.zhihu.com/p/672400265

支持以下模型,缺點:沒有中文模型!:

這期到這里結束了,讀到這里你也發現,這個不是一個純粹的原創帖,更多是前人經驗的總結歸納和我在走前人教程中遇到的問題,希望對大家有幫助。

如何系統的去學習大模型LLM ?

作為一名熱心腸的互聯網老兵,我意識到有很多經驗和知識值得分享給大家,也可以通過我們的能力和經驗解答大家在人工智能學習中的很多困惑,所以在工作繁忙的情況下還是堅持各種整理和分享。

但苦于知識傳播途徑有限,很多互聯網行業朋友無法獲得正確的資料得到學習提升,故此將并將重要的 AI大模型資料 包括AI大模型入門學習思維導圖、精品AI大模型學習書籍手冊、視頻教程、實戰學習等錄播視頻免費分享出來

所有資料 ?? ,朋友們如果有需要全套 《LLM大模型入門+進階學習資源包》,掃碼獲取~

👉CSDN大禮包🎁:全網最全《LLM大模型入門+進階學習資源包》免費分享(安全鏈接,放心點擊)👈

?

一、全套AGI大模型學習路線

AI大模型時代的學習之旅:從基礎到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型報告合集

這套包含640份報告的合集,涵蓋了AI大模型的理論研究、技術實現、行業應用等多個方面。無論您是科研人員、工程師,還是對AI大模型感興趣的愛好者,這套報告合集都將為您提供寶貴的信息和啟示。

img

三、AI大模型經典PDF籍

隨著人工智能技術的飛速發展,AI大模型已經成為了當今科技領域的一大熱點。這些大型預訓練模型,如GPT-3、BERT、XLNet等,以其強大的語言理解和生成能力,正在改變我們對人工智能的認識。 那以下這些PDF籍就是非常不錯的學習資源。

img

在這里插入圖片描述

四、AI大模型商業化落地方案

img

階段1:AI大模型時代的基礎理解

  • 目標:了解AI大模型的基本概念、發展歷程和核心原理。
  • 內容
    • L1.1 人工智能簡述與大模型起源
    • L1.2 大模型與通用人工智能
    • L1.3 GPT模型的發展歷程
    • L1.4 模型工程
      - L1.4.1 知識大模型
      - L1.4.2 生產大模型
      - L1.4.3 模型工程方法論
      - L1.4.4 模型工程實踐
    • L1.5 GPT應用案例

階段2:AI大模型API應用開發工程

  • 目標:掌握AI大模型API的使用和開發,以及相關的編程技能。
  • 內容
    • L2.1 API接口
      - L2.1.1 OpenAI API接口
      - L2.1.2 Python接口接入
      - L2.1.3 BOT工具類框架
      - L2.1.4 代碼示例
    • L2.2 Prompt框架
      - L2.2.1 什么是Prompt
      - L2.2.2 Prompt框架應用現狀
      - L2.2.3 基于GPTAS的Prompt框架
      - L2.2.4 Prompt框架與Thought
      - L2.2.5 Prompt框架與提示詞
    • L2.3 流水線工程
      - L2.3.1 流水線工程的概念
      - L2.3.2 流水線工程的優點
      - L2.3.3 流水線工程的應用
    • L2.4 總結與展望

階段3:AI大模型應用架構實踐

  • 目標:深入理解AI大模型的應用架構,并能夠進行私有化部署。
  • 內容
    • L3.1 Agent模型框架
      - L3.1.1 Agent模型框架的設計理念
      - L3.1.2 Agent模型框架的核心組件
      - L3.1.3 Agent模型框架的實現細節
    • L3.2 MetaGPT
      - L3.2.1 MetaGPT的基本概念
      - L3.2.2 MetaGPT的工作原理
      - L3.2.3 MetaGPT的應用場景
    • L3.3 ChatGLM
      - L3.3.1 ChatGLM的特點
      - L3.3.2 ChatGLM的開發環境
      - L3.3.3 ChatGLM的使用示例
    • L3.4 LLAMA
      - L3.4.1 LLAMA的特點
      - L3.4.2 LLAMA的開發環境
      - L3.4.3 LLAMA的使用示例
    • L3.5 其他大模型介紹

階段4:AI大模型私有化部署

  • 目標:掌握多種AI大模型的私有化部署,包括多模態和特定領域模型。
  • 內容
    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的關鍵技術
    • L4.3 模型私有化部署的實施步驟
    • L4.4 模型私有化部署的應用場景

學習計劃:

  • 階段1:1-2個月,建立AI大模型的基礎知識體系。
  • 階段2:2-3個月,專注于API應用開發能力的提升。
  • 階段3:3-4個月,深入實踐AI大模型的應用架構和私有化部署。
  • 階段4:4-5個月,專注于高級模型的應用和部署。
這份完整版的所有 ?? 大模型 LLM 學習資料已經上傳CSDN,朋友們如果需要可以微信掃描下方CSDN官方認證二維碼免費領取【保證100%免費

全套 《LLM大模型入門+進階學習資源包↓↓↓ 獲取~

👉CSDN大禮包🎁:全網最全《LLM大模型入門+進階學習資源包》免費分享(安全鏈接,放心點擊)👈

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/18939.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/18939.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/18939.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

自動控制: 最小二乘估計(LSE)、加權最小二乘估計(WLS)和線性最小方差估計

自動控制: 最小二乘估計(LSE)、加權最小二乘估計(WLS)和線性最小方差估計 在數據分析和機器學習中,參數估計是一個關鍵步驟。最小二乘估計(LSE)、加權最小二乘估計(WLS&…

conda環境里安裝ffmpeg

遇到的問題 在執行腳本的時候提示: /home/xxx/anaconda3/envs/llm-asr/lib/python3.9/site-packages/pydub/utils.py:170: RuntimeWarning: Couldnt find ffmpeg or avconv - defaulting to ffmpeg, but may not workwarn("Couldnt find ffmpeg or avconv - …

wifi貼碼推廣哪家靠譜?

如今越來越多的人想輕資產創業,WIFI貼碼是共享行業最無成本的創業項目了,而在選擇廠商的時候,大家就想要知道哪家公司靠譜,更好、更便宜、可靠。那么wifi貼碼推廣哪家靠譜?別急,下面小編將帶你一起了解。 目…

OpenAI開始訓練新的前沿模型——但GPT-5至少在90天內不會推出

ChatGPT 制造商 OpenAI 今早宣布,已開始訓練其新的“前沿模型”,并成立了一個新的安全委員會,由現任董事會成員 Bret Taylor(OpenAI 董事會主席兼客戶服務初創公司 Sierra AI 聯合創始人、前谷歌地圖負責人和前 Facebook 首席技術…

BGP路由策略實驗

一、實驗拓撲 二、IP分配(骨干) R1: 0/0/0 15.0.0.1 24 0/0/1 18.0.0.2 24 0/0/2 19.0.0.1 24 R2: 0/0/0 16.0.0.1 24 0/0/1 15.0.0.2 24 R3: 0/0/0 17.0.0.2 24 0/0/1 18.0.0.1 24 R4: 0/0/0 16.0…

元宇宙vr工業產品展示空間降低研發成本

元宇宙產品虛擬展廳搭建編輯器為您提供了一個自助式元宇宙場景搭建的絕佳平臺。無論您是設計公司、攝影公司、營銷公司還是教育機構,我們都能為您量身打造專屬的元宇宙解決方案,滿足您的多樣化需求。 元宇宙產品虛擬展廳搭建編輯器具備強大的3D編輯功能&…

藍牙設備中的UUID

文章目錄 一、Device UUID二、Service UUID 一、Device UUID Device UUID也可以被稱作為DeviceID。 Android 設備上掃描獲取到的 deviceId 為外圍設備的 MAC 地址,相對固定。iOS 設備上掃描獲取到的 deviceId 是系統根據外圍設備 MAC 地址及發現設備的時間生成的 …

如何成為AI工程師

AI工程師(不是打標員)已經成為新一代的熱門崗位(高薪、有前景),無論你是計算機科學專業的學生,還是已經在其他技術領域工作的專業人士,可以通過以下幾點來大概了解如何成為AI工程師。 1. 技術技…

【吊打面試官系列】Java高并發篇 - ThreadLocal 是什么?有什么用?

大家好,我是鋒哥。今天分享關于 【ThreadLocal 是什么?有什么用?】面試題,希望對大家有幫助; ThreadLocal 是什么?有什么用? ThreadLocal 是一個本地線程副本變量工具類。主要用于將私有線程和該…

dust3r部署踩坑全記錄

目前dust3r是三維重建最新最好的技術,運用了ViT編碼器、Transformer、注意力機制、回歸等技術,無需相機參數標定。 但是我部署過程中有很多坑,記錄一下。 1.OSError: CUDA_HOME environment variable is not set. Please set it to your CU…

Itme4 對象使用前進行初始化

fun(){ int a; printf("%d\n", a); cout << a << endl; //會報錯 使用了未初始化的變量a } //若a是全局變量則不會報錯 會默認初始化為0 在對象中優先使用初始化列表&#xff1a; ABEntry::ABEntry(const std::string& name, const std::string&…

數字工廠管理系統可以和哪些軟件集成

隨著工業4.0時代的到來&#xff0c;數字工廠管理系統已成為制造業轉型升級的核心驅動力。數字工廠管理系統通過集成各種軟件和技術&#xff0c;實現了生產過程的數字化、網絡化和智能化&#xff0c;大大提高了生產效率和管理水平。本文將探討數字工廠管理系統可以與哪些軟件集成…

Axure RP軟件漢化操作步驟

隨著互聯網產業的發展&#xff0c;設計師已經成為一個越來越受歡迎的職業&#xff0c;設計軟件已經成為設計師必不可少的工具。說到設計軟件&#xff0c;不得不說的是 Axure rp &#xff0c;越來越多的設計師使用它來設計產品原型&#xff0c;作為美國 Axure Software Solution…

OrangePi Kunpeng Pro體驗——安裝Hass與驅動SPI小屏幕

OrangePi Kunpeng Pro 是一款面向開發者和愛好者的高性能開發板。在本次測評中&#xff0c;主要將以前的一些代碼在該開發板上實現&#xff0c;包括docker部署hass&#xff0c;引腳驅動SPI小屏幕。中間遇到了一些小小問題&#xff0c;但都成功了&#xff0c;一起來試試吧~ 一、…

IDM有哪些優勢?

IDM&#xff08;Internet Download Manager&#xff09;作為一款功能強大的文件下載工具&#xff0c;其優勢主要體現在以下幾個方面&#xff1a; 高速下載&#xff1a; IDM采用動態分段算法&#xff0c;將文件分成多個段同時下載&#xff0c;從而顯著加快了下載速度。支持從多個…

刪除中間節點

題目鏈接 刪除中間節點 題目描述 注意點 node既不是鏈表頭節點&#xff0c;也不是鏈表尾節點 解答思路 將當前節點的值替換為下一個節點的值&#xff0c;并將當前節點的next指針設置為下一個節點的next指針&#xff0c;可以理解為刪除了當前節點 代碼 /*** Definition f…

考研計組chap1計算機系統概述

目錄 一、計算機發展歷程(不考了) 二、計算機硬件的基本組成 3 1.五個部分 &#xff08;1&#xff09;輸入設備 &#xff08;2&#xff09;控制器 &#xff08;3&#xff09;運算器 &#xff08;4&#xff09;&#xff08;主&#xff09;存儲器 &#xff08;5&#xff0…

c語言基于mmap實現的內存池

文章目錄 0. 概要1. mmap基礎2. 為什么使用內存池&#xff1f;3. 使用示例4. 設計考慮5. 實現步驟 0. 概要 c語言基于mmap實現的內存池模塊 倉庫地址&#xff1a; https://gitee.com/liudegui/mem_allocator_c 1. mmap基礎 mmap系統調用在進程的虛擬地址空間和某個文件對象或…

doxygen 1.11.0 使用詳解(十四)——輸出格式

目錄 HTMLLATEXMan pagesRTFXMLDocBookCompiled HTML Help (a.k.a. Windows 98 help)Qt Compressed Help (.qch)Eclipse HelpXCode DocSetsPostScriptPDF The following output formats are directly supported by doxygen: HTML Generated if GENERATE_HTML is set to YES i…

時政|共享員工

概念 有人稱“共享員工”就是變相的“勞務派遣”“外包”“臨時工”&#xff0c;是對勞動者的變相壓榨。專家表示&#xff0c;應從根源上理清“共享員工”的概念&#xff0c;否則會破壞正常的勞動合同秩序&#xff0c;無法讓勞動者的合法權益得到有效保障。“共享員工”是指企…