快速在WIN11中本地部署chatGLM3

具體請看智譜倉庫github:GitHub - THUDM/ChatGLM3: ChatGLM3 series: Open Bilingual Chat LLMs | 開源雙語對話語言模型

或者Huggingface:https://huggingface.co/THUDM/chatglm3-6b

1. 利用Anaconda建立一個虛擬環境:

conda create -n chatglm3 python=3.11 (版本太低安裝streamlit會出問題)
conda activate chatglm3

2. 安裝torch的GPU版:

根據自己本地計算機顯卡和系統選擇官方上相應的指令:

conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

這塊安裝時間較長,耐心等待,反復嘗試,直到安裝成功為止。其中,需要測試一下GPU的CUDA功能是否可以正常使用:

print(torch.version.cuda)	#查看cuda版本
print(torch.cuda.is_available())  # 查看cuda是否可用
print(torch.cuda.device_count())  # 查看可行的cuda數目

如果以上指令運行沒問題,顯示True,說明可以GPU可以正常使用。

3.開始安裝ChatGLM3,根據以上官網地址的說明進行如下操作:

? ? ?選擇D盤或者其他盤建立一個本地文件,利用管理員權限打開一個cmd窗口運行如下命令:

git clone https://github.com/THUDM/ChatGLM3
cd ChatGLM3

然后使用 pip 安裝依賴:

pip install -r requirements.txt

此外,使用 Code Interpreter 還需要安裝 Jupyter 內核:

ipython kernel install --name chatglm3-demo --user

然后,進入basic_demo目錄下,實現三種新的樣例測試

? ? 1)案例1——指令窗口

運行如下指令:

python cli_demo.py

指令對話窗口案例2:

? ? 2)?案例2——Gradio

? ? ? ?運行如下命令:

python web_demo.py

注意:如果不輸出結果,是由于Gradio的版本過高,建議安裝pip install gradio==3.40版本。太低會報錯,比如3.39版本。

? ?3) 案例3——streamlit

? ? ? ?運行如下命令:

streamlit run web_demo2.py

其中,需要修改一下路徑,將下載好的模型放到本目錄下,將第6行程序改為

將MODEL_PATH = os.environ.get('MODEL_PATH', 'THUDM/chatglm3-6b')改為
MODEL_PATH = os.environ.get('MODEL_PATH', '../chatglm3-6b')

這樣所有的程序和模型都在一起,方便管理。

程序啟動之后,瀏覽器顯示如下:

安裝過程中一些注意事項:

  • 遇到“RuntimeError: nvrtc: error: failed to open nvrtc-builtins64_121.dll.
    ? Make sure that nvrtc-builtins64_121.dll is installed correctly.”

需要將虛擬環境下的“nvrtc-builtins64_121.dll”文件拷貝到C:\Windows\System32目錄下,即可解決。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/165218.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/165218.shtml
英文地址,請注明出處:http://en.pswp.cn/news/165218.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

2023全球數字貿易創新大賽-人工智能元宇宙-11-12,數據二十條,數字產業化和產業數字化

目錄 長沙千博信息技術有限公司-手語翻譯 數據二十條 數字產業化和產業數字化

java--static的應用知識:單例設計模式

1.什么是設計模式(Design pattern) ①一個問題通常有n中解法,其中肯定有一種解法最優的,這個最優的解法被人總結出來了,稱之為設計模式。 ②設計模式有20多種,對應20多種軟件開發中會遇到的問題。 2.單例設計模式 確保一個類只…

Linux安裝與配置Maven

案例中Linux版本為CentOS7.9,安裝目錄為 /root/software/ 1、使用 wget 命令從官網下載安裝包(https://maven.apache.org/download.cgi) wget https://dlcdn.apache.org/maven/maven-3/3.9.5/binaries/apache-maven-3.9.5-bin.tar.gz2、解壓…

搭建線上jvm監控

這里寫目錄標題 Springboot項目配置maven依賴application.properties添加監控JVM的配置類啟動springboot項目 Prometheus配置配置grafana Springboot項目配置 maven依賴 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring…

mac mysql連接中斷重新啟動辦法

遇到如圖所示問題&#xff0c;可以用下面的命令重啟mysql服務 sudo /usr/local/mysql/support-files/mysql.server start

詳解分布式微服務架構

目錄 一、微服務簡介 1、分布式微服務架的誕生 2、微服務架構與SOA架構的區別 3、微服務框架引來的問題 二、服務通信 RESTful API&#xff1a; 消息隊列&#xff08;如RabbitMQ、Kafka&#xff09;&#xff1a; gRPC&#xff1a; GraphQL&#xff1a; Service Mesh&…

Vector - CANoe - Vector Hardware Manager以太網

前面的文章中有介紹過基于Network based mode和channel base mode的環境配置&#xff0c;不過我們都是使用比較舊的辦法&#xff0c;在我使用了一段時間Vector Hardware Manager配置之后發現這個更加好用結合之前的配置方法&#xff0c;使用起來也更加的靈活&#xff0c;今天就…

HTML的學習

知己知彼百戰不殆 打算學習一下javascript 所以先從基礎的html語言開始 其實就是頭部 和身體 頭部控制整個 html的語言 title等 <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"width…

61 權限提升-RedisPostgre令牌竊取進程注入

目錄 演示案例:Redis數據庫權限提升-計劃任務PostgreSQL數據庫權限提升Windows2008&7令牌竊取提升-本地Windows2003&10進程注入提升-本地pinjector進程注入工具針對-win2008以前操作系統pexec64 32進程注入工具針對-win2008及后操作系統- (佛系) 涉及資源: postgersql是…

面試送分題!“商品分類瀏覽”如何測試?

電商項目無論是工作中&#xff0c;還是面試中&#xff0c;都是一個高頻出現的詞。 面試官非常熱衷提問關于電商項目的問題。例如商品分類怎么測試&#xff1f;購物車怎么測試&#xff1f;訂單怎么測試&#xff1f;優惠券怎么測試&#xff1f;支付怎么測試&#xff1f;等等。 …

深度學習技術前沿:探索與挑戰

深度學習技術前沿&#xff1a;探索與挑戰 一、引言 近年來&#xff0c;深度學習作為人工智能領域的重要分支&#xff0c;取得了令人矚目的成就。它憑借強大的學習能力和出色的性能&#xff0c;在圖像識別、語音識別、自然語言處理等眾多任務中展現出巨大潛力。本文將深入探討深…

Vue 2.0源碼分析-new Vue 發生了什么?

從入口代碼開始分析&#xff0c;我們先來分析 new Vue 背后發生了哪些事情。我們都知道&#xff0c;new 關鍵字在 Javascript 語言中代表實例化是一個對象&#xff0c;而 Vue 實際上是一個類&#xff0c;類在 Javascript 中是用 Function 來實現的&#xff0c;來看一下源碼&…

Hive csv文件導入Hive

一、如何把csv文件導入Hive (1) 在Hive中建立與csv相對應的表 create table if not exists tmp.tmp_wenxin_20231123 (redeem_code_id string comment ) ROW FORMAT DELIMITED FIELDS TERMINATED BY , STORED AS TEXTFILE;創建了一張名為tmp_wenxin_20231123的hive表&am…

Ubuntu 22.04安裝vscode

要在Ubuntu 22.04安裝vscode&#xff0c;請完成這些步驟。 首先apt命令更新軟件包索引并安裝導入微軟GPG密鑰的依賴軟件。 更新&#xff0c;近期內執行過可忽略 sudo apt update安裝工具包 sudo apt install software-properties-common apt-transport-https curl當導入GPG后…

jupyter notebook 不知道密碼,怎么登錄解決辦法

jupyter notebook 不知道密碼&#xff0c;怎么登錄解決辦法 1、 windows下&#xff0c;打開命令行&#xff0c;輸入jupyter notebook list &#xff1a; C:\Users\tom>jupyter notebook list Currently running servers: http://localhost:8888/?tokenee8bb2c28a89c8a24d…

【LeetCode刷題-鏈表】--61.旋轉鏈表

61.旋轉鏈表 方法&#xff1a; 記給定的鏈表的長度為n,注意當向右移動的次數k>n時&#xff0c;僅需要向右移動k mod n次即可&#xff0c;因為每n次移動都會讓鏈表變為原狀 將給定的鏈表連接成環&#xff0c;然后將指定位置斷開 /*** Definition for singly-linked list.*…

Nginx模塊開發之http handler實現流量統計(1)

文章目錄 一、handler簡介二、Nginx handler模塊開發2.1、示例代碼2.2、編寫config文件2.3、編譯模塊到Nginx源碼中2.4、修改conf文件2.5、執行效果 三、Nginx的熱更新總結 一、handler簡介 Handler模塊就是接受來自客戶端的請求并產生輸出的模塊。 配置文件中使用location指令…

HBuilderX前端軟件社區+Thinkphp后端源碼

HBuilderX前端軟件社區thinkphp后端源碼&#xff0c;搭建好后臺在前端找到 util 這個文件把兩個js文件上面的填上自己的域名&#xff0c;登錄HBuilderX賬號沒有賬號就注冊賬號然后上傳文件即可。打包選擇發行 可以打包app或h5等等 后端設置運行目錄為public(重要)&#xff0c;…

大語言模型——BERT和GPT的那些事兒

前言 自然語言處理是人工智能的一個分支。在自然語言處理領域&#xff0c;有兩個相當著名的大語言模型——BERT和GPT。兩個模型是同一年提出的&#xff0c;那一年BERT以不可抵擋之勢&#xff0c;讓整個人工智能屆為之震動。據說當年BERT的影響力是GPT的十倍以上。而現在&#…

PCIE鏈路訓練-狀態機描述2

Configuration.Lanenum.Accept 如果use_modified_TS1_TS2_Ordered_Set為1&#xff0c;需要注意&#xff1a; &#xff08;1&#xff09;tx需要發送Modified TS1而不是正常的TS1&#xff1b; &#xff08;2&#xff09;rx端必須檢查是否收到Modified TS1&#xff08;注意一開…