Linux搭建text-generation-webui框架，安裝通義千問大模型，開放對外api，voxta測試對話圖文教程

text-generation-webui部分

開放對外API

通義千問部分

遠程API對話測試部分

text-generation-webui部分

本來不想發這個文章的，但是自己部署的時候看了挺多人的帖子，很多發的不全面，要么就是跟著他們流程走有些小問題啥的，這回我自己在網上和代碼里研究了一下。

首先下載項目包：https://github.com/oobabooga/text-generation-webui

你自己用git克隆還是直接下zip隨意

?解壓之后，你的文件結構是這樣的，這里我為了方便給看清文件結構，用windows截得圖。

?windows也能安，而且我認為windows更容易安

我用紅框標注了我們要使用的文件

如果你是win系統，那么就啟動start_windows.bat，如果你是linux，就切換到目標目錄下，執行./start_linux.sh

這里截圖依舊先用windows舉例，因為他前兩個詢問是一樣的?

他會問你你的顯卡是什么型號的，你CUDA版本需不需要安裝12.1，我推薦，服務器最好是N卡，也最好是N卡

如果N卡，第一個問題答A選項，第二個問題必點N

接下來會執行安裝CUDA等環境，不過你90%概率是會報錯的。

報錯不要慌，你再啟動start命令是啟動不來的了，接下來要執框里那個cmd命令

這個命令是讓你進入到text-generation-webui自動給你配好的虛擬環境執行命令用的，你要下載什么包，需要進入env里來執行命令，之前我們用start命令首次啟動自動安裝環境的時候，他非常大的概率會報錯，無非就是環境沒下全，依賴沒下全，那么要修復他，需要手動安裝依賴。

執行命令pip install -r requirements.txt（注意一定要用cmd進入到env虛擬環境里執行）

我下面截圖是因為我環境安裝過了，所以沒有那么多下載了，正常你pip install，是會進行很多下載的

這里面還有個坑，而且是很大的坑，如果在pip安裝依賴的時候，你報紅字了，別擔心，基本上99%概率網絡問題，他這個text-generation-webui只要你下的是官方最新的包，你執行start命令的時候無論虛擬環境還是python3.11和cuda，他都是給你對應好的，或者說你要是擔心就自己下個python3.11，所以不存在他的requirements.txt文件有問題啥的，那么報紅字，基本上不是timeout，就是HTTP啥啥啥的，就是網速問題，這玩意純看臉，一次不行就多次，遲早能下載下來，windows好解決是windows可以魔法上網，能解決網的問題

關于他項目里有好多requirements你分不清，可以查看官方文檔里有說明，一般用requirements.txt那個就行

pip安裝依賴全下下來完全沒紅字后，基本上就不會有問題了，你整套已經搭建起來了

接下來測試啟動，依舊還是用start命令

出現URL說明已經啟動成功了，如果報錯，那么繼續進入env里pip安裝requirements文件內容

開放對外API

如果已經看到啟動成功后，那么我們進行下一部，對外api

我們看到他的url地址是127.0.0.1地址，但是這個地址是不對外開放的，在我們已解決防火墻的問題之后我們要讓他以0.0.0.0來啟動，其他好多文章都說什么用其他方式做轉發，其實沒那么麻煩，我們要設置一個配置文件就可以解決

打開文件，開始只有三行注釋，意思讓你自己配置監聽ip、端口和對外api，這里我們端口沒必要改，當然你要想設置其他端口，添加listen-port就行，這里我默認7860端口webui頁面，5000端口對外api

改完保存，再重新啟動?

OK我們的web頁面和api都啟動了，用telnet測試一下。這里我直接用我本地電腦連接服務器的web頁面進行測試，可以看到我們的頁面已經進來了，完全沒問題

通義千問部分

那么下一步，安裝文本大模型，這里我選擇通義千問，如果你有其他想部署的隨便挑

我們先去huggingface網站去挑選我們想要安裝的模型

地址：https://huggingface.co/models

這里我搜索的千問2.5，由于我只是調試測試用，所以不用安72B那么大的，建議了解大模型72B，32B等區別，顯存不高的不是給你那么玩的

我挑選的7B

?記住這個地址結構，因為我們要在web頁面下載用

來到web頁面，選擇model，按照他提示的格式寫，點下載

我們看報錯了，網連不上，這也就是我說的windows安裝比linux省事多了

?那么我們自己直接把model文件下載到本地然后上傳到服務器

我這里已經上傳完解壓完了

那么我們回到web頁面，可以看到model中有顯示了

選擇模型，點右側按鈕加載，看控制臺加載過程

?如果加載成功他會顯示success load

接下來測試chat對話，測試成功

遠程API對話測試部分

那么下一步，我們要用VOXTA測試下遠程連接API可不可以對話，這里先簡單說下VOXTA，VOXTA是簡單的把文本轉換成語音式的一個服務，特色是他的AI有角色卡，可以設定AI的身份，年齡，性格特征，看起來像活生生的一個人，具體VOXTA是給哪個方面服務的，這里不方便說，大家懂的都懂。😁😁😁😁😁

啟動VOXTA，點右上角插件配置

在TEXT生成那個插件，設置，因為我們用的是text-generation-webui框架，所以配置也是加這個，如果沒有下面Add服務然后添加就好了

設置我們的遠程API

這里測試對話成功，而且是語音輸出，由于文案看不到語音結果，所以截圖看不出了大家知道可以完全語音交互了就行

?到這里我們整套流程就結束了😁😁😁😁😁😁😁😁😁😁😁😁

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/64074.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/64074.shtml
英文地址，請注明出處：http://en.pswp.cn/web/64074.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！