Linux搭建text-generation-webui框架,安裝通義千問大模型,開放對外api,voxta測試對話圖文教程

目錄

text-generation-webui部分

開放對外API

通義千問部分

遠程API對話測試部分


text-generation-webui部分

本來不想發這個文章的,但是自己部署的時候看了挺多人的帖子,很多發的不全面,要么就是跟著他們流程走有些小問題啥的,這回我自己在網上和代碼里研究了一下。

首先下載項目包:https://github.com/oobabooga/text-generation-webui

你自己用git克隆還是直接下zip隨意

?解壓之后,你的文件結構是這樣的,這里我為了方便給看清文件結構,用windows截得圖

?windows也能安,而且我認為windows更容易安

我用紅框標注了我們要使用的文件

如果你是win系統,那么就啟動start_windows.bat,如果你是linux,就切換到目標目錄下,執行./start_linux.sh

這里截圖依舊先用windows舉例,因為他前兩個詢問是一樣的?

他會問你你的顯卡是什么型號的,你CUDA版本需不需要安裝12.1,我推薦,服務器最好是N卡,也最好是N卡

如果N卡,第一個問題答A選項,第二個問題必點N

接下來會執行安裝CUDA等環境,不過你90%概率是會報錯的。

報錯不要慌,你再啟動start命令是啟動不來的了,接下來要執框里那個cmd命令

這個命令是讓你進入到text-generation-webui自動給你配好的虛擬環境執行命令用的,你要下載什么包,需要進入env里來執行命令,之前我們用start命令首次啟動自動安裝環境的時候,他非常大的概率會報錯,無非就是環境沒下全,依賴沒下全,那么要修復他,需要手動安裝依賴。

執行命令pip install -r requirements.txt(注意一定要用cmd進入到env虛擬環境里執行

我下面截圖是因為我環境安裝過了,所以沒有那么多下載了,正常你pip install,是會進行很多下載的

這里面還有個坑,而且是很大的坑,如果在pip安裝依賴的時候,你報紅字了,別擔心,基本上99%概率網絡問題,他這個text-generation-webui只要你下的是官方最新的包,你執行start命令的時候無論虛擬環境還是python3.11和cuda,他都是給你對應好的,或者說你要是擔心就自己下個python3.11,所以不存在他的requirements.txt文件有問題啥的,那么報紅字,基本上不是timeout,就是HTTP啥啥啥的,就是網速問題,這玩意純看臉,一次不行就多次,遲早能下載下來,windows好解決是windows可以魔法上網,能解決網的問題

關于他項目里有好多requirements你分不清,可以查看官方文檔里有說明,一般用requirements.txt那個就行

pip安裝依賴全下下來完全沒紅字后,基本上就不會有問題了,你整套已經搭建起來了

接下來測試啟動,依舊還是用start命令

出現URL說明已經啟動成功了,如果報錯,那么繼續進入env里pip安裝requirements文件內容

開放對外API

如果已經看到啟動成功后,那么我們進行下一部,對外api

我們看到他的url地址是127.0.0.1地址,但是這個地址是不對外開放的,在我們已解決防火墻的問題之后我們要讓他以0.0.0.0來啟動,其他好多文章都說什么用其他方式做轉發,其實沒那么麻煩,我們要設置一個配置文件就可以解決

打開文件,開始只有三行注釋,意思讓你自己配置監聽ip、端口和對外api,這里我們端口沒必要改,當然你要想設置其他端口,添加listen-port就行,這里我默認7860端口webui頁面,5000端口對外api

改完保存,再重新啟動?

OK我們的web頁面和api都啟動了,用telnet測試一下。這里我直接用我本地電腦連接服務器的web頁面進行測試,可以看到我們的頁面已經進來了,完全沒問題

通義千問部分

那么下一步,安裝文本大模型,這里我選擇通義千問,如果你有其他想部署的隨便挑

我們先去huggingface網站去挑選我們想要安裝的模型

地址:https://huggingface.co/models

這里我搜索的千問2.5,由于我只是調試測試用,所以不用安72B那么大的,建議了解大模型72B,32B等區別,顯存不高的不是給你那么玩的

我挑選的7B

?記住這個地址結構,因為我們要在web頁面下載用

來到web頁面,選擇model,按照他提示的格式寫,點下載

我們看報錯了,網連不上,這也就是我說的windows安裝比linux省事多了

?那么我們自己直接把model文件下載到本地然后上傳到服務器

我這里已經上傳完解壓完了

那么我們回到web頁面,可以看到model中有顯示了

選擇模型,點右側按鈕加載,看控制臺加載過程

?

?如果加載成功他會顯示success load

接下來測試chat對話,測試成功

遠程API對話測試部分

那么下一步,我們要用VOXTA測試下遠程連接API可不可以對話,這里先簡單說下VOXTA,VOXTA是簡單的把文本轉換成語音式的一個服務,特色是他的AI有角色卡,可以設定AI的身份,年齡,性格特征,看起來像活生生的一個人,具體VOXTA是給哪個方面服務的,這里不方便說,大家懂的都懂。😁😁😁😁😁

啟動VOXTA,點右上角插件配置

在TEXT生成那個插件,設置,因為我們用的是text-generation-webui框架,所以配置也是加這個,如果沒有下面Add服務然后添加就好了

設置我們的遠程API

這里測試對話成功,而且是語音輸出,由于文案看不到語音結果,所以截圖看不出了大家知道可以完全語音交互了就行

?到這里我們整套流程就結束了😁😁😁😁😁😁😁😁😁😁😁😁

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/64074.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/64074.shtml
英文地址,請注明出處:http://en.pswp.cn/web/64074.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

QT程序發布后,mysql在其它電腦設備無法連接數據庫

QT程序發布后,mysql在其它電腦設備無法連接數據庫 D:\mysql-5.7.24-winx64\lib, mysql-5.7.24-winx64是一個壓縮包,用于啟動mysql服務,創建數據庫 壓縮包 解決方法: 拷貝庫到exe的相同目錄,libmysql.dll,libmysql.li…

ElasticSearch 的核心功能

要深入理解 ElasticSearch 的核心功能,需要全面掌握其 全文搜索、分析、聚合 和 索引生命周期管理(ILM) 的設計原理和實際應用。 1. 全文搜索 ElasticSearch 的全文搜索是其核心功能之一,依賴于倒排索引和強大的分詞、相關性評分…

在Nginx部署Web應用,如何保障后端API的安全

1. 使用HTTPS和http2.0 參考:Nginx配置HTTP2.0_nginx 支持 2.0-CSDN博客 2. 設置嚴格的CORS策略 通過add_header指令設置CORS頭。 只允許來自https://frontend.yourdomain.com的請求訪問API location /api/ {if ($http_origin ~* (https://frontend\.yourdomai…

Nginx單向鏈表 ngx_list_t

目錄 基本概述 數據結構 接口描述 具體實現 ngx_list_create ngx_list_init ngx_list_push 使用案例 整理自 nginx 1.9.2 源碼 和 《深入理解 Nginx:模塊開發與架構解析》 基本概述 Nginx 中的 ngx_list_t 是一個單向鏈表容器,鏈表中的每一個節…

es快速掃描

介紹 Elasticsearch簡稱es,一款開源的分布式全文檢索引擎 可組建一套上百臺的服務器集群,處理PB級別數據 可滿足近實時的存儲和檢索 倒排索引 跟正排索引相對,正排索引是根據id進行索引,所以查詢效率非常高,但是模糊…

軟件需求建模方法

軟件需求建模是一個涉及多個學科的領域,其研究方向廣泛且多樣。以下是一些主要的研究方向: 1. 需求工程方法:研究如何更有效地收集、分析、規格化和驗證軟件需求。這包括新的需求工程方法論和工具的開發。 2. 需求管理:關注需求…

軟件項目需求分析的實踐探索(1)

一、項目啟動與規劃 組建團隊 包括項目經理、系統分析師、業務分析師以及可能涉及的最終用戶代表和領域專家等。例如,開發一個醫療管理軟件,就需要有醫療行業的專家參與,確保對醫療業務流程有深入理解。明確各成員的職責,如系統分…

wordpres當前分類調用父分類的名稱和鏈接

在WordPress中&#xff0c;如果你想在當前分類頁面調用并顯示父分類的名稱和鏈接&#xff0c;你可以使用以下代碼片段&#xff1a; <?php // 獲取當前分類的ID $cat_id get_queried_object_id();// 獲取當前分類的父分類ID $parent_id get_term($cat_id, category)->…

前端Python應用指南(三)Django vs Flask:哪種框架適合構建你的下一個Web應用?

《寫給前端的python應用指南》系列&#xff1a; &#xff08;一&#xff09;快速構建 Web 服務器 - Flask vs Node.js 對比&#xff08;二&#xff09;深入Flask&#xff1a;理解Flask的應用結構與模塊化設計 在上一篇博文中&#xff0c;我們深入探討了Flask框架&#xff0c;…

網絡管理-期末項目(附源碼)

環境&#xff1a;網絡管理 主機資源監控系統項目搭建 &#xff08;保姆級教程 建議點贊 收藏&#xff09;_搭建網絡版信息管理系統-CSDN博客 效果圖 下面3個文件的項目目錄(python3.8.8的虛擬環境) D:\py_siqintu\myproject5\Scripts\mytest.py D:\py_siqintu\myproject5\Sc…

MySQL 常用程序介紹

以下是一些常用的MySQL程序&#xff1a; 程序名作?mysqldMySQL的守護進程即 MySQL 服務器&#xff0c;要使?MySQL 服務器 mysqld必須正在運?狀態mysql MySQL客?端程序&#xff0c;?于交互式輸? SQL 語句或以批處理模式從?件執?SQL的命令??具 mysqlcheck?于檢查、修…

Redis篇--常見問題篇4--大Key(Big Key,什么是大Key,影響及使用建議)

1、概述 大Key&#xff1a;通常是指值&#xff08;Value&#xff09;的長度非常大&#xff0c;實際上鍵&#xff08;Key&#xff09;長度很大也算。通常來說&#xff0c;鍵本身不會很長&#xff0c;占用的內存較少&#xff0c;因此判斷一個鍵是否為bigKey主要看它對應的值的大…

云手機+YouTube:改變通信世界的劃時代技術

隨著科技的不斷進步&#xff0c;手機作為人們生活中不可或缺的工具&#xff0c;也在不斷地更新換代。近年來&#xff0c;一個名為“油管云手機”的全新產品正在引起廣泛的關注和討論。作為一個運用最新科技實現的新型手機&#xff0c;它在通信領域帶來了全新的體驗和革命性的變…

ModbusTCP從站轉Profinet主站案例

一. 案例背景 在復雜的工業自動化場景中&#xff0c;企業常常會采用不同品牌的設備來構建生產系統。西門子SINAMICS G120變頻器以其高性能、高精度的速度和轉矩控制功能&#xff0c;在電機驅動領域應用廣泛。施耐德M580可編程邏輯控制器則以強大的邏輯控制和數據處理能力著稱&…

JS 函數的定義與調用

文章目錄 1. 普通函數-無形參2. 普通函數-有形參3. 普通函數-參數默認值4. 普通函數-返回值5. 立即執行函數6. 匿名函數7. 箭頭函數8. 函數提升 1. 普通函數-無形參 函數定義時沒有指定形參, 調用時仍然可以向其傳遞參數, 通過默認參數 arguments 獲取, arguments 是一個偽數組…

MySQL的索引失效的原因有那些

1. 數據類型不匹配 詳細說明&#xff1a;MySQL在比較不同數據類型的值時&#xff0c;可能會嘗試進行隱式轉換。如果這種轉換導致了復雜度增加或無法直接利用索引&#xff0c;則會導致索引失效。 實例與解決方案&#xff1a; -- 錯誤示例&#xff1a;數據類型不匹配 select *…

邁向未來:.NET技術的持續創新與發展前景

隨著信息技術的飛速發展&#xff0c;編程語言和開發框架不斷涌現&#xff0c;許多技術平臺以其獨特的優勢贏得了開發者的青睞。在這場技術的競爭中&#xff0c;.NET平臺憑借其卓越的性能、廣泛的生態系統以及持續創新的精神&#xff0c;成為了全球開發者的重要選擇。本文將探討…

微信小程序-基于Vant Weapp UI 組件庫的Area 省市區選擇

Area 省市區選擇&#xff0c;省市區選擇組件通常與 彈出層 組件配合使用。 areaList 格式 areaList 為對象結構&#xff0c;包含 province_list、city_list、county_list 三個 key。 每項以地區碼作為 key&#xff0c;省市區名字作為 value。地區碼為 6 位數字&#xff0c;前兩…

Canvas指定三角形內部生成隨機點

使用重心坐標&#xff08;barycentric coordinates&#xff09;或者通過面積比例的方法來確定點是否在三角形內。不過&#xff0c;對于簡單的應用&#xff0c;一種常見的方法是使用隨機點并檢查它們是否在三角形內部。如果不在&#xff0c;就重新生成&#xff0c;直到得到足夠數…

智駕感知「大破局」!新一輪混戰開啟

隨著智能駕駛搭載率的攀升&#xff0c;艙外傳感器賽道迎來新變局。 一方面&#xff0c;從近幾年智駕傳感器的配置變化來看&#xff0c;攝像頭的主導地位顯而易見。 12月10-12日&#xff0c;由德賽西威總冠名的2024&#xff08;第八屆&#xff09;高工智能汽車年會暨年度金球獎…