利用docker一鍵部署LLaMa到自己的Linux服務器,有無GPU都行、可以指定GPU數量、支持界面對話和API調用,離線本地化部署包含模型權重合并

利用docker一鍵部署LLaMa到自己的Linux服務器,有無GPU都行、可以指定GPU數量、支持界面對話和API調用,離線本地化部署包含模型權重合并。兩種方式實現支持界面對話和API調用,一是通過搭建text-generation-webui。二是通過llamma.cpp轉換模型為轉換為 GGUF 格式,使用 quantize 量化模型,使用 llama.cpp 運行 GGUF 模型。

在這里插入圖片描述

斯坦福大學的Alpaca-lora模型的本地化部署,并驗證了實際的推理效果,總體感覺并不是特別理想,原始Alpaca-lora模型對中文支持并不好,用52k的中文指令集對模型進行fine-tuning之后,效果依然達不到網上說的媲美GPT-3.5的推理效果,驗證了那句話:“事不目見耳聞,而臆斷其有無,可乎?”。在具有3塊Tesla P40顯卡的服務器上,利用3塊GPU顯卡加載模型參數和計算,進行一次簡單的推理(非數學運算和邏輯運算)也需要大概30s-1min的時間,效率簡直慢的驚人,雖然用中文數據集對模型進行了fine-tuning,然而對中文的支持也并不是很好,經常會出現亂碼、重復問題、詞不達意等情況。

當時大模型也同雨后春筍般的層出不窮,各個大廠和科研機構都推出了自己的大模型,其中基于LLaMA(開源且好用)的最多,所以決定再看看其他模型,有沒有推理效果好,中文支持好,同時推理效率高的模型。經過篩選,Vicuna-13B的推理效果據說達到了ChatGPT的90%以上的能力?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/696977.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/696977.shtml
英文地址,請注明出處:http://en.pswp.cn/news/696977.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Leetcode日記 889. 根據前序和后序遍歷構造二叉樹

Leetcode日記 889. 根據前序和后序遍歷構造二叉樹 給定兩個整數數組,preorder 和 postorder ,其中 preorder 是一個具有 無重復 值的二叉樹的前序遍歷,postorder 是同一棵樹的后序遍歷,重構并返回二叉樹。 如果存在多個答案&#…

【Flink集群RPC通訊機制(三)】AkkaRpcActor設計與實現:接收RPC消息以及處理邏輯

文章目錄 1. 創建Receiver2. 進行消息處理 RPC請求發送后接收方的處理邏輯 在RpcEndpoint中創建的RemoteRpcInvocation消息,最終會通過Akka系統傳遞到被調用方。例如TaskExecutor向ResourceManager發送SlotReport請求的時候,會在TaskExecutor中將Resourc…

petalinux_zynq7 驅動DAC以及ADC模塊之二:petalinux

petalinux_zynq7 C語言驅動DAC以及ADC模塊之一:建立IPhttps://blog.csdn.net/qq_27158179/article/details/136234296在上一篇,建立了ADC和DAC兩個IP。這里繼續。本文在 petalinux默認配置的基礎上,添加了python和qt。再編譯出sdk可以給x86主…

汽車智能座艙中 顯示屏市場戰略趨勢分析 中篇

今天主要講講主流車廠顯示屏的趨勢。 主流車廠的中控&液晶儀表屏的尺寸及趨勢匯總 奔馳 奔馳A級 10.2510.25 奔馳C級 12.310.25 奔馳GLA 10.2510.25 奔馳E級 12.312.3 奔馳S級 12.312.8 1、奔馳的儀表幾乎都為液晶儀表,幾乎所有車型都有HUD的選配&#xff…

大功率應用中的厚膜電阻散熱器的設計?

在許多大功率應用中,例如電機和電源,電源電阻器位于主電源線中。它們的目的是防止損壞或提供一定程度的控制。 在這些應用中,電阻器承受恒定的、相對較高的電流。當電流流過電阻器時,它會產生熱量。這種熱能必須消散到環境中&…

1、WEB攻防-通用漏洞SQL注入MYSQL跨庫ACCESS偏移

用途:個人學習筆記,歡迎指正! 前言: 為了網站和數據庫的安全性,MYSQL 內置有 ROOT 最高用戶,劃分等級,每個用戶對應管理一個數據庫,這樣保證無不關聯,從而不會影響到其他…

Autosar-WdgM配置詳解-3

1.11生成代碼解析 1.11.1MasterSWC代碼解析 在MasterSWC的RE_TestRun這個runnable里會調用兩個檢測點函數,我們可以在兩個檢測點函數之間,加入我們所需要監控的代碼。 ?Rte_Call_RPort_StartCheckPoint_CheckpointReached(); ?Rte_Call_RPort_EndCheckPoint_CheckpointReac…

C#串口 Modbus通訊工具類

一、安裝Modbus包 二、創建modbushelper類 1、打開串口 public bool IfCOMOpend; //用于實例內的COM口的狀態 public SerialPort OpenedCOM;//用于手動輸入的COM轉成SERIAL PORT /// <summary> /// 打開串口 /// </summary> /// <param name="COMname&quo…

unity小工具-非實時的值變化監聽器

項目里有代碼專門監聽網絡環境的變化&#xff0c;特別是在下載中&#xff0c;如果遇到斷網或者切換為移動網絡&#xff0c;可能需要觸發提醒等等。這種需求可能是通用的&#xff0c;于是便寫了一個通用的監聽代碼。是 using System; using System.Collections; using System.C…

c++服務器開源項目Tinywebserver運行

c服務器開源項目Tinywebserver運行 一、Tinywebserver介紹二、環境搭建三、構建數據庫四、編譯Tinywebserver五、查看效果 Tinywebserver是github上一個十分優秀的開源項目&#xff0c;幫助初學者學習如何搭建一個服務器。 本文講述如何在使用mysql跟該項目進行連接并將項目運行…

python 層次分析(AHP)

文章目錄 一、算法原理二、案例分析2.1 構建指標層判斷矩陣2.2 求各指標權重2.2.1 算術平均法&#xff08;和積法&#xff09;2.2.2 幾何平均法&#xff08;方根法&#xff09; 2.3 一致性檢驗2.3.1 求解最大特征根值2.3.2 求解CI、RI、CR值2.3.3 一致性判斷 2.4 分別求解方案層…

利用Ubuntu22.04啟動U盤對電腦磁盤進行格式化

概要&#xff1a; 本篇演示利用Ubuntu22.04啟動U盤的Try Ubuntu模式對電腦磁盤進行格式化 一、說明 1、電腦 筆者的電腦品牌是acer(宏碁/宏基) 開機按F2進入BIOS 開機按F12進入Boot Manager 2、Ubuntu22.04啟動U盤 制作方法參考筆者的文章&#xff1a; Ubuntu制作Ubun…

【OpenAI官方課程】第五課:ChatGPT文本轉換Transforming

歡迎來到ChatGPT 開發人員提示工程課程&#xff08;ChatGPT Prompt Engineering for Developers&#xff09;&#xff01;本課程將教您如何通過OpenAI API有效地利用大型語言模型&#xff08;LLM&#xff09;來創建強大的應用程序。 本課程由OpenAI 的Isa Fulford和 DeepLearn…

緩存篇—緩存雪崩

什么是緩存雪崩 通常我們為了保證緩存中的數據與數據庫中的數據一致性&#xff0c;會給 Redis 里的數據設置過期時間&#xff0c;當緩存數據過期后&#xff0c;用戶訪問的數據如果不在緩存里&#xff0c;業務系統需要重新生成緩存&#xff0c;因此就會訪問數據庫&#xff0c;并…

QEMU源碼全解析 —— virtio(22)

接前一篇文章&#xff1a;QEMU源碼全解析 —— virtio&#xff08;21&#xff09; 前幾回講解了virtio驅動的加載。本回開始講解virtio驅動的初始化。 在講解virtio驅動的初始化之前&#xff0c;先要介紹virtio配置的函數集合變量virtio_pci_config_ops。實際上前文書也有提到…

c# HttpCookie操作,建立cookie工具類

HttpCookie 是一個在.NET Framework中用于管理和操作HTTP Cookie的類。它提供了一種方便的方式來創建、設置、讀取和刪除Cookie。 Cookie是一種在客戶端和服務器之間傳遞數據的機制&#xff0c;用于跟蹤用戶的會話狀態和存儲用戶相關的信息。它通常由服務器發送給客戶端&#…

萬字干貨-京東零售數據資產能力升級與實踐

開篇 京東自營和商家自運營模式&#xff0c;以及伴隨的多種運營視角、多種組合計算、多種銷售屬性等數據維度&#xff0c;相較于行業同等量級&#xff0c;數據處理的難度與復雜度都顯著增加。如何從海量的數據模型與數據指標中提升檢索數據的效率&#xff0c;降低數據存算的成…

parallels配置centos虛擬環境

parallels Desktop M1/M2芯片Parallels Desktop 19虛擬機安裝使用教程&#xff08;超詳細&#xff09;-CSDN博客 下鏡像記得找和mac芯片匹配的 安裝就選第一個centos7不要選第二個 安裝有問題就選回退重啟 parallel desktop 18/19安裝centos7.2009教程_parallels desktop 19…

echarts多y軸樣式重疊問題

1、主要屬性設置 yAxis: [{//y軸1nameTextStyle: {align: "right",padding: 0}},{//y軸2nameTextStyle: {align: "left",padding: 0}},{//y軸3axisLabel: {margin: 50},nameTextStyle: {align: "left",padding: [0, 0, 0, 50]},axisPointer: {l…

Python Web開發記錄 Day2:CSS

名人說&#xff1a;莫道桑榆晚&#xff0c;為霞尚滿天。——劉禹錫&#xff08;劉夢得&#xff0c;詩豪&#xff09; 創作者&#xff1a;Code_流蘇(CSDN)&#xff08;一個喜歡古詩詞和編程的Coder&#x1f60a;&#xff09; 目錄 二、CSS1、CSS-初始入門①快速了解②CSS應用方式…