【大語言模型】私有化搭建-企業知識庫-知識問答系統

下面是我關于大語言模型學習的一點記錄

目錄

人工智能學習路線

MaxKB 系統(基于大語言模型的知識問答系統)

部署開源大語言模型LLM

1.CPU模式(沒有好的GPU,算力和效果較差)

2.GPU模式(需要有NVIDIA顯卡支持)?

Ollama網絡配置

Ollama前臺頁面配置

使用docker中的ollama下載并運行AI模型

?ollama模型倉庫(可以選擇自己想用的模型安裝體驗)

🏆 LMSYS Chatbot Arena Leaderboard(排行榜)


人工智能學習路線

人工智能學習路線(學+測) - 阿里云開發者社區人工智能學習路線,算法原理、框架精講、機器學習實戰、圖像識別實戰、自然語言處理實戰,人工智能技術一站式學習icon-default.png?t=N7T8https://developer.aliyun.com/learning/roadmap/ai

MaxKB 系統(基于大語言模型的知識問答系統)

官網和GitHub鏈接,可以用于公司知識庫

MaxKB - 基于大語言模型的知識庫問答系統MaxKB 是一款基于 LLM 大語言模型的知識庫問答系統。icon-default.png?t=N7T8https://maxkb.cn/https://github.com/1panel-dev/MaxKBicon-default.png?t=N7T8https://github.com/1panel-dev/MaxKB

docker安裝

docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data 1panel/maxkb

MaxKB是知識問答系統,主要對文檔進行分塊,內容塊和問答框以及匹配度設置和問答記錄登記?反饋等等情況。但本身不具有LLM模型,需要另外部署或者接入API,例如千帆

我們自己部署一套開源模型

部署開源大語言模型LLM

1.CPU模式(沒有好的GPU,算力和效果較差)

docker部署ollama(給MaxKB調用)

docker run -d -v /opt/ai/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

2.GPU模式(需要有NVIDIA顯卡支持)?

?企業級需要4090 2塊做推理

安裝英偉達容器工具包(以Ubuntu22.04為例)

其他系統請參考:英偉達官方文檔

# 1.配置apt源

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \

&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \

sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \

sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

# 2.更新源

sudo apt-get update

# 3.安裝工具包

sudo apt-get install -y nvidia-container-toolkit

docker使用GPU運行ollama

docker run --gpus all -d -v /opt/ai/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

Ollama網絡配置

如何在我的網絡上暴露Ollama?

Ollama默認綁定127.0.0.1端口11434。通過OLLAMA_HOST環境變量更改綁定地址。

https://docs.dify.ai/v/zh-hans/guides/model-configuration/ollama#zai-windows-shang-she-zhi-huan-jing-bian-liang

Ollama前臺頁面配置

docker部署ollama web ui(第一次登錄需要注冊)

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main? ? ? ? ?

使用docker中的ollama下載并運行AI模型

#通義1.0? 4b

docker exec -it ollama ollama run qwen:4b-chat

#中文?lama2-chinese:13b模型

docker exec -it ollama?ollama run llama2-chinese:13b

#通義7b-chat-v1.5-q5_K_M

docker exec -it ollama?ollama run qwen:7b-chat-v1.5-q5_K_M

#通義千問2.0?Qwen2-7B(2024年6月底更新,當前最好用的開源,推薦用這個模型,下面有排行榜,在有限的資源下Qwen2-7B是開源中的頂流了,70億的體量能滿足企業開展,如果資源不夠可以搞小一點的模型,測試下來P100勉強可以跑,A10可以跑5并發 3000token)

docker exec -it ollama?ollama run?qwen2:72b

#進入容器

docker exec -it ollama bash

root@9592d72fca5b:/# ollama list

NAME????????????????????????????ID??????????????SIZE????MODIFIED??????????

llama2-chinese:13b??????????????990f930d55c5????7.4 GB??3 hours ago??????

qwen:0.5b-text-v1.5-q6_K????????c8c2e4f579df????514 MB??15 minutes ago???

qwen:4b-chat????????????????????d53d04290064????2.3 GB??5 hours ago??????

qwen:7b-chat-v1.5-q5_K_M????????44ca6b3fda9d????5.5 GB??About an hour ago

root@9592d72fca5b:/# ollama rm qwen:0.5b-text-v1.5-q6_K

deleted 'qwen:0.5b-text-v1.5-q6_K'

root@9592d72fca5b:/# ollama list

NAME????????????????????????????ID??????????????SIZE????MODIFIED??????????

llama2-chinese:13b??????????????990f930d55c5????7.4 GB??3 hours ago??????

qwen:4b-chat????????????????????d53d04290064????2.3 GB??5 hours ago??????

qwen:7b-chat-v1.5-q5_K_M????????44ca6b3fda9d????5.5 GB??About an hour ago

?ollama模型倉庫(可以選擇自己想用的模型安裝體驗)

ollama模型倉庫

🏆 LMSYS Chatbot Arena Leaderboard(排行榜)

https://chat.lmsys.org/?leaderboard

https://cevalbenchmark.com/static/leaderboard.html

上面這個網站收集的模型比較

?SuperCLUE

?這部分是Qwen1.5的比對,目前已經到Qwen2.0了

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/45424.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/45424.shtml
英文地址,請注明出處:http://en.pswp.cn/web/45424.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【問卷系統】TDucKX更新速覽

TDuck是一款在線表單問卷收集工具,開源地址:https://gitee.com/TDuckApp一款免費的表單問卷系統;可快速創建問卷或業務表單,采用無代碼理念支持開發自定義組件。采用SpringBootVueElementUI技術棧,功能強大界面清新&am…

Catena-x標準解讀:CX-0007 Minimal Data Provider Service Offering v1.0.2 最小數據提供商服務產品

為了更好地理解,最小數據提供者服務也將被稱為“上傳工具”。 對于數據供應工具來說,數據主權的概念尤為重要。數據主權是Catena-X網絡的核心價值觀之一。每個參與者都應該盡可能多地控制自己的數據。這包括 他總是確切地知道他在與誰交換數據。參與者…

【GameFramework擴展應用】6-4、GameFramework框架增加AB包加解密功能

推薦閱讀 CSDN主頁GitHub開源地址Unity3D插件分享簡書地址QQ群:398291828大家好,我是佛系工程師☆恬靜的小魔龍☆,不定時更新Unity開發技巧,覺得有用記得一鍵三連哦。 一、前言 【GameFramework框架】系列教程目錄: https://blog.csdn.net/q764424567/article/details/1…

軟件測試面試200問(全)

1、B/S架構和C/S架構區別 B/S 只需要有操作系統和瀏覽器就行,可以實現跨平臺,客戶端零維護,維護成本低,但是個性化能力低,響應速度較慢 C/S響應速度快,安全性強,一般應用于局域網中&#xff0…

【matlab】智能優化算法優化BP神經網絡

目錄 引言 一、BP神經網絡簡介 二、智能優化算法概述 三、智能優化算法優化BP神經網絡的方法 四、蜣螂優化算法案例 1、算法來源 2、算法描述 3、算法性能 結果仿真 代碼實現 引言 智能優化算法優化BP神經網絡是一個重要的研究領域,旨在通過智能算法提高…

變量篩選—特征包含信息量

在變量篩選中,通過衡量特征所包含信息量大小,決定是否刪除特征,常用的指標有單一值占比、缺失值占比和方差值大小。單一值或缺失值占比越高,表示特征包含信息量越少,不同公司設置不同閾值,一般單一值、缺失值占比高于95%,建議刪除。方差值越小,代表特征包含信息量越小。…

入職前回顧一下git-01

git安裝 Linux上安裝git 在linux上建議用二進制的方式來安裝git,可以使用發行版包含的基礎軟件包管理工具來安裝。 紅帽系 sudo yum install gitDebian系 sudo apt install gitWindows上安裝git 去官網下載和操作系統位數相同的安裝包.或者可以直接安裝GitHub…

模板引擎是什么?

模板引擎(Template Engine)是一種用于生成文本輸出的工具,尤其在Web開發中應用廣泛。它的主要目的是將用戶界面(通常是HTML等模板文件)與業務數據(內容)分離,從而提供一種高效、靈活…

[圖解]SysML和EA建模住宅安全系統-14-黑盒系統規約

1 00:00:02,320 --> 00:00:07,610 接下來,我們看下一步指定黑盒系統需求 2 00:00:08,790 --> 00:00:10,490 就是說,把這個系統 3 00:00:11,880 --> 00:00:15,810 我們的目標系統,ESS,看成黑盒 4 00:00:18,030 --> …

spring管理bean源碼解析

1. 從啟動類開始 public static void main(String[] args) {// Run the SpringApplication class with the Application class as the first argumentSpringApplication.run(Application.class, args);}2. bean 實例化 // SpringAplication row1294,1295 run() // SpringApli…

Power Apps使用oData訪問表數據并賦值前端

在使用OData查詢語法通過Xrm.WebApi.retrieveMultipleRecords方法過濾數據時,你可以指定一個OData $filter 參數來限制返回的記錄集。 以下是一個使用Xrm.WebApi.retrieveMultipleRecords方法成功的例子,它使用了OData $filter 參數來查詢實體的記錄&am…

【Parallel SSH】Ubuntu系統配置pssh實現多主機并行執行Master分發的命令

文章目錄 一、配置多機免密登錄二、ubuntu系統安裝pssh三、并行命令腳本編寫 一、配置多機免密登錄 假設有1臺主機作為Master分發命令,3臺主機作為Servers執行命令。假設Master主機內網IP地址為192.168.0.12,Servers外網IP及對應的hostname分別為&#…

最新盤點!2024年最值得了解的24款項目管理軟件

一、企業該如何選擇一款項目管理工具?選擇項目管理工具時需要考慮哪些因素? 在選擇和對比項目管理工具時,可以通過加權方式進行對比和評估。參考以下模板,可以把自己關注的項目管理工具,進行表格對比,選中…

企業智能制造賦能的環境條件為什么重要?需要準備什么樣的環境?

在全球制造業不斷演進的今天,智能制造已經成為推動行業創新和轉型的關鍵力量。它不僅代表了技術的革新,更是企業管理模式和運營思路的全面升級。然而,智能制造的落地實施并非一蹴而就,它需要企業在環境條件上做好充分的準備&#…

jail內部ubuntu apt升級失敗問題解決-Dynamic MMap ran out of room

在FreeBSD jail 里安裝啟動Ubuntu jammy系統,每次裝好執行jexec ubjammy sh進入Ubuntu系統后,執行apt update報錯。 這個問題困惑了好久,突然有一天仔細去看報錯信息,查看了(man 5 apt.conf) ,才搞定問題。簡單來說就是…

Mybatis攔截器介紹及其應用

Mybatis攔截器介紹及其應用 1、介紹 Mybatis攔截器設計的初衷就是為了供用戶在某些時候可以實現自己的邏輯而不必去動Mybatis固有的邏輯。通過Mybatis攔截器我們可以攔截某些方法的調用,我們可以選擇在這些被攔截的方法執行前后加上某些邏輯,也可以在執…

Pycharm與Gitlab交互

環境準備 1、下載配置好本地Git 2、配置Pycharm上的Git 3、gitlab賬號 Gitlab配置 Gitlab配置中文 賬號》設置》偏好設置》簡體中文 創建項目 命令行操作 打開項目會展示以下步驟 在pycharm克隆gitlab的項目 通過菜單欄 1、在PyCharm的頂部菜單欄中,選擇“V…

本地部署,Flash Diffusion: 加速條件擴散模型實現快速圖像生成

目錄 引言 技術背景 Flash Diffusion 的架構與原理 Flash Diffusion 的主要特點 本地部署 運行結果 實驗結果與分析 應用實例 結論 GitHub - gojasper/flash-diffusion: Official implementation of ? Flash Diffusion ?: Accelerating Any Conditional Diffusion M…

Linux系統搭建輕量級個人博客VanBlog并一鍵發布公網遠程訪問

文章目錄 前言1. Linux本地部署2. VanBlog簡單使用3. 安裝內網穿透4. 創建公網地址5. 創建固定公網地址 前言 今天和大家分享如何在Linux Ubuntu系統搭建一款輕量級個人博客VanBlog,并結合cpolar內網穿透軟件生成公網地址,輕松實現隨時隨地遠程訪問本地…

相交鏈表+判斷環型鏈表+求環型鏈表的入口節點

鏈表OJ題 一.相交鏈表二.判斷環型鏈表三.求環型鏈表的入口節點 一.相交鏈表 相交鏈表 相交:兩個鏈表從頭開始遍歷,尾節點一定是同一個節點。 情況一:當兩個鏈表長度相同時: 情況二:當兩個鏈表長度不同時&#xff1…