打造本地GPT專業領域知識庫AnythingLLM+Ollama

? ? ? ? 如果你覺得openai的gpt沒有隱私,或者需要離線使用gpt,還是打造專業領域知識,可以借用AnythingLLM+Ollama輕松實現本地GPT.

AnythingLLM+Ollama 實現本地GPT步聚:

1 下載 AnythingLLM軟件

AnythingLLM官網地址:

AnythingLLM | The ultimate AI business intelligence tool

2 下載 Ollama

Ollama官網下載:?

?Ollama

下載好的兩個軟件如下圖:?

3 安裝AnythingLLM

和安裝其它軟件一樣雙擊安裝即可,如下圖:

安裝成功后,我們接著再安裝Ollama。

4 安裝Ollama

和安裝其它軟件一樣雙擊安裝即可,安裝成功后右下角有個運行圖標如下圖:

?配置 Ollama

?1 配置Ollama模型數據路徑

模型數據默認是保存在C盤的,由于模型數據特別大,所以這里一定要記住配置模型數據的路徑,只里設置系統變量OLLAMA_MODELS的值為模型數據保存路徑,如下圖:

?2 選擇配置主模型

? 這里考慮到我們平時主要處理中文相關資料,選擇阿里的千問模型,結合當前環境筆記是16G內存,我們這里選擇千問7b(占用8G內存):

? 運行選擇的模型

ollama run qwen:7b

首次運行會下載該模型,如下圖:?

下載完成,如下圖:?

3?選擇配置嵌入模型

?嵌入模型并不直接生產數據,主要用于把本地知識doc.pdf txt等文檔保存在向量數據庫時用到。

這里我們選擇?nomic-embed-text ,它是具有大型令牌上下文窗口的高性能開放嵌入模型。

ollama pull nomic-embed-text

5 配置AnythingLLM

打開AnythingLLM 進行設置項,如下圖:

1 配置主模型

這里選擇上面Ollama下載的千問模型

2 配置嵌入模型

這里選擇配置與上面安裝的模型nomic-embed-text一致,如下圖:

配置嵌入模型在處理上傳知識文件保存到向量數據時兩個關鍵參數:

  • ??分塊大小 (這是單個向量中允許存在的最大字符數量。例如,如果設置為8192,意味著每個文本塊或向量最多包含8192個字符。)
  • ?文本塊重疊度(這是指在兩個相鄰文本塊切分過程中允許的最大字符重疊量。設置重疊可以幫助保持信息的連續性,避免因嚴格切分導致的語義斷裂,尤其是在信息的關鍵邊界附近。)

? 注意:這兩個參數僅適用于新嵌入的文檔,對已存在的文檔沒有影響。?

?3 配置使用向量數據庫

設置使用向量數據庫,沒有特別需求使用默認即可,如下圖:

?說明:LanceDB是一個開源的無服務器向量數據庫,專為處理人工智能應用中的大規模多模態數據(如文本、圖像、視頻、點云等)而設計。它簡化了高維向量的檢索、過濾和管理過程,無需用戶管理和維護服務器基礎設施,從而降低了運維成本并提高了開發效率。?

配置完成,如下圖:?

?

6 開始使用本地GPT(使用AnythingLLM)

現在我們開始使用AnythingLLM:

1 創建空間

? AnythingLLM 有一個很好的概念工作空間,有點像我們平時用eplise創建項目一樣,一個項目一個空間,不同的空間還可以單獨配置,這樣可以很好的劃分不同類類型的專業領域。

?保存空間名稱后,即可正常提問

開始問答:

因為是離線,而本地又沒有顯卡,所以回答問題時并不是很快,而且CPU會拉升,如下圖:?

?ollama 服務CPU占用50%,內存12G,消耗挺大的。

2 可選擇單獨配置參數

? 為當前空間單獨配置參數(默認使用設置中的配置)?

配置聊天模型,這個配置很重要,如果只是針對知識庫直接設置成查詢模型即可,如下圖:?

?

3 知識庫使用

?上傳文檔形成專業知識庫,如下圖:

選擇文檔上傳,如下圖:?

?

?

或者輸入網址直接獲取內容?

?使用查詢模型提問,直接使用知識庫如下圖:

小結,普通的筆記本電腦在使用查詢模式會比聊天模型更快,并且可以節約CPU與內存。?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/11907.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/11907.shtml
英文地址,請注明出處:http://en.pswp.cn/web/11907.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

功能卓越,未來可期!實在Agent智能體公測圓滿收官

“被需要的智能才是實實在在的智能。”一直以來,實在智能始終堅持從行業本質出發思考如何圍繞客戶需求打造更智能、更普惠的智能體數字員工,切實關注用戶真實的使用體驗與感受。 自2020年7月起,實在智能率先推出第一代實在RPA數字員工&#…

SpringBoot設置默認文件大小

1、問題發現 有個需求,上傳文件的時候,發現提示了這個錯誤,看了一下意思是說,文件超過了1M。 看我們文件的大小: 發現確實是,文件超出了1M,查了一下資料,tomcat默認上傳文件大小為1M…

Python環形數組

在編程中,環形數組(Circular Array)是一種特殊的數組結構,其中最后一個元素連接到第一個元素,形成一個環形。這種結構在某些算法問題中很有用,例如約瑟夫環問題(Josephus Problem)。…

簡單粗暴的翻譯英文pdf

背景:看書的時候經常遇到英文pdf,沒有合適的翻譯軟件可以快速翻譯全書。這里提供一個解決方案。 Step 1 打開英文pdfCTRLA全選文字CTRLC復制打開記事本CTRLV復制保存為data.txt Step 2 寫一個C腳本 // ToolPdf2Html.cpp : 此文件包含 "main&quo…

大型語言模型自我進化綜述

24年4月來自北大的論文“A Survey on Self-Evolution of Large Language Models”。 大語言模型(LLM)在各個領域和智體應用中取得了顯著的進步。 然而,目前從人類或外部模型監督中學習的LLM成本高昂,并且隨著任務復雜性和多樣性的…

子模塊介紹,開發規范說明和工具類封裝

在上一章的內容中&#xff0c;我們完成了聚合工程的搭建以及工程依賴的導入 當然我們會延續上一章的傳統提供一個傳送門給各位&#xff0c;如未完成上一章內容&#xff0c;請點擊左側->傳送門 概述子模塊 上一章我們已經創建了整個聚合工程 該聚合工程有以下子模塊 <…

如何將一個Web應用部署到 Kubernetes 集群

Kubernetes&#xff08;常簡稱為 k8s&#xff09;是一個是一個開源的容器編排平臺&#xff0c;由 Google 設計并捐贈給 Cloud Native Computing Foundation&#xff08;CNCF&#xff09;的開源平臺。它旨在提供一個標準化的容器部署流程&#xff0c;讓部署、擴展和管理應用程序…

C# WinForm —— 18 NumericUpDown 介紹

1. 簡介 數字顯示框&#xff0c;通過向上、向下按鈕來 增加/減小 顯示的數值 2. 常用屬性 屬性解釋(Name)控件ID&#xff0c;在代碼里引用的時候會用到,一般以 numUD 開頭Hexadecimal數值 up-down 控件的值是否應以十六進制顯示Increment每單擊一下按鈕&#xff0c;增加或減…

springboot基本使用十(搭建jpa)

jpa底層是hibernate,(ORM)對象關系映射技術 jpa依賴: <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-jpa</artifactId> </dependency> 配置文件: server:port: 8088Spring:datasou…

音源分離|Music Source Separation in the Waveform Domain

一、文章摘要 本文中&#xff0c;比較了兩種時域結構。首先將最初為語音源分離而開發的卷積tasnet應用于音樂源分離任務。雖然ConvTasnet擊敗了許多現有的頻域方法&#xff0c;但正如人類評估所顯示的那樣&#xff0c;它存在明顯的artifacts。本文提出了一種新的時域模型Demucs…

鴻蒙內核源碼分析 (協處理器篇) | CPU 的好幫手

本篇很重要&#xff0c;對CP15協處理所有16個寄存器一一介紹&#xff0c;可能是全網介紹CP15最全面的一篇&#xff0c;鴻蒙內核的匯編部分(尤其開機啟動)中會使用&#xff0c;熟練掌握后看匯編代碼將如虎添翼。 協處理器 協處理器 (co-processor) 顧名思義是協助主處理器完成…

服務器渲染和客戶端渲染:解析服務器渲染(SSR)和客戶端渲染(CSR)的概念,各自的優點和缺點,并比較如Next.js, Nuxt.js等解決方案

首先從概念上區分&#xff0c;服務器渲染&#xff08;Server-side Rendering&#xff0c;簡稱 SSR&#xff09;和客戶端渲染&#xff08;Client-side Rendering&#xff0c;簡稱 CSR&#xff09;主要的區別在于頁面的渲染地點不同&#xff1a; 服務器渲染&#xff0c;即 SSR&am…

韻搜坊(全棧)-- 前后端初始化

文章目錄 前端初始化后端初始化 前端初始化 使用ant design of vue 組件庫 官網快速上手&#xff1a;https://www.antdv.com/docs/vue/getting-started-cn 安裝腳手架工具 進入cmd $ npm install -g vue/cli # OR $ yarn global add vue/cli創建一個項目 $ vue create ant…

社交媒體數據恢復:默往

如果你在默往社交軟件中丟失了重要的數據&#xff0c;不要著急&#xff0c;以下是一些步驟可以幫助你進行數據恢復&#xff1a; 登錄賬號&#xff1a;首先&#xff0c;你需要登錄默往社交軟件賬號&#xff0c;確保你已經登錄了正確的賬號&#xff0c;因為如果你登錄了錯誤的賬號…

邦芒簡歷:如何恰當呈現跳槽經歷在簡歷中

在職業生涯中&#xff0c;跳槽往往伴隨著個人的成長與選擇。然而&#xff0c;頻繁或不當的跳槽記錄可能會給HR留下不穩定的印象。因此&#xff0c;在撰寫簡歷時&#xff0c;如何恰當地呈現跳槽經歷就顯得尤為重要。 1、短期工作經歷的處理 對于短期工作經歷&#xff08;尤其是…

弘君資本策略:股指預計保持震蕩上揚格局 關注公用事業、電網設備等板塊

弘君資本指出&#xff0c;周一A股商場探底上升、小幅震動收拾&#xff0c;早盤股指低開后震動回落&#xff0c;滬指盤中在3126點附近取得支撐&#xff0c;午后股指企穩上升&#xff0c;盤中電網設備、公用事業、電力以及工程建造等職業體現較好&#xff1b;半導體、互聯網以及軟…

掌握社交的這二十個心理技巧

1.自信&#xff1a;這一點說起來容易做起來難&#xff0c;但就算是假裝出來的自信&#xff0c;通過你的肢體語言表現出來。在很大程度也可以幫助你留下很好的第一印象。人們喜歡自信的人。因為他們更可靠&#xff0c;更值得信賴&#xff0c;更具吸引力。 2.當你第一次見到某人…

PXE+Kickstart無人值守安裝安裝Centos7.9

文章目錄 一、什么是PXE1、簡介2、工作模式3、工作流程 二、什么是Kickstart1、簡介2、觸發方式 三、無人值守安裝系統工作流程四、實驗部署1、環境準備2、服務端&#xff1a;關閉防火墻和selinux3、添加一張僅主機的網卡4、配置僅主機的網卡4.1、修改網絡連接名4.2、配IP地址4…

差異基因散點圖繪制教程

差異基因散點圖繪制教程 本期教程 小杜的生信筆記&#xff0c;自2021年11月開始做的知識分享&#xff0c;主要內容是R語言繪圖教程、轉錄組上游分析、轉錄組下游分析等內容。凡事在社群同學&#xff0c;可免費獲得自2021年11月份至今全部教程&#xff0c;教程配備事例數據和相…

最新版Ceph( Reef版本)塊存儲簡單對接k8s(上集)

當前ceph 你的ceph集群上執行 1.創建名為k8s-rbd 的存儲池 ceph osd pool create k8s-rbd 64 642.初始化 rbd pool init k8s-rbd3 創建k8s訪問塊設備的認證用戶 ceph auth get-or-create client.kubernetes mon profile rbd osd profile rbd poolk8s-rbd部署 ceph-rbd-csi c…