使用cherry studio離線搭建私人知識庫流程記錄

本篇文章記錄近期嘗試在個人筆記本上、全離線狀態下搭建知識庫的流程。用到的工具包括:Cherry Studio、ollama。主要過程是:首先下載ollama用于管理大模型;然后,從魔塔社區下載需要的deepseek、千問大模型和bge-m3嵌入模型,導入到ollama;最后在cherry studio構建知識庫進行配置和使用。

搭建私人知識庫能讓知識管理更高效,實現集中存儲與分類整理;使知識檢索更便捷,可快速精準查詢;特別是全離線狀態下能增強數據安全與隱私保護,讓個人自主掌控數據。

ollama下載與使用

第一步是下載ollama[1],Ollama是一個開源的大型語言模型服務工具,能讓用戶在本地計算機上便捷地部署和運行多種先進的語言模型,如Qwen、Llama、DeepSeek - R1等。它提供簡單的命令行界面和API,支持模型微調與自定義,具有多平臺支持、性能優化、數據隱私保護等特點,適用于開發與測試、研究與學習、企業級應用等多種場景。

模型管理

# 拉取模型
# 如ollama pull llama2,其作用是從 Ollama 庫中下載指定模型。
ollama pull <模型名稱>
# 刪除本地模型
# ollama rm <模型名稱>,例如ollama rm llama2,能將本地的指定模型刪除。
ollama rm <模型名稱>
# 模型運行
# 如ollama run llama2,可以開啟與指定模型的交互會話,在會話中能輸入問題并獲取模型的回答。
ollama run <模型名稱>

下載完后,打開命令行工具,使用ollama pull 命令就可以直接把需要的名字拉取過來,下載完成后,使用ollama run 命令,可以在命令行運行起來大模型了。

模型下載

由于我們想在離線狀態下部署、安裝和使用,所以我們不使用上述命令拉取。魔塔社區類似hugging face,里面匯集了很多模型和數據文件。

我們從魔塔社區下載模型,注意ollama導入模型的文件格式是guff格式。以deepseekR1 7B蒸餾版為例,我們可以從連接[2]下載到guff格式的模型。這里我用的是4.66GB 版本的模型,在我的筆記本上可以跑起來。

圖片

此外,由于我們構建知識庫,還需要把知識庫文件轉換為向量,因為還要使用嵌入模型,這里我們也是從魔塔社區下載bge-m3[3]下載guff格式的嵌入模型。至此,我們需要的模型文件就下載好了,一個7B的大模型和一個嵌入模型。

下一步,我們需要把從魔塔社區下載的模型導入到ollama平臺,不過在此之前要新建一個modelfile文件,里面寫入模型的存儲路徑,下圖是一個千問7B的例子。

圖片

我們為qwen:7B大模型和bge-m3嵌入模型新建好modelfile文件,然后在當前目錄下使用以下命令,把兩個模型導入到ollama平臺。create 后面跟著的是你定義的模型的名字,可以自己靈活定義;-f后面跟著的是modelfile的文件名。


ollama create bge_m3:FP16 -f bge_m3.modelfile
ollama create qwen:7B -f qwen7B.modelfile

導入成功后的截圖如下所示,并且通過ollama list命令可以看到當前ollama平臺擁有的模型。

圖片

使用cherry studio離線構建個人知識庫

在cherry studio 官網[4]下載客戶端,下載完成后,按照如下步驟操作。

  • 首先:點擊左下角設置按鈕,選擇ollama,打開右上角的開關,打開后如圖所示會出現‘ON’的字樣。

  • 然后:點擊下方出現的管理模型,在模型ID處填寫ollama list 列表中出現的模型名字。例如我這里是qwen:7B,點擊添加模型。

圖片

注意:如果是添加的bge_m3嵌入模型,則點擊設置按鈕,如下圖把模型類型選擇為嵌入類型。

圖片

圖片

  • 最后:我們新建知識庫,知識庫這里可以添加各類文件、為了簡單我這里只添加了三條筆記,如下圖所示。

圖片

知識庫使用

圖片

如上圖所示,我們選擇新建的知識庫12和導入的7B模型,通過對話詢問Bob最喜歡吃的水果,模型通過知識庫檢索回答了正確的答案。

參考鏈接:

  1. https://ollama.com/

  2. https://www.modelscope.cn/models/unsloth/DeepSeek-R1-Distill-Qwen-7B-GGUF/files

  3. https://www.modelscope.cn/models/gpustack/bge-m3-GGUF/files

  4. https://www.cherry-ai.com/

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/916270.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/916270.shtml
英文地址,請注明出處:http://en.pswp.cn/news/916270.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【工具類】Linux 環境利用 uv 安裝多版本 python

文章目錄前置工作環境說明如果kali無法訪問網絡pypi 換源安裝 uvuv 寫入環境變量臨時寫入永久寫入無法打開 github 解決方案&#xff08;注意此方法可能也會失效&#xff09;安裝多版本 python查看已安裝的pythonuv python install到 uv 的 github 主頁&#xff0c;找安裝文件下…

求職招聘小程序源碼招聘小程序開發定制

身份&#xff1a;求職者、企業求職者&#xff1a;完善簡歷&#xff0c;簡歷投遞企業&#xff1a;企業入駐&#xff0c;查看簡歷企業會員&#xff1a;半年 、年度 權益&#xff1a;每日發布條數、刷新條數&#xff0c;簡歷下載數量聊天&#xff1a;求職者可以和企業聊天招聘會…

Git 使用全指南:從配置到免密登錄

Git 使用全指南&#xff1a;從配置到免密登錄一、Git 基礎配置二、Git 代碼提交流程2.1 克隆遠程倉庫2.2 創建并切換分支2.3 暫存文件2.4 提交到本地倉庫2.5 拉取遠程最新代碼2.6 推送本地分支到遠程三、VSCode 服務器免密登錄配置3.1 生成 Windows SSH 密鑰3.2 復制公鑰到服務…

組合期權:領式策略

文章目錄0.簡介1.多頭領式策略&#xff08;Long Collar&#xff09;?1.1 策略構成1.2 適用場景?1.3 損益分析1.4 案例示范2.空頭領式策略&#xff08;Short Collar&#xff09;?2.1 策略構成2.2 適用場景2.3 損益分析2.4 案例示范參考文獻0.簡介 領式策略&#xff08;Colla…

ECSPI控制器

目錄 SPI協議簡介 極性與相位 SPI框圖 單字節收發 發送數據流程 接收數據流程 ECSPI控制器 關鍵特性 時鐘源 主機模式 等待狀態 片選控制 單突發傳輸 多突發傳輸 相位控制 ECSPI Memory Map ECSPI寄存器 ECSPIx_RXDATA ECSPIx_TXDATA ?編輯 ECSPIx_CONREG …

HTTP 與 SpringBoot 參數提交與接收協議方式

HTTP 協議支持多種參數提交方式&#xff0c;主要取決于請求方法(Method)和內容類型(Content-Type)。以下是主要的參數提交協議&#xff1a;1. URL 查詢參數 (Query Parameters)請求方法: GET (也可用于其他方法)格式: ?key1value1&key2value2示例: GET /users?id123&…

Lua(數組)

Lua 數組基礎概念Lua 中的數組實際上是用整數索引的 table&#xff0c;是一種特殊形式的表。數組索引通常從 1 開始&#xff08;Lua 慣例&#xff09;&#xff0c;但也可以從其他值開始。創建數組通過表構造器初始化數組&#xff1a;-- 索引從 1 開始的數組 local arr {10, …

【Docker項目實戰】在Docker環境下部署go-file文件分享工具

【Docker項目實戰】在Docker環境下部署go-file文件分享工具一、go-file介紹1.1 go-file簡介1.2 go-file特點1.3 go-file使用場景二、本地環境介紹2.1 本地環境規劃2.2 本次實踐介紹三、本地環境檢查3.1 檢查Docker服務狀態3.2 檢查Docker版本3.3 檢查docker compose 版本四、下…

C++基礎學習——文件操作詳解

一、文件流類概述 C 標準庫提供了三個主要的文件流類&#xff1a; ifstream (輸入文件流)&#xff1a;用于從文件讀取數據ofstream (輸出文件流)&#xff1a;用于向文件寫入數據fstream (文件流)&#xff1a;既可讀又可寫 這些類都繼承自 iostream 類&#xff0c;因此可以使用 …

Android補全計劃 DrawerLayout使用

DrawerLayout其實用了很久了&#xff0c;甚至封裝了一些代碼方便不同項目使用&#xff0c;但重構代碼的時候突然意識到這塊內容很不成體系&#xff0c;因此又參考了些文檔&#xff0c;組建了自己的一個文檔。 toolbardrawerlayout能寫的效果很多&#xff0c;在此我也只是截取了…

人工智能之數學基礎:概率論之韋恩圖的應用

韋恩圖的應用由于事件的計算有時候太過于抽象了&#xff0c;此時我們可以使用韋恩圖的方式來進行驗證&#xff0c;我們下面來舉一個例子&#xff0c;A∪B&#xff09;-CA∪(B-C)是否成立&#xff1f;我們可以通過韋恩圖來完成這個任務&#xff1a;我們通過這種方式來一點一點的…

小白成長之路-部署Zabbix7(二)

文章目錄一、zabbix-自動發現二、自動注冊三、zabbix-網易云郵箱-發送消息二、zabbix-釘釘告警總結一、zabbix-自動發現 1.在準備兩臺虛擬機&#xff0c;我的是192.168.144.12,192.168.144.13 server換成zabbix服務器的ip地址 vim /etc/zabbix/zabbix_agentd.conf 2.創建自動…

CMU15445-2024fall-project4踩坑經歷

project4目錄Task1Task2ReconstructSeqScanTask3InsertCommitTxnMgrDbgGenerateNewUndoLog And GenerateUpdateUndoLogUpdate And Delete垃圾回收Task4Index Insert并發控制Index ScanDelete、Update并發控制主鍵更新Bonus 1Bonus 2處理寫傾斜感謝CMU的教授們給我們分享了如此精…

C++20 協程

摘要&#xff1a;C20 引入的協程機制為異步編程提供了輕量級解決方案&#xff0c;其核心優勢在于通過用戶態調度實現高效的上下文切換&#xff0c;適用于 I/O 密集型任務、生成器模式等場景。本文系統闡述 C20 協程的底層原理與實踐要點&#xff0c;首先解析協程的基本結構&…

《計算機組成原理與匯編語言程序設計》實驗報告二 基本數字邏輯及漢字顯示

目 錄 一、實驗學時 二、實驗目的 三、實驗要求 四、實驗內容 五、實驗步驟 1、打開Logisim軟件&#xff0c;列出并行四位二進制全加器邏輯電路真值表&#xff0c;并使用與、或、非、異或等基本原件實現并行四位二進制全加器邏輯電路&#xff0c;鋪設完成后進行測試進而…

問卷調查小程序的設計與實現

問卷調查小程序的設計與實現&#xff1a;技術與功能全解析在數字化時代&#xff0c;問卷調查成為數據收集的重要工具。一款高效、易用的問卷調查小程序能夠顯著提升用戶體驗和數據質量。本文將深入探討基于現代技術棧的問卷調查小程序的設計與實現&#xff0c;涵蓋核心功能、技…

STM32項目實戰:正弦波

波形發生器對我的錢包不怎么友好&#xff0c;手里面有stm32f103c8t6&#xff0c;于是就想,放在哪兒吃灰也是吃灰&#xff0c;不如做個正弦波發生器。方案 dac沒怎么用過&#xff0c;所以打算使用輸出模擬正弦波。我們決定采用以下方案&#xff1a;1.使用TIM2_CH3&#xff08;PA…

Unity 時間抗鋸齒(Temporal Antialiasing, TAA)技術解析

時間抗鋸齒&#xff08;Temporal Antialiasing, TAA&#xff09;技術解析 一、什么是時間抗鋸齒&#xff08;TAA&#xff09;&#xff1f; 時間抗鋸齒&#xff08;TAA&#xff09;是一種先進的實時抗鋸齒技術&#xff0c;通過在時間維度上積累多幀渲染數據&#xff0c;實現比傳…

uniapp打開導航軟件并定位到目標位置的實現

/*** 打開導航* param location 經緯度(例如&#xff1a;"117.214713,39.116884")* param address 地址*/ export function mapNavigation(location, address) {const locationArr location.split(,)const longitude locationArr[0]const latitude locationArr[1]…

Mysql實現高可用(主從、集群)

一、背景 需求&#xff1a;客戶要實現Mysql8.0高可用&#xff0c;出現故障時&#xff0c;需要實現自動切換。 分析&#xff1a;實現切換有兩種方式&#xff0c;一種數據庫自動切換&#xff0c;一種代碼實現。 本著麻煩別人&#xff0c;別麻煩自己的原則&#xff0c;得給客戶的D…