利用Ollama+AnythingLLM+本地向量數據庫Milvus+本地DeepSeek大模型實現知識庫的搭建

1. Ollama的搭建

基本介紹
Ollama是一個支持在Windows、Linux和MacOS上本地運行大語言模型的工具。它允許用戶非常方便地運行和使用各種大語言模型,比如Qwen模型等。用戶只需一行命令就可以啟動模型。

Ollama 下載:https://ollama.com/download
Ollama 官方主頁:https://ollama.com
Ollama 官方 GitHub 源代碼倉庫:https://github.com/ollama/ollama/

安裝完成之后,打開一個cmd命令窗口,輸入“ollama”命令,如果顯示ollama相關的信息就證明安裝已經成功了!

在這里插入圖片描述
常見指令:

ollama serve         #啟動ollama
ollama create        #從模型文件創建模型
ollama show          #顯示模型信息
ollama run           #運行模型
ollama pull          #從注冊表中拉取模型
ollama push          #將模型推送到注冊表
ollama list          #列出模型
ollama cp            #復制模型
ollama rm            #刪除模型
ollama help          #獲取有關任何命令的幫助信息  

2. 利用Ollama安裝DeepSeek

在dos窗口下,輸入:

ollama run deepseek-r1:8b

3. 安裝AnythingLLM

直接安裝以后,就可以看到
在這里插入圖片描述
在這里插入圖片描述

文檔上傳解析
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

4. Window安裝Milvus

Milvus簡介

Milvus是一款開源的向量數據庫,具有高度的靈活性、穩定可靠性以及高速查詢等特點。它支持針對TB級向量的增刪改操作和近實時查詢,適用于大規模向量數據的存儲和檢索。

Milvus集成了多種廣泛應用的向量索引庫,如Faiss、NMSLIB和Annoy等,并提供了簡單直觀的API,用戶可以根據不同場景選擇適合的索引類型。此外,Milvus還可以對標量數據進行過濾,進一步提高召回率,增強搜索的靈活性。

Milvus被廣泛應用于多個領域,包括圖像處理、機器視覺、自然語言處理、語音識別、推薦系統以及新藥發現等。它的源代碼托管在Github上,這使得社區可以輕松地訪問、使用和貢獻代碼。

官網:https://milvus.io/zh

安裝步驟

  1. 先安裝docker Desktop
  2. 然后下載milvus-standalone-docker-compose.yml
    下載完成后得到的是一個milvus-standalone-docker-compose.yml文件,需要重命名為docker-compose.yml,然后將yml文件復制到工作路徑下:
    在這里插入圖片描述
  3. 然后打開命令行終端,cd到你的文件目錄下,運行下面代碼
docker-compose up -d
  1. 等待一段時間,就可以去查看doker,或者終端輸入
docker-compose ps
  1. 安裝客戶端工具attu

執行命令,加個 -d 在后臺運行

docker run -d -p 8000:3000 -e MILVUS_URL=127.0.0.1:19530 zilliz/attu:v2.2.8

或者Window安裝,地址如下:
https://download.csdn.net/download/wu2374633583/90456544

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/71670.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/71670.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/71670.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

如何搭建個人靜態住宅IP:從零開始

你好!今天我們將一起探索如何從頭開始搭建個人靜態住宅IP。無論您是為了遠程辦公、在線教育還是游戲加速,靜態住宅IP都能帶給您更穩定的網絡體驗。 一、準備階段 1. 明確需求 首先,您需要清楚自己為什么需要靜態住宅IP。可能是為了實現遠程…

國產編輯器EverEdit - 安裝擴展功能的方式

1 擴展管理 1.1 應用場景 由于各行各業工作場景的不同,編輯器不可能為所有行業都定制功能,因此,對于一些特殊的行業應用場景,某些資深工程師可能已經做了一些擴展,并分享到了共享平臺,普通工程師可以安裝這…

CUDA計時函數:精確測量GPU代碼執行時間

在GPU編程中,精確測量代碼執行時間是性能優化的關鍵步驟。CUDA提供了專門的計時工具來幫助開發者準確獲取核函數(Kernel)、內存拷貝等操作的耗時。本文將詳細介紹CUDA計時函數的使用方法,并通過實例代碼演示如何高效測量GPU代碼的…

Go語言集成DeepSeek API和GoFly框架文本編輯器實現流式輸出和對話(GoFly快速開發框架)

說明 本文是GoFly快速開發框架集成Go語言調用 DeepSeek API 插件,實現流式輸出和對話功能。為了方便實現更多業務功能我們在Go服務端調用AI即DeepSeek接口,處理好業務后再用Gin框架實現流失流式輸出到前端,前端使用fetch請求接收到流式的mar…

SAP服務器進程預警通知

在財務月結,HR薪資核算等系統用戶集中使用高峰時期。通過判斷判斷當前系統可用的并行對話框進程數,用戶使用過多給出提示,服務器進程預警通知。 1. 根據配置的進程最大可使用率80%,根據進程數判斷:當進程可用數少于20%…

【Java代碼審計 | 第四篇】SQL 注入防范

文章目錄 Java SQL 注入防御方法類型轉換預編譯查詢(PreparedStatement)使用 ORM 框架(如 MyBatis、Hibernate)白名單限制ORDER BY 語句LIKE 語句 限制數據庫權限過濾和轉義特殊字符監控與日志審計使用 Web 應用防火墻&#xff08…

軟考中級-數據庫-3.3 數據結構-樹

定義:樹是n(n>=0)個結點的有限集合。當n=0時稱為空樹。在任一非空樹中,有且僅有一個稱為根的結點:其余結點可分為m(m>=0)個互不相交的有限集T1,T2,T3...,Tm…,其中每個集合又都是一棵樹,并且稱為根結點的子樹。 樹的相關概念 1、雙親、孩子和兄弟: 2、結點的度:一個結…

選擇排序算法的SIMD優化

一、優化原理 將查找數組最小值索引的SIMD優化的函數嵌入選擇排序主循環,優化最耗時的最小值查找環節,同時保留選擇排序的交換邏輯。 二、關鍵改造步驟 1)最小值查找模塊化 復用SIMD優化的 find_min_index_simd函數。 2)動態子數組處理 每次循環處理 arr[i..n-1] 子數…

考網絡安全工程師證要什么條件才能考?

在當今數字化時代,網絡安全問題日益凸顯,網絡安全工程師成為了一個備受矚目的職業。許多有志于投身這一行業的學子或職場人士,都希望通過考取網絡安全工程師證書來提升自己的專業素養和競爭力。那么,考網絡安全工程師證需要具備哪…

uniapp項目運行失敗Error: getaddrinfo *.bspapp.com 文件查找失敗uview-ui及推薦MarkDown軟件 Typora

一、uniapp項目運行失敗Error: getaddrinfo *.bspapp.com 文件查找失敗uview-ui 在運行一個uniapp項目時,出現報錯 文件查找失敗:uview-ui,Error: getaddrinfo ENOTFOUND 960c0a.bspapp.com。hostname異常,報錯的詳細信息如下&…

使用阿里云 API 進行聲音身份識別的方案

使用阿里云 API 進行聲音身份識別的方案 阿里云提供 智能語音交互(智能語音識別 ASR) 和 聲紋識別(說話人識別) 服務,你可以利用 阿里云智能語音 API 進行 說話人識別,實現客戶身份驗證。 方案概述 準備工…

【Pandas】pandas Series unstack

Pandas2.2 Series Computations descriptive stats 方法描述Series.argsort([axis, kind, order, stable])用于返回 Series 中元素排序后的索引位置的方法Series.argmin([axis, skipna])用于返回 Series 中最小值索引位置的方法Series.argmax([axis, skipna])用于返回 Series…

大模型發展歷程

大模型的發展歷程 大語言模型的發展歷程一、語言模型是個啥?二、語言模型的 “進化史”(一)統計語言模型(SLM)(二)神經語言模型(NLM)(三)預訓練語…

springboot項目使用中創InforSuiteAS替換tomcat

springboot項目使用中創InforSuiteAS替換tomcat 學習地址一、部署InforSuiteAS1、部署2、運行 二、springboot項目打包成war包 特殊處理1、pom文件處理1、排除內嵌的tomcat包2、新增tomcat、javax.servlet-api3、打包格式設置為war4、打包后的項目名稱5、啟動類修改1、原來的不…

Seata

Seata是一款開源的分布式事務解決方案,由阿里巴巴發起并維護,旨在幫助應用程序管理和協調分布式事務。以下是對Seata的詳細介紹: 一、概述 Seata致力于提供高性能和簡單易用的分布式事務服務,它為用戶提供了AT、TCC、SAGA和XA等…

Pytest自動化框架

Pytest簡單介紹 下載pytest pip install pytest 第一章:Pytest console命令 默認需要test開頭的py模塊,test_開頭的方法 1.pytest 執行pytest命令會自動匹配到test開頭或者結尾的文件 將其作為測試用例文件執行,在測試用例文件中自動匹配到test開…

【spring】注解版

1.管理bean 之前我們要想管理bean都是在xml文件中將想要添加的bean手動添加進ioc容器中,這樣太過麻煩了,在 Java 開發里,針對一些較為繁瑣的操作,通常會有相應的簡化方式,這個也不例外,就是spring提供的注…

RV1126+FFMPEG多路碼流監控項目

一.項目介紹: 本項目采用的是易百納RV1126開發板和CMOS攝像頭,使用的推流框架是FFMPEG開源項目。這個項目的工作流程如下(如上圖):通過采集攝像頭的VI模塊,再通過硬件編碼VENC模塊進行H264/H265的編碼壓縮,并把壓縮后的…

13.IIC-EEPROM(AT24C02)

1.為什么需要EEPROM? 在單片機開發中,斷電數據保存是常見的需求。例如,智能家居設備的用戶設置、電子秤的校準參數等都需要在斷電后仍能保留。AT24C02作為一款IIC接口的EEPROM芯片,具備以下優勢: 非易失性存儲:斷電后…

ubuntu22.04安裝P104-100一些經驗(非教程)

一、版本: 系統:ubuntu-22.04.5-desktop-amd64.iso Nvidia 驅動:NVIDIA-Linux-x86_64-570.124.04.run。官網下載即可 二、經驗 1、通用教程? 直接關鍵詞搜“ubuntu p104”會有一些教程,比如禁用nouveau等 安裝參考&#xff1a…