AI本地部署

在這里插入圖片描述

  • 文檔加載(Document Loading):從多種不同來源加載文檔。LangChain提供了100多種不同的文檔加載器,包括PDF在內的非結構化的數據、SQL在內的結構化的數據,以及Python、Java之類的代碼等? ?
  • 文本分割(Splitting):文本分割器把Documents 切分為指定大小的塊,我把它們稱為“文檔塊”或者“文檔片”?
  • 存儲(Storage):存儲涉及到兩個環節,分別是:?
    ? 將切分好的文檔塊進行嵌入(Embedding)轉換成向量的形式?
    ? 將Embedding后的向量數據存儲到向量數據庫?
  • 檢索(Retrieval):一旦數據進入向量數據庫,我們仍然需要將數據檢索出來,我們會通過某種檢索算法找到與輸入問題相似的嵌入片?
  • Output(輸出):把問題以及檢索出來的嵌入片一起提交給LLM,LLM會通過問題和檢索出來的提示一起來生成更加合理的答案

文本加載器(Document Loaders)?

文本加載器就是將用戶提供的文本加載到內存中,便于進行后續的處理? ?

文本切割器(Text Splitters)?

文本分割器把Documents 切分為指定大小的塊,我把它們稱為“文檔塊”或者“文檔片”? 文本切割通常有以下幾個原因?
? 為了更好的進行文本嵌入以及向量數據庫的存儲?
? 通常大語言模型都有上下文的限制,如果不進行切割,文本在傳遞給大模型的時候可能超出上下文限制導致大模型隨機丟失信息?

文本切割器的概念是非常容易理解的,這里我們簡單了解下文本切割器的工作流程?

  1. 將文本切割成小的,語義上有意義的塊(通常是句子)?
  2. 開始將這些小塊組成一個較大的塊,直到達到某個塊的大小(這個會通過某種函數測量)?
  3. 一旦達到該大小,就將該塊作為自己的文本片段,并開始創建一個新的文本塊,同時保留一些重疊(以保持塊之間的上下文)。? ?

文本嵌入模型(Text Embedding models)?

文本嵌入模型是用來將文本轉換成數值向量的工具,這些向量能夠捕捉文本的語義信息,使得相似的文本在向量空間中彼此接近。這對于各種自然語言處理任務,如文本相似性比較、聚類和檢索等,都是非常有用的。下面是一段對嵌入的解釋

在這里插入圖片描述
在這里插入圖片描述

文本檢索?

一旦數據進入向量數據庫,我們仍然需要將數據檢索出來,我們會通過某種檢索算法找到與輸入問題相似的嵌入片。這里主要利用了大模型的能力

AnythingLLM 本地安裝、配置

  1. 選擇大模型
    在這里插入圖片描述
  2. 選擇文本嵌入模型
    在這里插入圖片描述
  3. 選擇向量數據庫
    在這里插入圖片描述

構建本地知識庫

AnythingLLM中有一個Workspace的概念,我們可以創建自己獨有的Workspace跟其他的項目數據進行隔離。

  1. 首先創建一個工作空間
    在這里插入圖片描述
  2. 上傳文檔并且在工作空間中進行文本嵌入

在這里插入圖片描述
3. 選擇對話模式?
AnythingLLM提供了兩種對話模式:?

  • Chat模式:大模型會根據自己的訓練數據和我們上傳的文檔數據綜合給出答案?
  • Query模式:大模型僅僅會依靠文檔中的數據給出答案
    在這里插入圖片描述
  1. 測試對話?
    當上述配置完成之后,我們就可以跟大模型進行對話了
    在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/72103.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/72103.shtml
英文地址,請注明出處:http://en.pswp.cn/web/72103.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

精準車型識別:視覺分析技術的力量

隨著智慧城市和智能交通系統的快速發展,車型識別檢測成為交通管理、安全監控和數據分析的關鍵技術之一。利用視覺分析的方式,我們可以高效、準確地檢測監控下的車輛類型、車牌信息及車流量,為城市交通管理提供有力支持。本文將從背景、技術實…

上下文微調(Contextual Fine-Tuning, CFT)提高大型語言模型(LLMs)在特定領域的學習和推理能力

大型語言模型(LLMs)在開放領域任務中表現出色,但在快速演變的專業領域(如醫學、金融)中面臨挑戰: 知識更新難題:傳統指令微調(Instruction Fine-Tuning, IFT)依賴顯式指令,難以適應動態知識。災難性遺忘:持續預訓練(Continued Pretraining, CPT)可能導致模型遺忘已…

在 LaTeX 中強制表格位于頁面頂部

在 LaTeX 中強制表格位于頁面頂部,可以通過以下 多種方法結合使用,按優先級推薦: 方法 1:使用 [!t] 位置限定符 原理:通過 [!t] 強制 LaTeX 優先將表格放置在頁面頂部(Top),! 表示忽…

kotlin與MVVM的結合使用總結(二)

在 MVVM(Model - View - ViewModel)架構中,M 層即 Model 層,主要負責數據的管理、存儲和獲取,它與業務邏輯和數據處理相關。在 Kotlin 中實現 MVVM 的 M 層,通常會涉及數據類的定義、數據的本地存儲與遠程獲…

電子元器件選型與實戰應用—16 怎么選一個合適的MCU芯片?

文章目錄 1. 選型要素1.1 價格1.2 技術支持1.3 廠家優勢1.4 功耗1.5 特殊功能1.6 統計外設1.7 確定外設占用的內存和flash大小1.8 確定外設通信接口1.9 確定外設通信接口的電平1.10 確定外設的GPIO數量1.11 確定外設的供電和功耗1.12 確定外設GPIO的種類1.13 確定ADC的數量1.14…

VSCode 搭建C++編程環境 2025新版圖文安裝教程(100%搭建成功,VSCode安裝+C++環境搭建+運行測試+背景圖設置)

名人說:博觀而約取,厚積而薄發。——蘇軾《稼說送張琥》 創作者:Code_流蘇(CSDN)(一個喜歡古詩詞和編程的Coder😊) 目錄 一、VScode下載及安裝二、安裝 MinGW-w64 工具鏈三、Windows環境變量配置四、檢查 M…

Django系列教程(7)——路由配置URLConf

目錄 URLconf是如何工作的? path和re_path方法 更多URL配置示例 URL的命名及reverse()方法 使用命名URL 硬編碼URL - 不建議 URL指向基于類的視圖(View) 通過URL傳遞額外的參數 小結 Django的項目文件夾和每個應用(app)目錄下都有urls.py文件,它們構成了D…

transformer bert 多頭自注意力

輸入的(a1,a2,a3,a4)是最終嵌入,是一個(512,768)的矩陣;而a1是一個token,尺寸是768 a1通過wq權重矩陣,經過全連接變換得到查詢向量q1;a2通過Wk權重矩陣得到鍵向量k2;q和k點乘就是值…

Spring Boot + MyBatis-Plus 項目目錄結構

以下是一個標準的 Spring Boot MyBatis-Plus 項目目錄結構及文件命名規范,包含每個目錄和文件的作用說明,適用于中大型項目開發: 項目根目錄結構 src/ ├── main/ │ ├── java/ # Java 源代碼 │ │ └── com/…

Webpack優化前端性能

Webpack優化前端性能☆☆ 涵蓋了代碼分割、懶加載、壓縮、緩存優化、Tree Shaking、圖片優化、CDN使用等多個方面。 Webpack優化前端性能詳解(2025綜合實踐版) Webpack作為現代前端工程化的核心工具,其優化能力直接影響項目的首屏速度、交互流暢度和用戶體驗。以下從代碼維…

ardunio R4 WiFi連接實戰

ardunio WiFi連接模板 ardunio R4 WiFi 開發板有著不錯的性能和板載內存,本機自帶 WiFi 連接模塊,可以完成簡單的網絡服務。對于這個小東西我情有獨鐘,也總希望能夠用它來做些什么,所以先從 WiFi 連接開始學起,未來考…

C++11 編譯使用 aws-cpp-sdk

一、對sdk的編譯前準備 1、軟件需求 此文檔針對于在Linux系統上使用源碼進行編譯開發操作系統使用原生的contos7Linux。機器配置建議 內存8G以上,CPU 4個 以上GCC 4.9.0 及以上版本Cmake 3.12以上 3.21以下apt install libcurl-devel openssl-devel libuuid-devel pulseaudio-…

得物 Android Crash 治理實踐

一、前言 通過修復歷史遺留的Crash漏報問題(包括端側SDK采集的兼容性優化及Crash平臺的數據消費機制完善),得物Android端的Crash監控體系得到顯著增強,使得歷史Crash數據的完整捕獲能力得到系統性改善,相應Crash指標也…

SpringBoot3+Lombok如何配置logback輸出日志到文件

Background/Requirement SpringBoot3Lombok如何配置logback輸出日志到文件,因為我需要對這些日志進行輸出,控制臺輸出和文件輸出,文件輸出是為了更好的作為AuditLog且支持滾動式備份,每天一個文件。 Technical Solution 1.確保你…

主流向量數據庫對比

在 AI 的 RAG(檢索增強生成)研發領域,向量數據庫是存儲和查詢向量嵌入的核心工具,用于支持高效的語義搜索和信息檢索。向量嵌入是文本或其他非結構化數據的數值表示,RAG 系統通過這些嵌入從知識庫中檢索相關信息&#…

搞定python之四----函數、lambda和模塊

本文是《搞定python》系列專欄的第四篇,通過代碼演示列python自定義函數、lambda和模塊的用法。本文學習完成后,python的基礎知識就完了。后面會學習面向對象的內容。 1、自定義函數 # 測試python自定義函數# 有參數,沒有返回值 def say_he…

[操作系統] 學校課程關于“靜態優先級搶占式調度“作業

今天我們來分享兩道題目哈, 學校弄得題目. T1: 靜態優先級, 搶占式(1為高優先級) 圖解: 以下是靜態優先級搶占式調度的解題過程和結果: 解題思路: 優先級規則: 數值越小優先級越高。新進程到達時,若其優先級高于當前運行進程&…

洛谷P1320 壓縮技術(續集版)

P1320 壓縮技術(續集版) 題目描述 設某漢字由 N N N \times N NN 的 0 \texttt 0 0 和 1 \texttt 1 1 的點陣圖案組成。 我們依照以下規則生成壓縮碼。連續一組數值:從漢字點陣圖案的第一行第一個符號開始計算,按書寫順序從…

使用DeepSeek完成一個簡單嵌入式開發

開啟DeepSeek對話 請幫我使用Altium Designer設計原理圖、PCB,使用keil完成代碼編寫;要求:使用stm32F103RCT6為主控芯片,控制3個流水燈的原理圖 這里需要注意,每次DeepSeek的回答都不太一樣。 DeepSeek回答 以下是使…

volatile、synchronized和Lock

名詞解釋: 指令重排是計算機為了優化執行效率,在不改變單線程程序結果的前提下,對代碼的執行順序進行重新排列的操作。它可能發生在編譯階段(編譯器優化)或CPU運行階段(處理器優化)。 舉個栗子…