AI本地部署

在這里插入圖片描述

文檔加載（Document Loading）：從多種不同來源加載文檔。LangChain提供了100多種不同的文檔加載器，包括PDF在內的非結構化的數據、SQL在內的結構化的數據，以及Python、Java之類的代碼等? ?
文本分割（Splitting）：文本分割器把Documents 切分為指定大小的塊，我把它們稱為“文檔塊”或者“文檔片”?
存儲（Storage）：存儲涉及到兩個環節，分別是：?
? 將切分好的文檔塊進行嵌入（Embedding）轉換成向量的形式?
? 將Embedding后的向量數據存儲到向量數據庫?
檢索（Retrieval）：一旦數據進入向量數據庫，我們仍然需要將數據檢索出來，我們會通過某種檢索算法找到與輸入問題相似的嵌入片?
Output（輸出）：把問題以及檢索出來的嵌入片一起提交給LLM，LLM會通過問題和檢索出來的提示一起來生成更加合理的答案

文本加載器就是將用戶提供的文本加載到內存中，便于進行后續的處理? ?

文本分割器把Documents 切分為指定大小的塊，我把它們稱為“文檔塊”或者“文檔片”? 文本切割通常有以下幾個原因?
? 為了更好的進行文本嵌入以及向量數據庫的存儲?
? 通常大語言模型都有上下文的限制，如果不進行切割，文本在傳遞給大模型的時候可能超出上下文限制導致大模型隨機丟失信息?

文本切割器的概念是非常容易理解的，這里我們簡單了解下文本切割器的工作流程?

文本嵌入模型是用來將文本轉換成數值向量的工具，這些向量能夠捕捉文本的語義信息，使得相似的文本在向量空間中彼此接近。這對于各種自然語言處理任務，如文本相似性比較、聚類和檢索等，都是非常有用的。下面是一段對嵌入的解釋

在這里插入圖片描述

一旦數據進入向量數據庫，我們仍然需要將數據檢索出來，我們會通過某種檢索算法找到與輸入問題相似的嵌入片。這里主要利用了大模型的能力

AnythingLLM 本地安裝、配置

AnythingLLM中有一個Workspace的概念，我們可以創建自己獨有的Workspace跟其他的項目數據進行隔離。

在這里插入圖片描述
3. 選擇對話模式?
AnythingLLM提供了兩種對話模式：?

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/72103.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/72103.shtml
英文地址，請注明出處：http://en.pswp.cn/web/72103.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！