通過阿里云 Milvus 與 PAI 搭建高效的檢索增強對話系統

背景介紹

阿里云向量檢索服務Milvus版(簡稱阿里云Milvus)是一款云上全托管服務,確保了了與開源Milvus的100%兼容性,并支持無縫遷移。在開源版本的基礎上增強了可擴展性,能提供大規模 AI 向量數據的相似性檢索服務。相比于自建,目前阿里云Milvus具備易用性、可用性、安全性、低成本與生態優勢。憑借其開箱即用的特性、靈活的擴展能力和全鏈路監控告警,阿里云Milvus 云服務成為多樣化 AI 應用場景的理想選擇,包括多模態搜索、檢索增強生成(RAG)、搜索推薦、內容風險識別等。您還可以利用開源的 Attu 工具進行可視化操作,進一步促進應用的快速開發和部署。

阿里云Milvus現已無縫集成于阿里云PAI平臺,一站式賦能用戶構建高性能的RAG(Retrieval-Augmented Generation)對話系統。您可以利用Milvus作為向量數據的實時存儲與檢索核心,高效結合PAI和LangChain技術棧,實現從理論到實踐的快速轉化,搭建起功能強大的RAG解決方案。

前提條件

  • 已創建Milvus實例,并配置了公網訪問。

進入阿里云Milvus頁面(??https://www.aliyun.com/product/milvus???),登錄阿里云Milvus控制臺(??https://milvus.console.aliyun.com/#/overview??)。并在左側導航欄,單擊Milvus實例,并繼續創建實例

在目標實例的安全配置頁面,單擊開啟公網。輸入當前服務器的公網訪問IP地址或符合CIDR定義的IP地址段。

  • 已開通PAI(EAS)并創建了默認工作空間。

登錄??PAI控制臺???(??https://pai.console.aliyun.com??),在左上角選擇需要開通的地域后,進行認證、授權并開通服務,待開通成功后,便可進入控制臺進行AI開發。

使用限制

  • Milvus實例和PAI(EAS)須在相同地域下。

操作流程

步驟一:通過PAI部署RAG系統

1.進入模型在線服務頁面。

????????a.登錄??PAI控制臺??(??https://pai.console.aliyun.com/??)。

????????b.在左側導航欄單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間內。

????????c.在工作空間頁面的左側導航欄選擇模型部署>模型在線服務(EAS),進入模型在線服務(EAS)頁面。

2.在模型在線服務頁面,單擊部署服務

3.在部署服務頁面,選擇大模型RAG對話系統部署

4.在部署大模型RAG對話系統頁面,配置以下關鍵參數,其余參數可使用默認配置,更多參數詳情請參見??大模型RAG對話系統???(??https://help.aliyun.com/zh/pai/user-guide/deploy-a-rag-based-dialogue-system??)。

5.單擊部署

服務狀態變為運行中時,表示服務部署成功。

步驟二:通過RAG WebUI上傳知識庫

1.配置RAG對話系統。

????????a.在模型在線服務(EAS)頁面,單擊查看Web應用,進入WebUI頁面。

????????b.配置Embedding模型。

????????在RAG服務WebUI界面的Settings選項卡中,系統已自動識別并應用了部署服務時配置的向量檢索庫設置。

  • Embedding Model Name:系統內置四種模型供您選擇,將自動為您配置最合適的模型。
  • Embedding Dimension:選擇Embedding Model Name后,系統會自動進行配置,無需手動操作。

2.測試向量檢索庫連接是否正常。

系統已自動識別并應用了部署服務時配置的向量檢索庫設置,并且該設置不支持修改。您可以單擊Connect Milvus,來驗證Milvus連接是否正常。

3.上傳知識庫。 在RAG服務WebUI界面的Upload選項卡中,可以上傳知識庫文檔。

????????a. 設置語義切塊參數。

????????通過配置以下參數來控制文檔切塊粒度的大小和進行QA信息提取:

參數

描述

Chunk Size

指定每個分塊的大小,單位為字節,默認為500。

Chunk Overlap

表示相鄰分塊之間的重疊量,默認為10。

Process with QA Extraction Model

通過選中Yes復選框啟動QA信息提取功能,系統將在您上傳業務數據文件后自動抽取出QA對,以獲得更好的檢索和回答效果。

????????b. 在Files頁簽下上傳業務數據文件(支持多文件上傳)。

????????本文以唐詩三百首的??poems.txt???(??https://help-static-aliyun-doc.aliyuncs.com??)文檔作為示例數據,您可以直接使用。

????????c. 單擊Upload,系統會先對上傳的文件進行數據清洗(文本提取、超鏈接替換等)和語義切塊,然后進行上傳。

步驟三:通過RAG WebUI對話

在RAG服務WebUI界面的Chat選項卡中,提供了多種不同的Prompt策略,您可以選擇合適的預定義Prompt模板或輸入自定義的Prompt模板以獲得更好的推理效果。

1.配置LLM問答策略

????????a.在RAG服務WebUI界面的Chat選項卡中,選擇LLM。

????????b.直接與LLM對話,返回大模型的回答。

2.配置Retrieval問答策略

3.配置RAG(Retrieval + LLM)問答策略

選擇RAG (Retrieval + LLM),然后進行向量檢索等一系列實驗。

步驟四:查看知識庫切塊

Attu是一款專為Milvus打造的開源數據庫管理工具,提供了便捷的圖形化界面, 極大的簡化了對Milvus的操作與管理流程。下面,我們將使用Milvus的Attu工具,查看 向量檢索服務的存儲內容。

1.進入安全配置頁面。

????????a.登錄??阿里云Milvus控制臺??(??https://milvus.console.aliyun.com/??)。

????????b.在左側導航欄,單擊Milvus實例

????????c.在頂部菜單欄處,根據實際情況選擇地域。

????????d.在Milvus實例頁面,單擊目標實例名稱。

????????e.單擊安全配置頁簽。

2.配置公網訪問。

????????a.在安全配置頁簽,單擊開啟公網

????????b.輸入當前服務器的公網訪問IP地址或符合CIDR定義的IP地址段。

????????多個IP條目以半角逗號(,)隔開,不可重復。您可以通過訪問??https://www.cip.cc/??,獲取當前服務器的公網訪問IP地址。

????????c.單擊確定

3.訪問Attu頁面。

????????a.單擊頁面上方的Attu manager

?????????b.在彈出的對話框中輸入所要訪問的數據庫、用戶名和密碼,單擊連接,即可打開Attu管理頁面。

????????實例創建完成后,系統會自動創建一個名為default的默認數據庫,并為您創建一個名為root的用戶,該用戶的密碼由您在創建實例時自行設置。

4.在Attu頁面,您可以看到RAG服務自動創建的Collection。

相關信息

  • 更多關于Milvus的介紹,請參見??什么是向量檢索服務Milvus版???(??https://help.aliyun.com/zh/milvus/product-overview/what-is-the-vector-retrieval-milvus-version??)。
  • Milvus最新動態:
  • 預付費包年折扣:1年85折、2年7折、3年5折;
  • 產品動態:

如有疑問,可加入向量檢索 Milvus 版用戶交流釘群 59530004993咨詢。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/63539.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/63539.shtml
英文地址,請注明出處:http://en.pswp.cn/web/63539.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【批量生成WORD和PDF文件】根據表格內容和模板文件批量創建word文件,一次性生成多個word文檔和批量創建PDF文件

如何按照Word模板和表格的數據快速制作5000個word文檔 ? 在與客戶的合作的中需要創建大量的合同,這些合同的模板大概都是一致的,是不是每次我們都需要填充不一樣的數據來完成? 今天用表格數據完成合同模板的填充,批量…

pip使用方法

1. 安裝包: pip install :安裝指定的 Python 包。 pip install :安裝特定版本的 Python 包。 pip install -r requirements.txt:從文件中讀取依賴列表并安裝所有列出的包。 pip install --pre :允許安裝預發布或開發版…

Windows11 安裝 Ubuntu-20.04,同時安裝配置 zsh shell,配置 git 別名(alias),大大提高開發效率

背景:家里配置了一臺 Windows 電腦,有時候需要用到 vscode 開發測試一些代碼,在使用過程中發現原生 windows 敲代碼不是很友好,于是想到配置 wsl,安裝 Ubuntu,并安裝配置 zsh shell,同時配置 gi…

什么是漸進式 Web 應用,有哪些特點

漸進式 Web 應用 (Progressive Web Apps, PWAs) 的定義與特點 一、定義 漸進式 Web 應用(Progressive Web App,簡稱 PWA)是一種結合了傳統 Web 技術和現代移動應用特性的新型應用程序形式。PWAs 可以像普通網站一樣通過瀏覽器訪問&#xff…

鴻蒙心路旅程:HarmonyOS NEXT 心路旅程:技術、成長與未來

HarmonyOS NEXT 心路旅程:技術、成長與未來 技術的浪潮中,總有一些瞬間讓人感到心潮澎湃。作為一名HarmonyOS NEXT開發者,我有幸成為這個時代科技創新的一部分。從最初的接觸到深入學習、開發,以及如今規劃未來的職業方向&#x…

勤研低代碼平臺:重塑軟件開發協作新生態

在當今數字化浪潮洶涌澎湃的時代,軟件開發的效率與質量成為企業競爭的關鍵因素之一。勤研低代碼開發平臺以創新性的實際頁面 - 功能設計 - 頁面設計 - 原型頁面切換功能,脫穎而出,為軟件開發過程中的團隊協作、客戶溝通以及項目推進帶來了前所…

ChatGPT等大語言模型與水文水資源、水環境領域的深度融合

聚焦GPT等大語言模型與水文水資源領域的深度融合,通過系統化內容與實踐案例,講解如何高效完成時間序列分析、空間數據處理、水文模型優化以及智能科學寫作等任務。同時,展示AI在高級機器學習模型開發、資源優化算法編程與模型微調中的最新應用…

node安裝,npm安裝,vue-cli安裝以及element-ui配置項目

node.js Node.js主要用于開發高性能、高并發的網絡服務器,特別適合構建HTTP服務器、實時交互應用(如聊天室)和RESTful API服務器等。?它使用JavaScript語言,基于Chrome V8引擎,提供模塊化開發和豐富的npm生態系統&…

easyplayer-pro播放器學習

背調 查詢官方文檔,EasyPlayer-pro支持ws-flv, http-flv, hls, webrtc(webrtc://xxx)格式,電子放大、水印(動態水印、幽靈水印)、顯示上一個視頻最后一幀、播放器快照截圖、視頻錄制(WebM格式(音頻視頻)、MP4格式(視頻),FLV格式(…

5G 模組 初始化狀態檢測

5G 模組 上電檢測 5G 模組 上電檢測 #終端上電后,待模組正常啟動,再進入 控制臺。 #vim /etc/profile##新增 until [ -c /dev/ttyUSB1 ] doecho -e "Wait module[5G] up ... "sleep 5 done ##新增The End.

WPF+MVVM案例實戰與特效(四十三)- 打造動態炫酷彩虹字控件,讓你的界面動起來

文章目錄 1、引言1、案例效果2、案例實現1、XAML 布局2、邏輯代碼3、動畫效果4、控件使用5、運行效果3、案例源代碼4、總結1、引言 上一節,我們實現了炫酷的彩虹字控件,現在我們想讓彩虹字更加生動吸引人,讓每個字體跳動起來,讓字體活過來。這里我們通過動畫實現,我們把這…

線程知識總結(一)

1、概述 1.1 進程與線程 進程是程序運行時,操作系統進行資源分配的最小單位,包括 CPU、內存空間、磁盤 IO 等。從另一個角度講,進程是程序在設備(計算機、手機等)上的一次執行活動,或者說是正在運行中的程…

深入QML語法

文章目錄 深入了解 QML 文檔的結構和語法什么是 QML 文檔?導入語句導入語句的格式示例 對象聲明基本語法示例更復雜的對象聲明 QML 對象類型詳解1. Rectangle(矩形)2. Gradient(漸變)3. Text(文本&#xff…

【Python】使用Selenium 操作瀏覽器 自動化測試 記錄

【自動化】Python SeleniumUtil 工具 開啟開發者模式 自動安裝油猴用戶腳本等-CSDN博客文章瀏覽閱讀389次。【自動化】Python SeleniumUtil 工具。https://blog.csdn.net/G971005287W/article/details/144565691?spm1001.2014.3001.5501【學習記錄】瀏覽器指紋相關學習記錄&am…

Linux應用軟件編程-文件操作(標準io)

在Linux下一切皆文件,比如:.txt,.c,.h,.jpg,目錄,鍵盤,鼠標,顯示器、硬盤等等都是文件,即IO。文件操作的統一思想:打開文件,讀、寫文件…

【Rust自學】4.4. 引用與借用

4.4.0 寫在正文之前 這一節的內容其實就相當于C的智能指針移動語義在編譯器層面做了一些約束。Rust中引用的寫法通過編譯器的約束寫成了C中最理想、最規范的指針寫法。所以學過C的人對這一章肯定會非常熟悉。 喜歡的話別忘了點贊、收藏加關注哦(加關注即可閱讀全文…

深入解析 StarRocks 物化視圖:全方位的查詢改寫機制

小編導讀: 本文將重點介紹如何利用物化視圖進行查詢改寫。文章將全面介紹物化視圖的基本原理、關鍵特性、應用案例、使用場景、代碼細節以及主流大數據產品的物化視圖改寫能力對比。 物化視圖在 StarRocks 中扮演著至關重要的角色,它是進行數據建模和加速…

2. petalinux-build失敗

NOTE 解決因為網絡原因產生的編譯錯誤分享詳細的解決步驟 報錯的情況 因為網絡原因產生編譯錯誤 現象 找不到適合的包文件(No suitable stageing package found) 不能發現文件(Fetcher failure for URL) 解決方法 采用本地加載本地文件的方式,步驟如下 進入…

sql server msdb數據庫備份恢復

備份 BACKUP DATABASE [msdb] TO DISK ND:\liyuanshuai\test\sqlserver_bakfile\msdb20241219.bak WITH NOFORMAT, NOINIT, NAME Nlys-完整 數據庫 備份, SKIP, NOREWIND, NOUNLOAD, COMPRESSION, STATS 10 GO然后刪除2個測試的job,停止 SQL Server 代理…

web實驗二

web實驗二 2024.12.19 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>青島理工大學</title>&l…