[云上玩轉Qwen3系列之四]PAI-LangStudio x AI搜索開放平臺 x ElasticSearch: 構建AI Search RAG全棧應用

本文詳細介紹了如何使用 PAI-LangStudio 和 Qwen3 構建基于AI搜索開放平臺 x ElasticSearch 的 AI Search RAG 智能檢索應用。該應用通過使用 AI 搜索開放平臺、ElasticSearch 全文檢索+向量檢索引擎的混合檢索技術配合阿里云最新發布的 Qwen3 推理模型編排在一個 Agentic Workflow 中,為客戶提供了業內領先的 AI Search RAG 檢索應用能力,使用 NLP 自然語言即可實現 AI Search 的精準查詢可靠效果。開發者可以基于該模板進行靈活擴展和二次開發,以滿足特定場景的需求。

實踐背景

本文是基于 PAI-LangStudio x AI 搜索開放平臺 x ElasticSearch 來構建業內領先且功能強大的一站式 AI Search 智能混合檢索 RAG 智能應用方案。下面介紹如何完成場景實操:

前提條件

  • 已創建專有網絡 VPC、交換機和安全組。具體操作請參見搭建IPv4專有網絡和創建安全組。
  • 登錄 PAI 控制臺,在左側導航欄單擊工作空間列表(如無 已有工作空間列表)。在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間內。如您尚未創建工作空間,請創建工作空間。
  • 登錄AI搜索開放平臺,獲取 Endoint 和 API-Key。
  • 登錄 Elasticsearch控制臺,創建 Elasticsearch 實例,并進行安全訪問配置(如可打開“使用HTTPS協議”選項以增強安全性)。

場景部署步驟

步驟一:在PAI-LangStudio中添加模型服務連接:

1. 通過 PAI控制臺 > 進入PAI-LangStudio > 連接 > 模型服務 > 新建連接

2. 選擇 “AI搜索開放平臺 Embedding 模型服務”,并填入從AI搜索開放平臺獲取到的 Endpoint 和api_key,創建模型服務連接:

3. 創建好后,可以在列表頁看到剛剛創建的AI搜索開放平臺Embedding模型服務連接:

步驟二:在PAI-LangStudio中新建數據庫連接

  1. 在PAI-LangStudio中,選擇“連接” -> “數據庫” 標簽頁后,點擊“新建連接”:

2. 填入在Elasticsearch控制臺中查看到的Elasticsearch實例的地址和用戶名、密碼(注意如果Elasticsearch未開啟HTTPS連接,此處url需要填寫 http:// 頭)后,點擊確定:

此時在連接列表中可以看到剛剛添加的數據庫連接:

步驟三:新建PAI-LangStudio運行時相關信息

1. "運行時"設置確認。在PAI-LangStudio中選擇“運行時”標簽頁,點擊“新建運行時”,填入必要的信息如:運行時工作路徑(選擇OSSbucket中一個目錄)、專有網絡、安全組與交換機信息(需要跟Elasticsearch所在網絡暢通)后點擊“確定”:

2. 之后可以在運行時列表中看到該運行時。

步驟四:在PAI-LangStudio中創建知識庫

1. 在PAI-LangStudio中,選擇“知識庫”標簽頁,并點擊“新建知識庫”,選擇文檔所在OSS路徑作為“數據源OSS路徑”,并選擇一個“輸出OSS路徑”用來保存文檔解析處理中間結果和索引相關信息:

2. 選擇 “AI搜索開放平臺 Embedding 模型服務”標簽,并選擇步驟一中創建的模型服務連接后,可以選擇具體支持的Embedding模型(其中 001模型 和 002模型維度不同,可用于不同場景選擇);選擇步驟二中創建的向量數據庫連接,并填入一個向量數據庫索引名,選擇步驟5中創建的運行時后,點擊確定:

3. 之后可以在知識庫列表中看到剛剛創建的知識庫。點擊知識庫名稱后,可以查看知識庫概覽、文檔查看,以及進行召回測試:

4. 在“文檔”標簽頁,可以通過拖拽方式將本地文件上傳至OSS中:

5. 在文檔上傳后,點擊“更新索引”按鈕,在彈出的浮窗中選擇網絡和安全組資源配置后,點擊“確定”,即可開始進行知識庫索引的更新:

此時可以看到有一個索引創建的任務在運行中(也可以通過知識庫->操作記錄查看任務):

等待幾分鐘后,索引構建完畢。此時刷新文檔標簽頁,可以看到文檔從“未索引”狀態 變為“已索引”。點擊列表中的文檔名稱,可以看到該文檔的分塊情況,以及每個文檔塊的使能與否。通過點擊文檔分塊中的? 標記,也可以對該文檔塊進行enable/disable操作。當文檔分塊被disable后,進行召回時將忽略該文檔塊:

6. 在PAI-LangStudio的新版知識庫中,選擇“召回測試”標簽,輸入問題,設置檢索條件(建議score閾值在0.5-0.6之間)后,點擊“測試”,可以在右側看到召回結果:

步驟五:在應用流中使用RAG知識庫

1. 在PAI-LangStudio的“應用流”標簽點擊“新建應用流”,選擇“從模板新建” -> “RAG”模板,創建應用流:

之后自動跳轉至應用流界面:

2. 點擊“知識庫檢索”節點,配置檢索參數(選擇知識庫索引,設置filter):

2. 點擊“大模型”節點,配置“模型設置”(選擇模型、配置參數、開啟/關閉思考):

3. 點擊“運行”按鈕,輸入檢索問題后,可以工作流中的運行框獲取檢索信息:

由于ElasticSearch的混合檢索能力,檢索準確率大大提升。

步驟六:通過 PAI-LangStudio部署EAS模型服務,支持API調用知識庫能力

應用流開發調試完成后,單擊右上角的部署,根據需要選擇合適的機型以及專有網絡,注意EAS實例需要使用與應用流中其他服務實例相同的VPC,以保證安全和網絡連通。點擊確定 > 跳轉到PAI-EAS模型服務 查看部署任務。

場景方案價值 - ES + RAG Agent應用

在PAI- LangStudio 中, 使用AI搜索開放平臺提供原子化Embeding/Rerank模型能力和Elasticsearch向量數據庫,高效地處理大規模數據,結合大模型LLM分析能力,以快速構建一站式AI Search RAG增強搜索/混合檢索的全棧應用能力。將AI智能信息檢索與智能問答效率與準確率大大提升。

通過以上步驟,您可快速使用PAI-LangStudio構建基于 AI搜索開放平臺 和Elasticsearch引擎優勢實現AI Search RAG應用,滿足專業知識庫場景AI Search需求。

更多介紹

Qwen3

作為Qwen 系列最新一代的大語言模型,提供了一系列密集(Dense)和混合專家(MOE)模型。基于廣泛的訓練,Qwen3 在推理、指令跟隨、代理能力和多語言支持方面取得了突破性的進展,具有以下關鍵特性:

  • 獨特支持在思考模式(用于復雜邏輯推理、數學和編碼)和 非思考模式(用于高效通用對話)之間無縫切換,確保在各種場景下的最佳性能。
  • 顯著增強的推理能力,在數學、代碼生成和常識邏輯推理方面超越了之前的 QwQ (在思考模式下)和 Qwen2.5 指令模型(在非思考模式下)。
  • 擅長 Agent 能力,可以在思考和非思考模式下精確集成外部工具,在復雜的基于代理的任務中在開源模型中表現領先。可與PAI-LangStudio 大模型開發平臺無縫集成:結合MCP Server服務,增強智能數據分析能力
  • 支持 100 多種語言和方言,具有強大的多語言理解、推理、指令跟隨和生成能力。

PAI-LangStudio - 大模型Agent應用開發平臺

大模型&Agent應用開發平臺(PAI-LangStudio)是依托阿里云PAI產品核心能力構建的面向企業級用戶的一站式大模型應用開發平臺。簡化了企業級大模型應用的開發流程,同時提供了靈活的可編程能力、實時調試能力與鏈路追蹤的能力,幫助開發者快速構建端到端的AI應用。原生兼容支持通義系列Qwen系列大模型。PAI-LangStudio專注于提供LLM全鏈路開發部署能力,可支持發布有狀態、多Agent的復雜工作流發布部署成PAI-EAS模型服務,并在生產環境提供API應用服務。

參考:大模型應用開發LangStudio_人工智能平臺 PAI(PAI)-阿里云幫助中心

AI搜索開放平臺

AI搜索開放平臺圍繞智能搜索及RAG場景,將AI搜索鏈路中用到的算法服務以組件化形式提供,內置文檔解析、文檔切片、文本向量化、查詢分析、召回、排序、效果評估以及LLM模型服務,開發者根據自身情況靈活選擇組件服務進行搜索業務開發。

AI搜索開放平臺-聯網搜索

AI搜索開放平臺提供聯網搜索功能,支持直接調用聯網搜索API或調用內容生成服務時啟用聯網搜索。

ElasticSearch混合檢索

阿里云檢索服務Elasticsearch版(簡稱ES)結合了AI搜索開放平臺的組件化模型能力,提供全文檢索+向量檢索引擎的混合檢索技術, 可用于構建高效、精準的復雜語義搜索系統。通過搭建AI語義搜索的方法,帶用戶體驗AI技術如何提升搜索的準確性和用戶體驗。

RAG 檢索增強 簡介

隨著AI技術的飛速發展,生成式人工智能在文本生成、圖像生成等領域展現出了令人矚目的成就。然而,在廣泛應用大語言模型(LLM)的過程中,以下固有局限性問題逐漸顯現:

  • 領域知識局限:大語言模型通常基于大規模通用數據集訓練而成,難以針對專業垂直領域提供深入和針對性處理。
  • 信息更新滯后:由于模型訓練所依賴的數據集具有靜態特性,大模型無法實時獲取和學習最新的信息與知識進展。
  • 模型誤導性輸出:受制于數據偏差、模型內在缺陷等因素,大語言模型可能會出現看似合理實則錯誤的輸出,即所謂的“大模型幻覺”。

為克服這些挑戰,并進一步強化大模型的功能性和準確性,檢索增強生成技術RAG(Retrieval-Augmented Generation)應運而生。這一技術通過整合外部知識庫,能夠顯著減少大模型虛構的問題,并提升其獲取及應用最新知識的能力,從而實現更個性化和精準化的LLM定制。

相關鏈接

  • LangStudio產品文檔
  • AI搜索開放平臺
  • 檢索分析服務Elasticsearch版
  • 阿里云Elasticsearch AI場景語義搜索
  • 基于阿里云Elasticsearch使用RAG搭建知識庫在線問答

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/87147.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/87147.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/87147.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

前端請求瀏覽器提示net::ERR_UNSAFE_PORT的解決方案

起因 項目中后端給到了6666端口的服務地址, 隨即前端項目訪問中瀏覽器報錯如下: 不安全端口在主流瀏覽器(Chrome/Firefox/Edge/Safari)中會被攔截,觸發瀏覽器Network的status列顯示 net::ERR_UNSAFE_PORT 錯誤, 以下是常見的不安全端口一覽…

【Bluedroid】藍牙設備管理器初始化全流程深度解析(BTA_dm_on_hw_on)

本文全面剖析Android藍牙設備管理器在硬件啟動時的初始化流程,涵蓋控制塊創建、服務發現啟動、設備類配置、安全密鑰加載、超時參數設置等核心環節。通過分析從底層硬件交互到上層服務注冊的全鏈路調用,揭示藍牙系統從硬件就緒到功能可用的完整啟動機制&…

大語言模型:是逐字生成還是一次多詞?

大語言模型(LLM)既可以按順序逐個生成單詞(token),也能實現一次生成多個 token 核心差異源于解碼策略與模型架構設計 一、常規“逐個生成”模式(基礎邏輯) 多數入門級演示或簡單文本生成中,LLM 會默認按 “生成一個 token → 拼接回輸入 → 再生成下一個” 的流程,…

通俗易懂的LangGraph圖定義解析

LangGraph 是一個基于狀態的工作流框架,它通過 節點(Nodes) 和 邊(Edges) 的組合,構建出復雜的工作流邏輯。這種設計特別適合處理需要動態決策、循環、多步驟交互的場景(比如對話系統、智能代理…

K8s Pod調度基礎——2

目錄 一、Deployment ?一、Deployment 原理? ?二、核心特性? ?三、意義與場景? ?四、示例與逐行解釋? ?五、總結? StatefulSet ?一、StatefulSet 原理? ?二、核心特性? ?三、意義與場景? ?四、示例與逐行解釋? ?五、總結? 彼此的區別 一、本質…

Java 大視界 -- Java 大數據在智能醫療健康管理中的慢性病風險預測與個性化干預(330)

Java 大視界 -- Java 大數據在智能醫療健康管理中的慢性病風險預測與個性化干預(330) 引言:正文:一、Java 構建的醫療數據融合平臺(多源數據安全打通)1.1 分布式醫療數據集成系統(符合 HIPAA 與…

beego打包發布到Centos系統及國產麒麟系統完整教程

1、先清除go緩存,用下面命令 go clean -cache go clean -modcache 2、更新庫文件 go mod tidy 3、安裝beego go install github.com/beego/bee/v2latest 4、查看bee版本 5、進行打包然后傳到Centos和麒麟服務器如下代碼 bee pack -be GOOSlinux -be GOARCHa…

Instagram和facebook廣告對比解析

一、平臺用戶畫像對比 用戶基礎數據 (1)活躍用戶規模 Instagram:20億MAU,以年輕群體為主力 Facebook:29億MAU,覆蓋全年齡段用戶 (2)核心用戶特征 Instagram: ? 25-3…

[MIA 2025]CLIP in medical imaging: A survey

論文網址:CLIP in medical imaging: A survey - ScienceDirect 項目頁面:github.com 英文是純手打的!論文原文的summarizing and paraphrasing。可能會出現難以避免的拼寫錯誤和語法錯誤,若有發現歡迎評論指正!文章偏…

Python通訊錄系統實戰教程

具體介紹見 通訊錄管理系統設計與實現(C)-CSDN博客 class Person:def __init__(self, name"", sex0, age0, phone"", addr""):self.m_name name # 姓名self.m_Sex sex # 性別(1-男,2-女…

蝦米壁紙分類頁面代碼

<template> <view class"wallpaper-category"> <custom-nav-bar title"分類列表"></custom-nav-bar> <!-- 分類展示 --> <scroll-view scroll-y class"category-scroll-view"> <view cl…

K8s-pod 調度基礎

目錄 Replication Controller&#xff08;RC&#xff09; 概念 關鍵字段 Replica Set&#xff08;RS&#xff09; 概念 關鍵字段 RC 與 RS 的區別 無狀態應用管理Deployment 無狀態應用&#xff08;Stateless Application&#xff09; 什么是無狀態&#xff1f; 無狀…

Vue + RuoYi 前后端分離入門手冊

Vue RuoYi 前后端分離技術棧是一個非常流行且成熟的企業級后臺管理系統開發方案&#xff0c;尤其在國內 Java 開發社區中廣泛應用。它結合了現代化的前端框架 Vue.js 和基于 Spring Boot 的后端框架 RuoYi&#xff0c;提供了開箱即用的權限管理、代碼生成、監控等功能&#xf…

JSON 安裝使用教程

一、JSON 簡介 JSON&#xff08;JavaScript Object Notation&#xff09;是一種輕量級的數據交換格式&#xff0c;易于人閱讀和編寫&#xff0c;同時也易于機器解析和生成。它廣泛應用于前后端數據通信、配置文件、API 傳輸等場景。 二、JSON 是否需要安裝&#xff1f; 不需要…

十大網絡協議

十大網絡協議 標題1. HTTP&#xff08;HyperText Transfer Protocol&#xff0c;超文本傳輸協議&#xff09;標題2. HTTPS&#xff08;Secure Hypertext Transfer Protocol&#xff0c;安全超文本傳輸協議&#xff09;標題3. HTTP/3標題4. TCP&#xff08;Transmission Control…

【語音告警】博靈智能語音報警燈Modbus TCP觸發告警實例-語音報警燈|聲光報警器|網絡信號燈

功能說明 本文將以Python代碼為例&#xff0c;講解如何通過Python代碼調用博靈語音通知終端A4實現聲光語音告警。 本代碼實現Python觸發Modbus寫多寄存器和寫單寄存器實現調用通知終端模板播報功能&#xff08;通知終端內置TTS語音合成技術&#xff0c;本案例不講解如何文本轉…

攝像頭 rtsp數據量 和正常數據流有什么區別

攝像頭RTSP數據流和正常數據流&#xff08;如HTTP傳輸的普通文件或網頁數據&#xff09;在多個方面存在顯著差異&#xff0c;主要體現在協議特性、數據量、實時性、應用場景等方面。以下是具體對比&#xff1a; 1. 協議與傳輸方式 RTSP流&#xff1a; 實時流協議&#xff08;R…

深入理解裝飾器模式:動態擴展對象功能的靈活設計模式

深入理解裝飾器模式&#xff1a;動態擴展對象功能的靈活設計模式 &#x1f31f; 嗨&#xff0c;我是IRpickstars&#xff01; &#x1f30c; 總有一行代碼&#xff0c;能點亮萬千星辰。 &#x1f50d; 在技術的宇宙中&#xff0c;我愿做永不停歇的探索者。 ? 用代碼丈量世界…

141.在 Vue 3 中使用 OpenLayers Link 交互:把地圖中心點 / 縮放級別 / 旋轉角度實時寫進 URL,并同步解析顯示

本文分享一個前端小技巧&#xff1a;借助 OpenLayers 的 Link 交互 在瀏覽器地址欄實時記錄地圖狀態&#xff0c;同時把這些參數解析出來展示在頁面上。 ? 雙向同步&#xff1a;拖動、縮放、旋轉地圖時&#xff0c;URL 自動更新&#xff1b;手動修改 URL 或后退 / 前進&#x…

數字人的形象與內容,虛擬形象背后的權益暗戰

&#xff08;首席數據官高鵬律師數字經濟團隊創作&#xff0c;AI輔助&#xff09; 當某科技公司的虛擬偶像在直播間收獲百萬打賞時&#xff0c;當某品牌的數字代言人形象被篡改成表情包全網傳播時&#xff0c;當網紅博主的AI分身開始替代真人直播帶貨時&#xff0c;一場關于數…