Elastic 勞動力的生成式 AI:ElasticGPT 的幕后解析

作者:來自 Elastic?Jay Shah, Adhish Thite

ElasticGPT — 由 Elastic 提供支持,專為 Elastic 打造

ElasticGPT 是我們基于檢索增強生成(RAG)框架構建的內部生成式 AI (GenAI)助手。它是使用 Elastic 自有技術棧精心打造的,旨在為 Elastic 員工提供安全、可擴展且具備上下文感知的知識發現能力。

其核心是 SmartSource,這是一個私有的、內部構建并經過精細調優的 RAG 模型,它利用 Elasticsearch 進行向量檢索和數據存儲,從我們的內部數據源中檢索并傳遞最相關的上下文給 OpenAI 的大型語言模型(LLM)。這個生成式 AI 應用還通過 Elastic Cloud,借助專屬 Azure 租戶,為 OpenAI 的 GPT-4o 和 GPT-4o-mini 模型提供私密、安全的訪問。這種架構展示了 Elastic AI 生態系統從后端到前端的無縫集成與強大能力,整個過程都通過 Elastic 的可觀測性工具進行監控和優化。

在這篇文章中,我們將深入解析 ElasticGPT 的架構,重點介紹 SmartSource —— 我們基于 RAG 的內部 LLM 框架與模型,它徹底改變了我們從專有內部數據源中檢索和發現信息的方式。我們還將探討對 OpenAI 的 GPT-4o 和 GPT-4o-mini 模型的私有訪問如何擴展 ElasticGPT 的能力,使其超越 RAG,實現更廣泛的生成式任務 —— 同時始終堅持 “客戶零” 的理念。

Elastic on Elastic 故事:用我們的平臺構建 GenAI 應用

作為第一個用戶,構建 ElasticGPT 不僅是為了驗證我們的生成式 AI 能力并在 AI 時代實現關鍵效率提升,更是為了向產品團隊提供反饋,并與客戶分享最佳實踐,指導如何構建可持續、面向未來、可隨業務增長而擴展的生成式 AI 平臺。

ElasticGPT 不只是另一個工具 —— 它是 Elastic 技術協同工作的一個真實展示。我們從零開始構建它,完全基于 Elastic 的 Search AI Platform 中的解決方案與能力:

  • Elasticsearch 驅動數據與搜索核心
  • Elastic Cloud 實現輕松擴展
  • EUI,即 Elastic 內置設計庫,提供精致的前端
  • Elastic Observability 提供實時洞察

這種方法確保我們能夠利用 Elastic 的集成功能,構建安全、高性能、無縫的應用,滿足團隊當前的需求并應對未來的期望。

后端架構:Elasticsearch 作為強大的核心

ElasticGPT 的核心是 Elasticsearch,這是一款多功能強大工具,既是 SmartSource 的 RAG 功能所用的向量數據庫,也是所有模型聊天數據的高性能存儲庫。部署在 Elastic Cloud 上,這一架構具備支持日益增長的內部用戶群所需的靈活性、可擴展性和性能。

SmartSource 的向量數據庫

SmartSource 是我們內部模型的名稱,它利用 Elasticsearch 的向量數據庫存儲 embedding —— 即我們內部數據的數值表示,這些數據來自 Elastic 的 Wiki、ServiceNow 知識文章、ServiceNow 新聞文章等。通過 Elastic 的 Enterprise Connectors,我們可以輕松攝取這些數據,將其拆分為可搜索的片段,并生成 embedding 用于語義搜索。當用戶問“我們第一季度的銷售目標是多少?”時,SmartSource 會在 Elasticsearch 中執行高速向量搜索,檢索最相關的上下文 —— 可能是一段銷售報告或會議記錄 —— 并將其提供給 GPT-4o,生成精準回復。

這個架構讓 SmartSource 能基于我們的專有數據,提供精準、具備上下文的答案,這一切都得益于 Elastic 無與倫比的搜索能力。

所有模型的聊天數據存儲

每一次交互 —— 無論是與 SmartSource、GPT-4o,還是 GPT-4o-mini —— 都被精準記錄在 Elasticsearch 中,包括用戶消息、時間戳、反饋和元數據。

將這些數據存儲在 Elasticsearch 中不僅是為了記錄,更是為了持續優化。借助 Elastic 的分析功能,我們可以追蹤使用模式、識別常見問題并發現可優化區域。同時,通過 Elastic Observability 的 APM(應用性能監控),我們可以實時監控性能、可靠性和資源使用,確保在用戶數量增長時依然保持極速響應。用戶聊天數據每 30 天刪除一次,僅保留指標數據,從而以低成本保留最相關的信息。

前端架構:React 和 EUI 帶來無縫體驗

ElasticGPT 的前端是 React 與 EUI(Elastic 自有 UI 框架)的完美結合,確保它看起來像是我們生態系統的自然延伸。前端部署在 Elastic Cloud 內的 Kubernetes 上,具備動態擴展能力,并可與后端無縫集成。

為什么選擇 EUI?靈活性的實踐

一開始,我們嘗試使用 Hugging Face 的 Chat UI 以便快速起步,但當用戶需要自定義功能時,其局限性迅速顯現。轉向 EUI 是顯而易見的選擇 —— 它為 Elastic 產品量身打造,與我們的設計系統和后端完美契合。現在,ElasticGPT 的界面與 Kibana 等工具風格一致,帶來統一體驗,并能在生成式 AI 持續發展中快速迭代。

核心功能:實時與安全

前端支持實時流式響應,用戶可以自然看到答案逐步呈現 —— 更像一場對話,而非加載界面。來源標注與鏈接增強信任,而簡單的反饋按鈕讓用戶可以評價答案質量。安全性方面,Elastic 使用 Okta 單點登錄(SSO)進行認證,并通過端到端加密保障數據安全。得益于 Elastic Cloud 的 Kubernetes 編排,我們可在不停機的情況下部署更新,確保用戶體驗持續順暢且可靠。

API:連接前端與后端的粘合劑

ElasticGPT 的 API 是幕后英雄,它以無狀態、流式設計連接 React 前端與 Elasticsearch 后端,旨在高效傳輸,為用戶實時提供快速、準確的響應。

SmartSource 的工作機制

當用戶向 SmartSource 提出問題時,API 會在 Elasticsearch 中觸發向量搜索以獲取相關上下文,將其發送至 GPT-4o(部署在 Azure 上),并將生成的響應流式傳回前端。

對于 GPT-4o 和 GPT-4o-mini,API 會繞過 RAG pipeline,直接將查詢發送至 Azure 托管的模型,執行如頭腦風暴或常規問答等無上下文任務。

通過 Elastic APM 進行監控

Elastic APM 監控每一次 API 請求 —— 查詢延遲、錯誤率等 —— 確保我們在用戶受到影響前解決問題。Kibana 儀表板提供 API 性能、模型使用情況和系統健康狀況的全局視圖,強化平臺化架構的優勢。

LangChain:編排 RAG 流程

LangChain 是 SmartSource RAG 功能背后的編排層,它將 Elastic 的向量搜索與 GPT-4o 的生成能力連接起來,提供準確且具備上下文的響應。

  1. 它的作用:LangChain 全程管理 RAG 流程:對攝取的數據進行切分、生成 embedding、從 Elasticsearch 檢索上下文,并為 GPT-4o 構建 prompt。例如,當用戶詢問第一季度銷售情況時,LangChain 會從銷售報告中提取精確的片段 —— 而不是整篇文檔 —— 使回答簡潔且相關。

  2. 它為何適合 Elastic:LangChain 的靈活性與 Elastic Stack 完美契合。Elasticsearch 提供快速、可擴展的向量搜索,Elastic Cloud 確保基礎架構按需擴展。同時,Kibana 讓我們能與系統其他部分一起監控 LangChain 的性能,實現統一的可觀測性策略。

擴展能力:私有訪問 GPT-4o 和 GPT-4o-mini

除了 SmartSource,ElasticGPT 還提供對 LLMs(如 OpenAI 的 GPT-4o 和 GPT-4o-mini)的安全訪問,這些模型托管在私有 Azure 租戶中。這些模型適合無需內部數據檢索的任務 —— 如常規查詢、內容撰寫或創意頭腦風暴。而且,由于運行在安全環境中,員工可以放心分享公司內部數據,符合公司政策要求。

安全與合規:在 Azure 上托管這些模型,確保所有交互符合 Elastic 嚴格的安全與合規標準。Elastic 員工可以安心使用,確保數據私密且受保護。

Elasticsearch 中統一追蹤:所有 GPT-4o 和 GPT-4o-mini 的交互都記錄在 Elasticsearch 中。這種統一追蹤讓我們可以監控使用情況、收集反饋,并在所有 ElasticGPT 功能中保持一致的可觀測性。

Elastic 的 IT 團隊通過提供對多個 LLM 的安全訪問,降低了 shadow AI 的潛在影響。團隊目前正擴展支持其他 LLM,如 Anthropic 的 Claude 系列和 Google 的 Gemini 系列。

為什么平臺化方法是制勝之道

在我們自有平臺上構建 ElasticGPT,不只是務實之舉,更是戰略上的成功。原因如下:

  • 無縫集成:每個組件 —— Enterprise Connectors、Elasticsearch、EUI、APM —— 像拼圖一樣契合,消除摩擦與兼容性問題。
  • 按需擴展:Elastic Cloud 的自動擴展確保 ElasticGPT 隨我們成長,可支持數百乃至數千用戶而不受影響。
  • 內置安全:SSO、加密及 Elastic 的安全功能鎖定內部數據,確保合規與信任。
  • 實時監控:Elasticsearch、Elastic Observability 和 Kibana 分析儀表板揭示 ElasticGPT 的使用情況、優勢與可優化之處,助力持續改進。

這一平臺化方法打造出 v1 版本,已大幅減少重復 IT 問詢并提升員工效率。并且,由于它構建于我們的 Search AI Platform 上,我們可以跟隨生成式 AI 的發展快速迭代。

接下來?

在持續推進 ElasticGPT 的同時,我們將廣泛使用強大的 Elastic 技術棧,利用諸如 “Semantic Text” 字段類型、推理端點和 LLM 可觀測性等新功能,持續測試和應用最新能力。

同時,隨著 agentic AI 的興起,ElasticGPT 將演進為集成專用 AI agent,以簡化工作流、大幅提升生產力,并改善所有 Elastic 員工的日常體驗。

今天就開始構建生成式 AI 應用

準備好自己動手了嗎?訪問我們的免費 AI playground,立即開始構建。

本文所述任何功能或特性的發布與時間安排完全由 Elastic 自行決定。任何當前尚未發布的功能或特性,可能不會按時交付,甚至可能不會交付。

本文中可能使用或提及了第三方生成式 AI 工具,其所有權與運營權歸其各自所有者所有。Elastic 不控制這些第三方工具,亦不對其內容、運行或使用承擔任何責任,也不對你使用此類工具而造成的任何損失或損害承擔責任。使用 AI 工具時,請謹慎處理個人、敏感或機密信息。你提交的任何數據可能會被用于 AI 訓練或其他用途,不能保證信息的安全或保密性。使用前,你應了解任何生成式 AI 工具的隱私政策和使用條款。

Elastic、Elasticsearch、ESRE、Elasticsearch Relevance Engine 及相關標志為 Elasticsearch N.V. 在美國及其他國家的商標、徽標或注冊商標。其他所有公司與產品名稱均為其各自所有者的商標、徽標或注冊商標。

原文:Generative AI for Elastic’s workforce: Under the hood of ElasticGPT | Elastic Blog

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/90687.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/90687.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/90687.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

CS231n-2017 Assignment1

KNN:這里要求我們完成一個KNN分類器,實現對圖片使用KNN算法進行分類標簽k_nearest_neighbor.py這里要求我們完成4個接口# X:測試集 # 使用兩個循環 def compute_distances_two_loops(self, X):num_test X.shape[0]num_train self.X_train.shape[0]dist…

[python][flask]Flask-Principal 使用詳解

Flask-Principal 是一個專為 Flask 應用設計的身份管理和權限控制擴展。它能夠幫助開發者輕松實現用戶身份驗證和權限管理,從而提升應用的安全性和用戶體驗。該項目最初由 Ali Afshar 開發,現已成為 Pallets 社區生態系統的一部分,由社區共同…

抖音與B站爬蟲實戰,獲取核心數據

本文將深入講解兩大主流短視頻平臺(抖音、B站)的爬蟲實戰技術,提供可直接運行的代碼解決方案,并分享突破反爬機制的核心技巧。一、平臺特性與爬蟲難點對比平臺數據價值主要反爬措施推薦抓取方式抖音視頻數據、用戶畫像、熱榜簽名驗…

WSL切換網絡模式

WSL切換網絡模式問題WSL從NAT改成MIRRORED找到WSL Setting修改配置重啟電腦(注意不是重啟WSL)運行pio run驗證IP問題 從魚香ROS買了一個小魚車,開始學習,然而裝環境都要搞死我了。 垃圾VirtualBox我新買的電腦,裝個Vi…

[Linux入門] Linux 遠程訪問及控制全解析:從入門到實戰

目錄 一、SSH 遠程管理:為什么它是遠程訪問的首選? 1??什么是 SSH? 2??SSH 為什么比傳統工具更安全? 3??SSH 的 “三大組成部分” 4??SSH 工作的 “五步流程” 5??常用 SSH 工具 二、實戰:構建 SSH 遠…

n8n AI資訊聚合與分發自動化教程:從數據獲取到微信與Notion集成

引言 n8n簡介:自動化工作流利器 n8n是一款功能強大的開源自動化工具,采用獨特的“公平代碼”(Fair-Code)許可模式,旨在幫助用戶連接各種應用程序和服務,從而實現工作流的自動化。它通過直觀的可視化界面&am…

遞歸查詢美國加速-技術演進與行業應用深度解析

在當今數據驅動的時代,遞歸查詢已成為處理層級數據的核心技術,尤其在美國科技領域獲得廣泛應用。本文將深入解析遞歸查詢在美國加速發展的關鍵因素,包括技術演進、行業應用場景以及性能優化策略,幫助讀者全面理解這一重要技術趨勢…

【AIGC專欄】WebUI實現圖片的縮放

圖片的縮放包含如下的各類不同的縮放模型。 Lanczos Lanczos重采樣是一種數學上精確的方法,用于圖像放大或縮小。它使用了一種稱為 sinc 函數的數學公式,可以在保留圖像細節的同時減少鋸齒效應。 Nearest 最近鄰插值是一種簡單的圖像放大方法,通過復制最近的像素值來填充新…

Libevent(4)之使用教程(3)配置

Libevent(4)之使用教程(3)配置事件 Author: Once Day Date: 2025年7月27日 一位熱衷于Linux學習和開發的菜鳥,試圖譜寫一場冒險之旅,也許終點只是一場白日夢… 漫漫長路,有人對你微笑過嘛… 本文檔翻譯于:Fast portable non-bl…

若依前后端分離版學習筆記(三)——表結構介紹

前言: 這一節將ruoyi框架中數據庫中的表結構過一遍,查看都有哪些表及其表結構及關聯關系,為后續代碼學習做準備。 一 代碼生成表記錄代碼生成的業務表及相關字段1 代碼生成業務表 CREATE TABLE gen_table (table_id bigint(20) NOT NULL AUTO…

NFS服務安裝與使用

概述 內網需要使用NFS服務掛載到其他服務器,用做數據備份使用。 安裝 # Centos yum install -y nfs-utils # Ubuntu apt install nfs-common配置 # 編輯 vim /etc/exports # 輸入內容 /public/KOL-ESbackup 172.29.1.0/24 192.168.8.63 192.168.8.64 192.168.8.65(r…

使用adb 發送廣播 動態改變app內的值

前言 在開發過程中有時候我們需要做一些調試工作。可以通過adb發送廣播實現。 廣播注冊 注意最后一個參數,Context.RECEIVER_EXPORTED 這是Android 34以后強制要求的,方便外部發送這個廣播。否則會報錯val filter IntentFilter()filter.addAction("…

【Web安全】邏輯漏洞之URL跳轉漏洞:原理、場景與防御

文章目錄前言一、漏洞本質二、攻擊原理正常跳轉流程漏洞觸發流程三、抓包的關鍵時機:跳轉參數生成時四、風險場景1.登錄/注冊后跳轉2.退出登錄跳轉3.分享/廣告鏈接跳轉4.密碼重置鏈接跳轉五、漏洞挖掘:怎么找到這種漏洞?1.找到跳轉參數2.篡改…

新手開發 App,容易陷入哪些誤區?

新手開發 App 時,常因對流程和用戶需求理解不足陷入誤區,不僅拖慢進度,還可能導致產品無人問津。?功能堆砌是最常見的陷阱。不少新手總想 “一步到位”,在初期版本就加入十幾項功能,比如做社區團購 App 時&#xff0c…

Linux學習篇11——Linux軟件包管理利器:RPM與YUM詳解與實戰指南,包含如何配置失效的YUM鏡像地址

引言 本文主要梳理 Linux 系統中的軟件包的概念,同時介紹RPM與YUM兩大核心管理工具的常用指令、區別聯系以及實戰技巧等。本文作為作者學習Linux系統的第11篇文章,依舊旨在總結當前的學習內容,同時鞏固知識以便日后的學習復習回顧。如有說的…

Vue3+ElementPlus實現可拖拽/吸附/搜索/收起展開的浮動菜單組件

在開發后臺管理系統時,我們經常會用到浮動菜單來快速訪問某些功能。本篇文章將分享一個基于 Vue3 ElementPlus 實現的浮動菜單組件,支持拖拽移動、邊緣吸附、二級菜單展開、菜單搜索過濾、視頻彈窗等交互效果,極大提升了用戶操作的便捷性與美…

CSS 盒子模型學習版的理解

文章目錄一、盒子模型構建流程(一句話抓關鍵)二、核心邏輯提煉三、代碼驗證四、一句話總結流程通過手繪圖示,清晰拆解 Content(內容)→ Padding(內邊距)→ Border(邊框)→…

解決線程安全的幾個方法

線程安全:線程安全問題的發現與解決-CSDN博客 Java中所使用的并發機制依賴于JVM的實現和CPU的指令。 所以了解并掌握深入Java并發編程基礎的前提知識是熟悉JVM的實現了解CPU的指令。 1.volatile簡介 在多線程并發編程中,有兩個重要的關鍵字&#xff1a…

大模型應用班-第2課 DeepSeek使用與提示詞工程課程重點 學習ollama 安裝 用deepseek-r1:1.5b 分析PDF 內容

DeepSeek使用與提示詞工程課程重點Homework:ollama 安裝 用deepseek-r1:1.5b 分析PDF 內容python 代碼建構:1.小模型 1.5b 可以在 筆記本上快速執行2.分析結果還不錯3. 重點是提示詞 prompt 的寫法一、DeepSeek模型創新與特點1. DeepSeek-V3模型特點采用…

在FreeBSD系統下使用llama-cpp運行飛槳開源大模型Ernie4.5 0.3B(失敗)

先上結論,截止到目前2025.7.25日,還不能用。也就是Ernie4.5模型無法在llama.cpp 和Ollama上進行推理,原因主要就llama是不支持Ernie4.5異構MoE架構。 不局限于FreeBSD系統,Windows也測試失敗,理論上Ubuntu下也是不行。…