華為云Flexus+DeepSeek征文|CCE容器高可用部署搭建Dify-LLM平臺部署AI Agent

華為云Flexus+DeepSeek征文|CCE容器高可用部署搭建Dify-LLM平臺部署AI Agent

前言

Dify是一款開源的大語言模型應用開發平臺,融合了后端即服務和LLMOps的理念,使開發者可以快速搭建生產級的生成式AI應用,本文將詳細介紹如何使用華為云 Flexus x 實例和CCE容器高可用部署搭建Dify-LLM平臺部署AI Agent,進而部署 AI Agent。

CCE容器高可用部署

在這里插入圖片描述

創建三個彈性公網 IP EIP,搭建彈性負載均衡 ELB 并綁定 EIP 以分發流量,創建 NAT 網關 NAT 并綁定 EIP 且配置 SNAT 規則,創建三臺 FlexusX 實例安裝 Dify 核心插件、一臺 FlexusX 實例部署特定模型,搭建云容器引擎 CCE Turbo 集群并納管 FlexusX 實例,利用對象存儲服務 OBS 掛載 Dify 知識庫,創建分布式緩存服務 Redis?* 版、云數據庫 RDS for PostgreSQL 實例、云搜索服務 CSS OpenSearch 集群,并創建四個安全組為云服務器提供安全防護。

前提準備

個人建議官方文檔搭配博主的流程一起看,因為官方文檔有的地方可能不是那么詳細

  • 創建rf_admin_trust委托和創建OBS桶名:官方文檔
  • 獲取訪問密鑰AK/SK:官方文檔
創建rf_admin_trust委托

1、統一身份認證-委托-創建委托-創建rf_admin_trust委托

在這里插入圖片描述

2、創建委托

委托名稱:rf_admin_trust

委托類型:云服務

云服務:選擇RFS

在這里插入圖片描述

3、立即授權

在這里插入圖片描述

4、搜索框中輸入"Tenant Administrator"并勾選搜索結果,單擊"下一步"

在這里插入圖片描述

5、選擇所有資源,并單擊確定完成配置

在這里插入圖片描述

在這里插入圖片描述

6、委托列表中出現rf_admin_trust委托則創建成功

在這里插入圖片描述

7、在云容器引擎CCE控制臺,實現授權cce_admin_trustcce_cluster_agency 委托

云容器引擎CCE控制臺

在這里插入圖片描述

8、委托確認

在這里插入圖片描述

獲取OBS桶名

1、創建桶(配置桶名即可,其他默認后續可以修改)-立即創建

在這里插入圖片描述

2、桶列表顯示則表示創建成功

在這里插入圖片描述

獲取AK、SK密鑰

1、我的憑證-訪問密鑰

在這里插入圖片描述

2、新增訪問密鑰

在這里插入圖片描述

3、下載密鑰

在這里插入圖片描述

4、保存密鑰,如下獲取到了access_key

在這里插入圖片描述

5、可以在訪問密鑰列表中查看訪問密鑰ID(AK),在下載的.csv文件中查看秘密訪問密鑰(SK)

在這里插入圖片描述

CCE高可用部署流程

1、點擊一鍵部署(CCE容器高可用部署)

在這里插入圖片描述

2、選擇模板(默認配置即可)

創建方式:已有模板

模板來源:URL

模板 URL:系統默認

在這里插入圖片描述

3、參數配置

資源棧名稱:資源棧名稱以中文或英文開始,支持中文、大小寫英文、數字、下劃線、中劃線,128個字符之內。 資源棧名稱不能重名。

如下內容非常重要,請仔細檢查,避免出錯

按模板要求對部分資源加密:取消勾選

cce_node_pool_password:CCE集群node節點密碼,用于集群節點登錄

pgsql_password:PostgreSQL數據庫的管理員密碼,取值范圍

pgsql_user_password:PostgreSQL數據庫的database用戶密碼

redis_password:redis數據庫密碼

css_password:CSS向量數據庫的密碼

obs_bucket: 按照上面創建的桶名填寫

access_key:填寫訪問密鑰ID(AK)

secret_key:填寫下載的.csv文件中查看秘密訪問密鑰(SK)

ecs_password:部署Embedding和Reranker模型的云服務器密碼

完成如上配置,下一步即可,特別注意密碼的格式要求,否者在執行任務的時候會回滾報錯

在這里插入圖片描述

4、資源棧設置

IAM權限委托:選擇上面已經創建的委托

回滾設置和刪除保護:可以根據需要開啟,默認是關閉,建議開啟回滾設置,如果創建失敗華為云會自動刪除創建的一些列配置,如果不開啟需要手動刪除非常麻煩

在這里插入圖片描述

5、配置確認

確認自己所做的配置有沒有問題,如果問題創建執行任務即可,創建執行任務確認即可

在這里插入圖片描述

在這里插入圖片描述

6、部署-執行

在這里插入圖片描述

在這里插入圖片描述

7、基本信息-狀態等待部署完成即可(這個過程華為云正在創建CCE容器高可用部署所需要的一些列配置,可能會給手機頻繁發短信,代表創建完成)

在這里插入圖片描述

8、等待部署完成(預計10-20分鐘)

在這里插入圖片描述

在這里插入圖片描述

9、瀏覽器地址訪問

在這里插入圖片描述

Dify平臺搭建AI Agent

1、通過瀏覽器訪問鏈接來訪問Dify - LLM 應用開發平臺,設置管理員賬戶Dify - LLM 應用開發平臺

在這里插入圖片描述

2、通過設置的管理員賬戶信息來登錄

在這里插入圖片描述

3、登錄后顯示如下頁面,代表Dify - LLM 應用開發平臺已經部署成功

在這里插入圖片描述

4、Dify - LLM 應用開發平臺模型供應商配置(接入DeepSeek)

在這里插入圖片描述

5、模型供應商中找到深度求索并且安裝(預計安裝5分鐘左右)

在這里插入圖片描述

6、安裝成功如下所示(點擊一次安裝Dify - LLM 應用開發平臺會進行下載安裝,再點一次安裝就可以在如下頁面看到自己所安裝的模型供應商了)

在這里插入圖片描述

7、DeepSeek模型供應商配置(OpenAI-API-compatible供應商)

在這里插入圖片描述

在這里插入圖片描述

8、API Key獲取:ModelArts Studio控制臺,點擊API KEY管理,創建自己的API KEY,標簽和描述根據自己的填即可,獲取到自己的API KEY注意保存(只會顯示一次自己的API KEY)

在這里插入圖片描述

在這里插入圖片描述

9、自定義 API endpoint 地址獲取:ModelArts Studio控制臺,點擊在線推理,選擇自己的服務,商用服務或者免費服務的用法相同,點擊調用說明獲取自定義API endpoint 地址

在這里插入圖片描述

10、點擊OpenAI SDK復制API接口信息,這個就是自己的API endpoint 地址

在這里插入圖片描述

11、Dify - LLM 應用開發平臺填寫獲取到的API KEY和自定義 API endpoint 地址和模型名稱

在這里插入圖片描述

12、點擊保存,頁面會顯示修改成功,配置成功頁面如下

在這里插入圖片描述

13、模型供應商配置成功,就可以創建一個AI Agent,創建空白應用

在這里插入圖片描述

14、應用類型選擇Agent

  • 聊天助手:簡單配置即可構建基于 LLM 的對話機器人

  • Agent:具備推理與自主工具調用的智能助手

  • 文本生成應用:用于文本生成任務的 AI 助手

  • Chatflow:支持記憶的復雜多輪對話工作流

  • 工作流:面向單輪自動化任務的編排工作流

在這里插入圖片描述

15、提示詞配置,可以使用AI生成配置,提供Agent的身份,點擊應用即可

提示詞生成器:用配置的模型來優化提示詞,以獲得更高的質量和更好的結構。請寫出清晰詳細的說明

在這里插入圖片描述

在這里插入圖片描述

16、調試與預覽,輸入article_content(文章內容)和user_specific_requests(用戶個性化的要求),然后發送需求即可

在這里插入圖片描述

17、發布智能體

在這里插入圖片描述

18、點擊探索就可以看到自己發布的智能體進行體驗了

在這里插入圖片描述

19、AI Agent部署結果展示

  • article_content
華為云 Flexus X 實例性能卓越,依托擎天 QingTian 架構與瑤光云腦技術,融合大模型調度及智能加速算法,實現 1.6 倍于業界通用獨享產品的算力,為復雜業務負載提供強勁動力;創新的 X-Turbo 加速技術,能讓關鍵業務應用實現最高 6 倍性能提升,如 MySQL、Redis、Nginx 等場景下均有顯著加速表現;其在成本控制上獨具優勢,打破傳統固定配比模式,支持靈活定制算力,結合智能資源預畫像及持續動態畫像規格優化,綜合降本達 30%;可靠性方面堪稱旗艦級,具備跨 AZ 99.995% 的高可用性及 100 + 全球權威合規認證,全方位保障業務穩定運行與數據安全。
  • user_specific_requests
著重強調性能優勢

在這里插入圖片描述

CCE容器高可用部署資源刪除

1、資源編排服務控制臺點擊進入資源棧ID

在這里插入圖片描述

2、點擊刪除,輸入Delete就可以完全刪除部署的資源,不會有任何殘留,避免額外扣費

在這里插入圖片描述

在這里插入圖片描述

3、等待資源刪除需要一定的時間,3分鐘左右即可

在這里插入圖片描述

在這里插入圖片描述

4、OBS桶刪除,如果顯示不是空桶無法刪除則需要先刪除桶里面的文件,再刪除桶

在這里插入圖片描述

5、進入桶內刪除文件,如何再刪除桶

在這里插入圖片描述

點擊進入桶內

在這里插入圖片描述

桶文件刪除

在這里插入圖片描述

桶刪除

在這里插入圖片描述

華為云Flexus云服務體驗感受

在這里插入圖片描述

個人認為,FlexusX 實例為開發者帶來了極大的便利,傳統的部署模式下,開發者往往要在環境配置、依賴安裝、版本適配等瑣碎事務上耗費大量精力,這些工作不僅繁雜,而且極易出錯,稍有不慎就可能導致整個部署流程停滯,嚴重影響開發進度,但 FlexusX 實例簡化了這個過程,預先集成了 Dify 所需的各種環境和基礎組件,開箱即用。

安裝部署 Dify 的 5 個核心插件為例,以往使用傳統方法,可能需要逐個去研究每個插件的安裝文檔,手動下載依賴包,配置各種參數,這一過程可能需要數天甚至數周時間。而借助 FlexusX 實例,通過其便捷的管理界面和自動化腳本,開發者能夠輕松地在短時間內完成這 5 個核心插件的部署,大大縮短了項目的前期準備周期。這意味著開發者可以將更多的時間和精力投入到真正有價值的開發工作中,比如優化 AI Agent 的功能、提升用戶體驗等。

而且,FlexusX 實例具備良好的穩定性和可擴展性。在開發過程中,隨著項目規模的擴大和用戶量的增長,對服務器資源的需求也會相應增加。FlexusX 實例能夠根據實際需求,靈活地調整資源配置,無論是增加 CPU、內存還是存儲容量,都能在不影響業務正常運行的情況下快速完成。這一特性為開發者提供了堅實的技術后盾,讓他們無需擔憂因資源不足而導致的系統崩潰或性能瓶頸問題,能夠更加專注地進行業務邏輯的開發和創新。

此外,FlexusX 實例還提供了完善的監控和運維工具。開發者可以實時查看實例的運行狀態,包括 CPU 使用率、內存占用、網絡流量等關鍵指標。一旦出現異常情況,能夠及時收到預警信息,并通過內置的診斷工具快速定位和解決問題。這大大降低了運維的難度和成本,對于一些缺乏專業運維團隊的小型企業或個人開發者來說,尤為重要。它使得開發者在享受高效部署帶來的便利的同時,也能確保系統的穩定運行,為項目的成功實施提供了有力保障。

在這里插入圖片描述

華為云Flexus云服務基于你的的場景和負載靈活部署

  • 電商直播:在云服務器上搭建電商交易平臺,百萬并發鏈接從容應對電商市場瞬息萬變對的業務壓力變化
  • 電商店鋪管理:使用云服務器登錄電商后臺,管理店鋪;或快速搭建外貿獨立站、店鋪管理環境,為海內外顧客提供穩定、優質的服務
  • 企業建站:提供常用建站類應用模板,快速構建滿足業務訴求的網站,如企業官網、資訊、博客、論壇、電商等
  • 小程序后臺:適合于構建微信小程序以及公眾號后臺服務,降低維護成本,讓用戶專注于業務開發
  • 游戲服務器:在云服務器中部署游戲服務端,滿足多人聯機游戲訴求,靈活選配,快速部署
  • 開發測試:適合云端構建即開即用的遠程開發、測試項目,運行定時任務、自動任務等
  • 云端學習:幫助學生、開發者在云端做一些實驗、論文等
  • 搭建博客/論壇:方便個人開發者搭建博客、論壇、個人設計作品、簡歷等,性價比高

彩蛋

博主在CCE容器高可用部署的時候遇到了一個小問題,當時還不覺得是華為云CCE容器高可用部署系統邏輯問題,只是覺得不太合理

  • 問題復現

CCE 容器高可用部署過程中,當用戶點擊部署后,華為云會按順序創建相關服務。若此前的配置存在問題,如密碼不符合要求、委托未創建、OBS 桶名不存在或未創建、AK/SK 密鑰錯誤、權限不足,或者某個服務在一鍵部署時未能創建成功等,都將導致整個服務部署不成功引發后續問題。

由于 CCE 容器高可用部署是按需收費,在部署流程中,若 Nat 網關創建成功,但因前面環節的錯誤致使后續服務無法成功創建,進而導致整個服務部署失敗,即便 Nat 網關僅被使用了極短時間,仍會按照按天計費的規則向用戶收費,費用為 12 元 / 天。

我在部署 CCE 時,就因上述配置問題,致使 Nat 網關雖創建成功,但整個服務卻未能成功部署。我不得不刪除 CCE 并重新創建,在這過程中,我重復操作了 7 - 8 次,盡管每次 Nat 網關的使用時間可能僅有1~2分鐘,卻依然累計被收取了每次12元的 Nat 網關費用,而我的 CCE 始終因前述原因未能成功部署。因此,我向華為提交了工單,并與他們的后端工程師進行了溝通。

在這里插入圖片描述

在這里插入圖片描述

  • 問題解決

經過和華為工程師會議溝通,他們通過內部商討,針對我反饋的 CCE 容器高可用部署中 Nat 網關收費不合理的問題,對 CCE 容器高可用部署中 Nat 網關的收費邏輯進行了調整。新的收費邏輯規定:若 CCE 部署未能成功,在刪除部署時,相應產生的費用,包括 Nat 網關費用及其他相關費用,都會退還至用戶賬戶。

不得不說華為工程師團隊的處理速度還是非常迅速,我在當天中午提交問題反饋,下午他們便組織會議進行商討,到了晚上就完成了收費邏輯的調整。不僅如此,華為工程師還全程協助我,走完了 CCE 部署的全流程,確保部署順利完成。整個過程高效且貼心,為華為工程師團隊的專業與負責點贊!

總結

我通過CCE容器高可用部署搭建Dify-LLM平臺部署AI Agent,整個流程不是很難,相對于傳統部署方式已經簡化了許多流程,用戶可以在搭建好的 Dify 平臺上,便捷地利用 AI Agent 實現多種功能,借助 AI Agent 生成富有創意的文案精美圖片、準確地響應用戶咨詢、定制專屬的學習計劃和資料、根據自身的業務特點和需求對 AI Agent 進行靈活定制和擴展,充分發揮其在不同行業和場景中的價值。

這種基于 CCE 容器的創新部署方式,不僅顯著降低了技術門檻,使得開發者能夠將更多的精力和時間投入到功能創新與業務拓展上,加速了 AI 應用的開發進程,同時也為企業在人工智能領域的發展提供了強有力的技術支撐。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/87646.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/87646.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/87646.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Postman 的 Jenkins 管理 - 手動構建

目錄 一、準備工作 二、postman 項目腳本準備并導出 1. 打開已完成并測試無誤的 postman 項目腳本。 再次執行測試。 ?編輯2. 導出( 測試用例集、環境變量 兩個文件)**“不 支 持 中 文”** —— 全部改成英文! ?編輯3. 文件所在目錄…

音視頻之H.264/AVC解碼器的原理和實現

系列文章: 1、音視頻之視頻壓縮技術及數字視頻綜述 2、音視頻之視頻壓縮編碼的基本原理 3、音視頻之H.264/AVC編碼器原理 4、音視頻之H.264的句法和語義 5、音視頻之H.264/AVC解碼器的原理和實現 6、音視頻之H.264視頻編碼傳輸及其在移動通信中的應用 7、音視…

【智能安全帽新升級】搭載VTX316TTS語音合成芯片,讓安全“聽得見”!

在工地轟鳴的機械聲中,一句清晰的指令可能比任何文字都更有力量。 當智能安全帽遇上VTX316語音合成芯片,安全防護從“被動響應”進化為“主動交互”,為高危行業戴上了一頂“會說話的智慧大腦”! 傳統安全帽的“沉默”危機 在建筑…

【目標檢測】非極大值抑制(NMS)的原理與實現

🧑 博主簡介:曾任某智慧城市類企業算法總監,目前在美國市場的物流公司從事高級算法工程師一職,深耕人工智能領域,精通python數據挖掘、可視化、機器學習等,發表過AI相關的專利并多次在AI類比賽中獲獎。CSDN…

DB-GPT啟動提示please install by running `pip install cryptography`

DB-GPT項目需要 cryptography 庫來處理加密功能,但環境中沒有安裝它。cryptography 是一個用于安全和加密操作的Python庫,許多項目(包括DB-GPT)依賴它來處理敏感數據的加密存儲。 解決方案 1. 安裝 cryptography 庫 在激活的環…

局域網文件共享及檢索系統

標題:局域網文件共享及檢索系統 內容:1.摘要 隨著信息技術的飛速發展,局域網在企業、學校等場景中得到廣泛應用,大量文件在局域網內存儲和流轉。然而,目前局域網內文件共享與檢索存在效率低、管理困難等問題。本文旨在設計并實現一個高效的局…

Spring Boot醫療系統高并發難題:達夢數據庫死鎖排查與優化實戰

Spring Boot醫療系統高并發難題:達夢數據庫死鎖排查與優化實戰 引言:醫療系統中的并發挑戰 在現代醫療系統中,檢查申請處理是關鍵業務場景之一,每天需要處理數以萬計的檢查記錄。當多個操作同時更新同一患者的申請狀態時,數據庫層面的死鎖問題成為高并發環境下的典型痛點…

Go語言中的文件與IO:bufio 和 scanner

Go 標準庫中的 bufio 包提供了帶緩沖的讀寫功能,可以顯著提高文件和數據處理效率。而 bufio.Scanner 則是讀取文本文件中每一行的利器,常用于日志、配置等文本處理場景。 一、為什么使用 bufio? 直接對文件進行 os.File.Read() 或 os.File.W…

ABP微服務架構中網關層NullReferenceException問題解析與HTTP配置優化

ABP微服務架構中網關層NullReferenceException問題解析與HTTP配置優化 一、網關層System.NullReferenceException問題解析 1.1 問題現象與原因分析 在ABP微服務架構開發過程中,網關層啟動后調用微服務接口時出現以下異常: System.NullReferenceExcep…

啊啊啊啊啊啊啊啊code

前序遍歷和中序遍歷構建二叉樹 /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* TreeNode() {}* TreeNode(int val) { this.val val; }* TreeNode(int val, TreeNode left, TreeNod…

【算法 day06】LeetCode 454.四數相加II | 15. 三數之和 | 18. 四數之和

454.四數相加II 題目鏈接 | 文檔講解 |視頻講解 : 鏈接 1.思路: 0.定義一個count,計算最終出現的次數 1.先遍歷nums1和nums2,求出兩者的和,map的key是和,value是出現的次數 2.再遍歷nums3和nums4,求出0-兩者的和 3…

【項目實訓】【項目博客#09】HarmonySmartCodingSystem系統后端智能API檢索與代碼助手實現(6.2-6.15)

【項目實訓】【項目博客#09】HarmonySmartCodingSystem系統后端智能API檢索與代碼助手實現(6.2-6.15) 文章目錄 【項目實訓】【項目博客#09】HarmonySmartCodingSystem系統后端智能API檢索與代碼助手實現(6.2-6.15)項目博客概述一…

【JVM】- 類加載與字節碼結構3

類加載階段 1. 加載 加載:將類的字節碼載入方法區中,內部采用C的instanceKlass描述java類。如果這個類的父類還沒加載,則先加載父類加載和鏈接可能是交替運行的 通過全限定名獲取字節碼 從文件系統(.class 文件)、JA…

Qt藍圖式技能編輯器狀態機模塊設計與實現

設計概述 這個模塊是一個基于Qt的藍圖式技能編輯器狀態機,主要用于游戲開發中的技能狀態管理。核心功能包括: 狀態節點(開始、結束、普通狀態)的可視化 狀態間連線的繪制與管理 狀態轉換邏輯的可視化編輯 動作選擇與配置 核…

Unity AR識別物體的內容語音讀取+使用說明功能

因之前一直在開發項目,斷斷續續寫了一點博客,最后統一寫了一下博客記錄學習內容。 可以看到我的工作一直在進行。 目錄 一、識別內容語音讀取 二、點擊齒輪按鈕彈出使用說明界面 開發步驟 1. 創建齒輪按鈕 UI 2. 創建使用說明面板 UI 3. 編寫控制…

Unable to start embedded Tomcat

通常是由于xml文件配置錯誤導致 1. mapper 指向錯誤 <resultMap id"Waybill" type"c.Waybill"> 2. 字段類型錯誤 <result column"wstatus" property"stus" javaType"TINYINT"/>TINYINT 是數據庫類型<resu…

Mac電腦 充電限制保護工具 AlDente Pro

AlDente Pro一款充電限制保護工具&#xff0c;是可以限制最大充電百分比來保護電池的工具。 鋰離子和聚合物電池&#xff08;如 MacBook 中的電池&#xff09;在40&#xff05; 至 80&#xff05; 之間運行時&#xff0c;使用壽命最長。 始終將電池電量保持在 100&#xff05…

KungfuBot——基于物理約束和自適應運動追蹤的人形全身控制PBHC,用于學習打拳或跳舞(即RL下的動作模仿和運控)

前言 昨天618&#xff0c;我司「七月在線」同事朝陽為主力&#xff0c;我打雜&#xff0c;折騰了整整一天&#xff0c;終于可以通過VR搖操宇樹G1了——當然&#xff0c;搖操是為了做訓練數據的采集&#xff0c;從而方便 下一步的模型(策略)訓練&#xff0c;最終實現機器人自主…

Kafka多副本機制

副本和副本因子 Kafka 會為每個 Partition 創建多個副本。這些副本分布在不同的 Broker 上。副本確保了數據的冗余存儲&#xff0c;即使某個 Broker 宕機或失效&#xff0c;其他副本可以繼續提供服務。 副本因子指的是每個 Partition 有多少個副本。副本因子的設置決定了一個…

Vue3類似百度風格搜索框組件

Vue3百度風格搜索框組件&#xff0c;使用vue3進行設計&#xff0c;亦有vue3TS的版本。 vue3組件如下&#xff1a; <template><!-- 搜索組件容器 --><div class"search-container"><!-- 百度Logo - 新樣式 --><div class"logo-conta…