前言
在數字化轉型加速的企業級應用場景中,構建高可用智能平臺已成為業務創新的核心驅動力。本文深度解析基于華為云CCE容器服務的Dify智能應用部署實踐,揭示如何通過云原生架構與AI技術的深度融合,實現企業知識管理、智能客服等場景的敏捷落地。依托華為云CCE Turbo集群、FlexusX彈性算力及全棧安全防護體系,本方案實現動態資源調度(響應效率提升180%)、跨可用區容災(SLA達99.95%)、數據全鏈路加密的技術突破,結合Dify平臺無縫集成Embedding語義檢索、Rerank結果優化、DeepSeek推理引擎三大核心能力,打造"高可用架構底座+多模態智能中樞+企業級知識圖譜"的創新解決方案,助力企業快速構建適應復雜業務場景的智能應用體系。
方案架構及資源規劃(CCE容器高可用部署)
以下是CCE容器高可用部署所需要的資源:
創建三個彈性公網IP EIP,提供訪問公網和被公網訪問能力
創建一個彈性負載均衡 ELB,并綁定EIP,將訪問流量自動分發到不同后端服務,擴展應用系統對外的服務能力,實現強大的應用容錯性能
創建一個NAT網關 NAT,并綁定EIP,配置SNAT規則,提供安全可靠的公網NAT網關和私網NAT網關服務,保護私有網絡信息不對外暴露
創建三臺FlexusX實例,用于安裝部署Dify5個核心插件
創建一個云容器引擎 CCE Turbo集群,創建節點池并將三臺FlexusX實例納管為集群的Node節點
創建一臺FlexusX實例,用于部署Embedding(bge-m3)及Reranker(bge-reranker-v2-m3)模型
使用對象存儲服務 OBS,用于將Dify的知識庫掛載在對象存儲服務 OBS桶上
創建一個分布式緩存服務Redis?*版,兼容Redis,為用戶提供高性能、低成本NoSQL數據庫,同時數據流轉過程中數據的一致性
創建一個云數據庫 RDS for PostgreSQL實例,主備分區部署,具備跨可用區故障容災的能力
創建一個云搜索服務 CSS OpenSearch集群,提供在線分布式搜索及語義搜索等功能
創建四個安全組,通過配置安全組規則,為云服務器提供安全防護
前期準備工作
首次使用華為云時已注冊的賬號可直接使用,無需額外準備。
若使用 IAM 用戶賬戶,需先確認是否屬于 admin 用戶組:
- 若已在 admin 組:可直接操作,無需額外權限配置。
- 若不在 admin 組:需由管理員為賬號授予相關權限,并完成以下準備工作。
創建rf_admin_trust委托(可選)
訪問華為云官網并登錄賬號,進入控制臺管理界面后,將鼠標懸停在頁面右上角的個人賬號區域,在彈出的下拉菜單中選擇 “統一身份認證” 選項。
進入統一身份認證服務(IAM) 頁面,在左側導航欄中找到并點擊委派選項,待右側頁面跳轉后,點擊右上角的創建委派按鈕。
在委托名稱輸入框中填入“
rf_admin_trust
”,將委托類型設定為“云服務”,并在對應輸入框中輸入“RFS”,確認信息無誤后點擊“完成”按鈕。
如下圖,委派創建成功,點擊“立即授權”按鈕進行后續操作。
第一步為策略選擇操作:在搜索框內輸入 “
Tenant Administrator
” 權限,勾選對應的搜索結果后,點擊 “下一步
” 按鈕。
第二步是配置最小授權范圍:選擇授權范圍方案,并勾選“全部資源”選項,點擊“確定”。
如下圖,
授權成功
,但是由于系統設置原因,授權之后需要等待15-30分鐘之后才可生效
當看到“委托”列表中顯示“rf_admin_trust”委托條目時,即表示委托創建成功。
創建桶
準備一個OBS桶:(如果已有,可跳過此步驟)登錄華為云對象存儲服務控制臺,單擊“創建桶”進入obs桶創建界面,
在操作時,先選取可用區域,接著輸入桶名稱,選擇標準存儲,其余配置保持默認狀態,最后點擊“立即創建”即可。
在彈出的提示框中,點擊確定
創建完成后可查看已創建的桶,點擊桶名稱進入詳情界面,復制桶名稱并保存備用。
獲取AK、SK
訪問密鑰ID(AK),識別訪問用戶的身份,取值范圍:20,僅支持大寫字母和數字,用于將生成的圖像上傳至OBS桶。參考獲取AK、SK密鑰。
秘密訪問密鑰(SK),對請求數據進行簽名驗證,取值范圍:40,僅支持大小寫字母和數字,用于將生成的圖像上傳至OBS桶。參考獲取AK、SK密鑰。
登錄華為云,在右上角單擊 “控制臺”。鼠標移動至右上方的用戶名,在下拉列表中選擇 “我的憑證”。
找到訪問密鑰模塊(通常在左側導航欄或頁面中部)。點擊新建訪問秘鑰按鈕,按提示完成密鑰創建。
輸入秘鑰的描述信息,勾選 “我已閱讀并同意”,點擊確認按鈕,完成訪問秘鑰創建。
創建成功后,下載包含訪問密鑰 ID(AK)和秘密訪問密鑰(SK)的.csv 文件進行保存
快速部署Dify-LLM(高可用)
部署流程
登錄華為云解決方案實踐頁面,在方案列表中找到 “快速搭建 Dify-LLM 應用開發平臺” 或 點擊此處跳轉 “快速搭建 Dify-LLM 應用開發平臺”,根據需求
選擇部署版本
,選擇“可用區
”,點擊 “一鍵部署(CCE容器高可用部署)
” 按鈕,系統將跳轉至解決方案的**“資源棧創建界面”**。
進行模板選擇操作,保持默認配置不變,然后點擊頁面右下角的“下一步”按鈕。
在該步驟中,對云服務器密碼進行設置(必填項),保持其他配置為默認狀態,完成后點擊頁面右下角的 “下一步” 按鈕。
關鍵配置項說明
配置項 說明 加密設置 需取消勾選“按模板要求對部分資源加密” 選項。 cce_node_pool_password CCE 集群 node 節點登錄密碼,用于集群節點訪問。 pgsql_password PostgreSQL 數據庫管理員密碼,需符合指定格式要求(注意取值范圍限制)。 pgsql_user_password PostgreSQL 數據庫的 database 用戶密碼,需與管理員密碼規則一致。 redis_password Redis 數據庫密碼,用于數據庫認證。 css_password CSS 向量數據庫密碼,確保數據庫安全訪問。 obs_bucket 填寫之前創建的 OBS 桶名稱(需與實際創建的桶名完全一致)。 access_key 填寫訪問密鑰 ID(AK),用于云服務身份驗證。 secret_key 從下載的.csv 文件中獲取秘密訪問密鑰(SK),需準確填寫。 ecs_password 部署 Embedding 和 Reranker 模型的云服務器登錄密碼。
一定要確認密碼強度夠且余額充足,不然會返回部署失敗(仔細檢查配置參數)
進行資源棧設置,開啟“回滾設置”開關,完成后點擊 “下一步” 按鈕。(不做權限委派操作)
進入配置確認環節,仔細核對所有設置無誤后,點擊頁面右下角的 “創建執行任務” 按鈕啟動部署流程。
當系統彈出創建執行計劃對話框時,自行設置執行計劃名稱(支持自定義內容),確認無誤后點擊 “確定” 按鈕。
可以看到執行計劃創建成功,點擊“部署”按鈕,
點擊 “部署” 按鈕后,系統將彈出執行計劃確認對話框,此時請點擊對話框中的 “執行” 選項完成操作。
正在創建中,大概需要10-20分鐘(確保配置信息無誤,余額、密碼強度等,如果有誤不會扣除費用會進行
回滾
操作)
點擊 “事件” 標簽,可查看當前創建任務的狀態詳情,了解是否完成創建。
待“事件”中出現“
Apply required resource success
”,表示該解決方案已經部署完成。
可以再資源列表中看到所有創建的資源
也可以在華為云面板首頁,看到當前已經存在的資源
手動刷新頁面,在 “輸出” 區域中查看 Dify-LLM 應用開發平臺的訪問說明。當堆棧部署狀態顯示成功后,Dify 應用搭建腳本將自動開始執行,請耐心等待 5 至 10 分鐘(具體耗時可能因網絡波動而略有差異)。
沒有標記cce的是高質量知識庫所在的服務器,標記的為所部署的高可用dify平臺所在服務器
登錄注冊:在瀏覽器輸入該地址,進入 Dify 界面后,點擊 “注冊” 按鈕,依次填寫郵箱、賬號(自定義用戶名)、密碼(需符合復雜度要求),完成管理員賬號創建后即可登錄。
打開瀏覽器并訪問您部署的 Dify 平臺地址(可在堆棧 “輸出” 中查詢),進入登錄界面后,依次輸入前序步驟中注冊的郵箱和密碼,點擊 “登錄” 按鈕即可進入 Dify 平臺。
如下圖,我們已經成功在華為云平臺部署了Dify-LLM平臺,接下來就可以進行各種開發操作了。
搭建DeepSeek推理系統
隨著互聯網信息量激增,企業和個人面臨海量數據管理與高效檢索需求,傳統搜索引擎難以滿足復雜需求。國產 AI 大模型 DeepSeek 崛起,其解決方案可在華為云 Flexus 云服務器 X 實例上快速搭建 DeepSeek-R1 輕量級推理系統。該模型專注數學、代碼和自然語言推理任務,通過 Ollama 部署蒸餾版輕量模型打造私人 AI 助手,適用于多場景數據處理與智能推理。
官方文檔:https://support.huaweicloud.com/deepseek-aislt/deepseek_01.html
快速部署:https://www.huaweicloud.com/solution/implementations/building-a-deepseek-lnference-system.html
根據需求
選擇部署模式(CPU為例)
,選擇“可用區
”,點擊 “一鍵部署(CPU版)
” 按鈕,系統將跳轉至解決方案的**“資源棧創建界面”**。
進行模板選擇操作,保持默認配置不變,然后點擊頁面右下角的“下一步”按鈕。
在該步驟中,對云服務器密碼進行設置(必填項),保持其他配置為默認狀態,完成后點擊頁面右下角的 “下一步” 按鈕。
進行資源棧設置,開啟“回滾設置”開關,完成后點擊 “下一步” 按鈕。(不做權限委派操作)
進入配置確認環節,仔細核對所有設置無誤后,點擊頁面右下角的 “創建執行任務” 按鈕啟動部署流程。
當系統彈出創建執行計劃對話框時,自行設置執行計劃名稱(支持自定義內容),確認無誤后點擊 “確定” 按鈕。
此時可觀察到執行計劃正在創建中,待其創建成功后,點擊 “部署” 按鈕啟動部署流程。
可以看到執行計劃創建成功,點擊“部署”按鈕,
點擊 “部署” 按鈕后,系統將彈出執行計劃確認對話框,此時請點擊對話框中的 “執行” 選項完成操作。
點擊 “事件” 標簽,可查看當前創建任務的狀態詳情,了解是否完成創建。
待“事件”中出現“
Apply required resource success
”,表示該解決方案已經部署完成。
單擊 “資源” 查看已創建的資源(參考圖示),點擊 “藍色資源名稱” 進入彈性云服務器詳情頁,查看其綁定的
彈性公網 IP
。
跳轉到ECS基本信息頁面,查看彈性公網IP并進行保存
對接DeepSeek
成功部署快速搭建DeepSeek推理系統解決方案后,將DeepSeek大模型對接至Dify平臺。
點擊右側“用戶名稱”下拉菜單,選擇并點擊“設置”選項。
點擊左側模型供應商,找到
Ollama
模型供應商,點擊“添加模型”。
模型類型: 選擇LLM
模型名稱: 需填寫快速部署中選擇的模型(如 “deepseek-r1:7b”)
基礎 URL 根據部署情況填寫:
- 若 Dify 應用和 DeepSeek-R1 蒸餾版模型在同一服務器或同一 VPC 下,填寫獲取的私網 IP 地址,
- 若不在同一服務器且不在同一 VPC 下,則填寫模型所在服務器的公網 IP
- 端口號統一為
11434
(使用公網連接時需確保模型服務器所在安全組放通該端口),完成后單擊右下角 “保存” 并關閉窗口。
實際使用中發現,若使用 DeepSeek 官方提供的模型,僅需填寫
API Key
即可完成配置(推薦優先選用在華為云部署的 DeepSeek-R1 蒸餾版模型)。對接步驟如下:點擊左側模型供應商,找到
DeepSeek
模型提供商,點擊“設置”。
對接向量檢索模型
若需使用高質量型功能,需提前添加
Embedding 和 Reranker
模型。本解決方案的一鍵部署(CCE 容器高可用部署)提供可選的 Embedding 和 Reranker 模型服務器,操作步驟如下:
- 登錄 ECS 控制臺,找到解決方案創建的Embedding&Reranker 模型服務器(沒有帶CCE標簽的),復制其私網 IP 地址。
注意: 若不使用本方案部署的 Embedding 和 Reranker 模型,服務器 URL 需填寫對應模型的公網 IP。
點擊右側“用戶名稱”下拉菜單,選擇并點擊“設置”選項。
點擊左側模型供應商,找到
Ollama
模型供應商,點擊“添加模型”。
在 Ollama 模型配置界面進行以下操作:
- 模型類型選擇 “Text Embedding”
- 模型名稱輸入 “bge-m3”
- 基礎 URL :
如果是單獨進行部署的填寫:http://ECS公網IP:11434
如果是使用一鍵部署cce時部署的的填寫:http://ECS私網IP:11434
- 對接方式均一致
- 端口號保持默認 11434(部署解決方案默認放行安全組)
- 點擊右下角 “保存” 完成配置
點擊 “模型供應商” 選項,在列表里找到
Xorbits Inference
模型,然后點擊其對應的 “添加模型” 按鈕。
在 Xorbits Inference模型配置界面進行以下操作:
- 選擇模型類型為 Rerank
- 模型名稱填寫 “bge-reranker-v2-m3”
- 模型 UID 同步填寫 “bge-reranker-v2-m3”
- 基礎 URL :
如果是單獨進行部署的填寫:http://ECS公網IP:9997
如果是使用一鍵部署cce時部署的的填寫:http://ECS私網IP:9997
- 對接方式均一致
- 端口號設置為 9997(部署解決方案默認放行安全組)
- 點擊右下角 “保存” 完成配置
創建知識庫
在
Dify 平臺
頂部導航欄點擊 “知識庫” 后選擇 “創建知識庫”。
選擇 “導入已有文本” 數據源,點擊 “上傳文件” 后點擊**下一步(**數據源可自定義提供方式)。
- 需根據自身應用需求來進行準備對應的知識庫
進入知識庫選擇索引方式選擇高質量,配置
Embedding模型為bge-m3
啟用混合檢索模式(向量+關鍵詞檢索,可調節權重),選擇
bge-reranker-v2-m3
模型進行結果重排,開啟Score閾值(推薦0.5)并設置TOP K文檔分片數量(控制最大調用量)。
當界面顯示嵌入完成時,點擊 “前往文檔”,即可查看處于可用狀態的導入知識庫文檔。
在華為云 OBS 對象存儲的桶內,可查看已上傳的知識庫文件
創建應用
登錄
Dify
平臺后,在工作室主界面找到并點擊“創建空白應用”選項,即可開始搭建新的應用項目。
選擇應用類型,先選定Agent類型,然后自定義填寫應用名稱、上傳圖標,并完善描述信息。
創建應用后會自動跳轉至應用概覽頁,點擊左側菜單中的 編排 即可開始編排應用。在提示詞設置區域點擊右上角的 生成 按鈕。
```xml
<instruction>
你是企業智能客服,基于知識庫專業解答產品價格、訂單狀態、售后流程問題。請按照以下步驟處理用戶咨詢:
1. 識別用戶問題類型:產品價格、訂單狀態或售后流程。
2. 根據問題類型提取關鍵變量:- 產品價格問題:提取{{product_name}}變量- 訂單狀態問題:提取{{order_number}}變量- 售后流程問題:提取{{after_sales_type}}變量
3. 在知識庫中精準匹配變量信息,分點清晰應答:- 產品價格:列出規格、單價及優惠信息- 訂單狀態:提供當前狀態、預計完成時間- 售后流程:分步驟說明處理流程及所需材料
4. 若問題超出范圍或匹配度低于80%,回復:"您的問題需要人工客服處理,正在為您轉接..."
5. 輸出要求:- 使用中文分點回答(1. 2. 3.)- 不包含任何XML標簽- 變量值需完整替換不要保留{{}}
</instruction>
<input>
用戶咨詢內容:{{user_query}}
</input>
<example>
用戶咨詢內容:"我想查詢訂單123456的當前狀態"
提取變量:{{order_number}} = 123456
輸出:
1. 訂單123456當前狀態:已發貨
2. 物流公司:順豐速運
3. 運單號:SF123456789
4. 預計送達時間:2023-12-20
</example>
<example>
用戶咨詢內容:"產品A的報價是多少"
提取變量:{{product_name}} = 產品A
輸出:
1. 產品A當前報價:- 標準版:¥999- 專業版:¥1499(含3年保修)
2. 本月優惠:滿2000減200
</example>
<output>
根據輸入內容生成的客服應答(分點列表形式)
</output>
```
在編排頁面中定位到知識庫板塊,點擊 “添加” 按鈕即可進行操作。
在華為云 Dify 平臺創建 Agent 應用時,支持靈活集成各類工具組件,輕松拓展智能體的功能邊界(需要安裝授權后才能使用)
在右側彈出的內容框中啟用開場白功能,并按自身需求編輯開場白內容(使用指令生成指示詞的時候會自動生成一段開場白)
調試與預覽
輸入響應的變量參數(設置了可選)之后,即可進行交流測試
Agent發布
當應用測試無誤后,可點擊界面右上角的 “發布” 按鈕,然后按提示點擊 “發布更新”,即可將工作流正式上線。
運行測試
發布完成后,可通過以下三種方式使用該 Agent 應用:
直接對話交互:在平臺對話窗口輸入問題,系統自動調用工作流邏輯生成回答;
嵌入網頁 / 小程序:獲取嵌入代碼后,將 Agent 功能集成到自有網頁或小程序界面,供用戶直接訪問。
API 接口調用:通過平臺提供的 API 接口,將 Agent 集成至第三方系統或應用中使用;
此外還能對會話數量等數據進行監控。
總結
本實踐通過華為云CCE容器服務與Dify平臺的深度協同,成功驗證了企業級智能應用的高可用部署范式。方案采用標準化部署模板實現20分鐘極速建站,基于FlexusX云服務器集群與擎天架構達成算力動態分配(資源利用率提升30%)、網絡流量智能調度(ELB負載均衡)、數據持久化存儲(OBS對象存儲+RDS主備數據庫)的完整技術閉環。通過集成Embedding模型(bge-m3)實現語義向量化檢索、Rerank模型(bge-reranker-v2-m3)優化結果排序、DeepSeek大模型(R1蒸餾版)驅動復雜推理,構建起覆蓋知識庫管理、智能問答、數據分析等場景的全鏈路智能能力。實踐表明,該架構可支撐日均百萬級請求處理,檢索響應時間縮短至毫秒級,知識庫更新效率提升5倍,為企業智能化轉型提供可復制的技術路徑。未來可進一步探索多模態數據融合、行業模型微調、邊緣計算節點下沉等演進方向,持續釋放AI與云原生技術疊加帶來的業務價值。