華為云 Flexus+DeepSeek 征文|華為云Dify 平臺 CCE 高可用集群部署與大模型高質量知識庫構建指南
文章目錄
- 華為云 Flexus+DeepSeek 征文|華為云Dify 平臺 CCE 高可用集群部署與大模型高質量知識庫構建指南
- 前言
- 1、ModelArts Studio大模型開通
- 2、Dify平臺CCE高可用集群部署
- 2.1 創建rf_admin_trust委托
- 2.2 獲取OBS桶名
- 2.3 獲取AK、SK密鑰
- 2.4 CCE集群高可用部署
- 3、Dify平臺模型供應商配置
- 4、高質量知識庫配置Embedding及Rerank模型
- 4.1 部署Embedding及Rerank模型
- 4.2 高質量知識庫模型供應商配置
- 4.2.1 ECS公網IP獲取
- 4.2.2 Ollama模型安裝
- 4.2.3 Xorbits Inference模型安裝
- 資源刪除銷毀
- 華為云CCE高可用集群部署Dify平臺
- 總結
前言
本文聚焦華為云 Flexus 與 DeepSeek 深度整合場景,為開發者提供從 ModelArts Studio 大模型服務開通、CCE 高可用集群自動化部署 Dify 平臺,到 Embedding 與 Rerank 模型部署及高質量知識庫構建的全流程實戰指南。通過華為云容器服務多節點冗余架構、彈性擴縮容能力與 Dify 微服務架構的結合,詳解如何高效構建兼具高可用性、彈性擴展與安全合規的大模型應用開發環境,助力企業快速落地智能問答、知識管理等 AI 場景應用。
1、ModelArts Studio大模型開通
1、領取開通在線推理提供服務,點擊ModelArts Studio控制臺
2、點擊模型推理-在線推理
3、開通商用服務或者免費服務都可以,如果是體驗使用可以暫時使用免費服務,等到有更高的需求可以使用商用服務,另外說明商用服務是按Token計費
- 免費服務開通:僅適合用于體驗模型,且受嚴格的速率限制。平臺可能會不定時調整其適用模型、免費額度、有效期等內容
- 商用服務:將為您提供商用級別的推理API服務,開放后您可以獲取付費API服務
2、Dify平臺CCE高可用集群部署
個人建議官方文檔搭配博主的流程一起看,因為官方文檔有的地方可能不是那么詳細
- 創建rf_admin_trust委托和創建OBS桶名:官方文檔
- 獲取訪問密鑰AK/SK:官方文檔
2.1 創建rf_admin_trust委托
1、統一身份認證-委托-創建委托-創建rf_admin_trust委托
2、創建委托
委托名稱:rf_admin_trust
委托類型:云服務
云服務:選擇RFS
3、立即授權
4、搜索框中輸入"Tenant Administrator"并勾選搜索結果,單擊"下一步"
5、選擇所有資源,并單擊確定完成配置
6、委托列表中出現rf_admin_trust委托則創建成功
7、在云容器引擎CCE控制臺,實現授權
cce_admin_trust
和cce_cluster_agency
委托云容器引擎CCE控制臺
8、委托確認
2.2 獲取OBS桶名
1、創建桶(配置桶名即可,其他默認后續可以修改)-立即創建
2、桶列表顯示則表示創建成功
2.3 獲取AK、SK密鑰
1、我的憑證-訪問密鑰
2、新增訪問密鑰
3、下載密鑰
4、保存密鑰,如下獲取到了access_key
5、可以在訪問密鑰列表中查看訪問密鑰ID(AK),在下載的.csv文件中查看秘密訪問密鑰(SK)
2.4 CCE集群高可用部署
1、點擊一鍵部署(CCE容器高可用部署)
2、選擇模板(默認配置即可)
創建方式:已有模板
模板來源:URL
模板 URL:系統默認
3、參數配置
配置項名稱 說明 注意事項 cce_node_pool_password CCE 集群 node 節點密碼,用于集群節點登錄 需符合密碼格式要求(具體格式需參考平臺規范,避免因格式錯誤導致任務回滾) pgsql_password PostgreSQL 數據庫的管理員密碼 取值范圍需符合數據庫密碼強度要求(如長度、字符類型等) pgsql_user_password PostgreSQL 數據庫的 database 用戶密碼 同上 redis_password Redis 數據庫密碼 需滿足 Redis 密碼復雜度要求 css_password CSS 向量數據庫的密碼 確保與 CSS 服務密碼規則一致 obs_bucket 填寫已創建的 OBS 桶名稱 需與實際創建的桶名完全一致 access_key 訪問密鑰 ID(AK) 從華為云賬號中獲取有效的 AK secret_key 秘密訪問密鑰(SK),從下載的.csv 文件中查看 需確保 SK 的正確性,避免泄露 ecs_password 部署 Embedding 和 Reranker 模型的云服務器密碼 符合云服務器密碼策略(如大小寫字母、數字、特殊字符組合) 重要注意事項:
- 密碼格式檢查:所有密碼需嚴格遵循對應服務的格式要求(如長度、字符類型、特殊字符限制等),格式錯誤會導致任務執行時回滾報錯
- 信息準確性:OBS 桶名、AK/SK 等信息需與實際創建的資源完全一致,避免因名稱或密鑰錯誤導致認證失敗
- 唯一性驗證:創建資源棧前,確認名稱未被其他資源棧使用,避免命名沖突
4、資源棧設置
IAM權限委托:選擇上面已經創建的委托
回滾設置和刪除保護:可以根據需要開啟,默認是關閉,建議開啟回滾設置,如果創建失敗華為云會自動刪除創建的一些列配置,如果不開啟需要手動刪除非常麻煩
5、配置確認
確認自己所做的配置有沒有問題,如果問題創建執行任務即可,創建執行任務確認即可
6、部署-執行
7、基本信息-狀態等待部署完成即可
8、等待部署完成(預計10-20分鐘)
9、瀏覽器地址訪問
10、通過瀏覽器訪問鏈接來訪問Dify - LLM 應用開發平臺
11、設置的管理員賬戶信息
12、登錄后顯示如下頁面,代表Dify - LLM 應用開發平臺已經部署成功
3、Dify平臺模型供應商配置
1、Dify - LLM 應用開發平臺模型供應商配置(接入DeepSeek)
2、模型供應商中找到OpenAI-API-compatible并且安裝
3、安裝成功如下所示
4、DeepSeek模型供應商配置(OpenAI-API-compatible供應商)
5、配置頁面
6、API Key獲取:ModelArts Studio控制臺,點擊API KEY管理,創建自己的API KEY,標簽和描述根據自己的填即可,獲取到自己的API KEY注意保存(只會顯示一次自己的API KEY)
7、自定義 API endpoint 地址獲取:ModelArts Studio控制臺,點擊在線推理,選擇自己的服務,商用服務或者免費服務的用法相同,點擊調用說明獲取自定義API endpoint 地址
8、點擊OpenAI SDK復制API接口信息,這個就是自己的API endpoint 地址
9、Dify - LLM 應用開發平臺填寫獲取到的API KEY和自定義 API endpoint 地址和模型名稱
10、點擊保存,頁面會顯示修改成功,配置成功頁面如下
4、高質量知識庫配置Embedding及Rerank模型
4.1 部署Embedding及Rerank模型
1、登錄華為云解決方案實踐,選擇快速部署Embedding及Rerank模型
2、點擊進入-下滑至方案架構
3、區域選擇
成本預算:3~6元(按需計費:Flexus云服務器X實例2.28元/小時,彈性公網IP EIP0.80元/GB,體驗本方案預計成本不超過6元)
4、選擇模板
- 默認配置下一步
5、參數配置
- 按模板要求對部分資源加密取消勾選
- ecs_password:云服務器密碼,長度為8-26位,密碼至少必須包含大寫字母、小寫字母、數字和特殊字符(!@$%^-_=+[{}]:,./?)中的三種、
6、資源棧設置
開啟回滾設置:開啟回滾表示操作失敗時,會自動回滾至系統所保存的上一個成功的資源狀態。創建后可在資源棧詳情頁面修改。
7、配置確認
8、創建執行計劃
9、部署
10、執行計劃
11、基本信息中等待狀態改變為部署完成即可完成部署
4.2 高質量知識庫模型供應商配置
4.2.1 ECS公網IP獲取
1、ECS公網IP獲取
4.2.2 Ollama模型安裝
1、安裝bge-m3(embedding)和bge-reranker-v2-m3 (reranker)模型供應商
- Ollama安裝
2、Ollama模型供應商配置
- 模型類型:Text Embedding
- 模型名稱:bge-m3
- 基礎URL:http://ECS公網IP:11434(如上前提有獲取流程)
- 端口號:11434
3、Xorbits Inference模型安裝
4.2.3 Xorbits Inference模型安裝
1、Xorbits Inference模型配置
模型類型: Rerank
模型名稱與模型UID均填寫:bge-reranker-v2-m3
服務器URL:http://ECS公網IP:9997
端口號:9997
2、模型成功配置
如上即完成了華為云集群部署以及高質量知識庫配置Embedding及Rerank模型的創建和配置,后續即可直接在華為云Dify平臺中,直接創建高質量知識庫,經濟知識庫默認配置,不需要特殊創建過程。
資源刪除銷毀
Tip:
- 刪除資源棧的流程官方文檔比較詳細可以參考官方文檔
- 資源刪除銷毀單機部署和CCE集群高可用部署的方式相同
1、進入資源編排服務控制臺,找到剛創建成功的資源棧,單擊行操作列的刪除,頁面彈出確認刪除框,在輸入框中再次輸入Delete,單擊確定,即可刪除
2、如果啟用刪除保護的情況下刪除資源堆棧,則會顯示錯誤消息
3、只需要將刪除保護關閉再刪除即可(此處我并未開啟所以不做演示)
華為云CCE高可用集群部署Dify平臺
基于華為云 CCE 高可用集群部署 Dify 平臺,開發者利用 CCE 多節點冗余、自動擴縮容及網絡隔離能力,結合 Dify 微服務架構實現組件彈性擴展,通過華為云 RDS/Redis/EVS 保障數據高可用,以簡潔架構快速構建安全可靠的應用環境
?高可用性:華為云 CCE 提供多節點冗余架構,控制平面默認 3 個控制節點,通過 etcd 集群保證數據一致性,單節點故障不影響集群運行。工作節點支持自動擴縮容,能根據負載動態調整數量。同時,Dify 平臺的組件如數據庫采用華為云 RDS for PostgreSQL 高可用版,緩存使用 ElastiCache for Redis 主從架構,確保關鍵組件的高可用性,實現服務自愈,減少業務中斷時間
?彈性擴展:CCE 集群支持自動擴縮容,可根據 Dify 平臺的業務負載動態調整工作節點數量。Dify 平臺本身采用微服務架構,各個組件可獨立進行水平擴展,如 Web 服務、API 網關等無狀態服務可通過增加副本數量來提升并發處理能力,以應對不同規模的業務流量變化
?安全可靠:華為云 CCE 通過 VPC 網絡隔離、安全組規則以及 Kubernetes NetworkPolicy 實現網絡與安全隔離,保護 Dify 組件通信安全。數據方面,采用云硬盤 EVS 持久化存儲,支持多副本數據冗余和自動數據備份,RDS 支持數據靜態加密和傳輸加密,確保 Dify 數據的安全性和完整性。同時,華為云 CCE 服務通過多項安全合規認證,滿足企業級的安全合規需求
總結
本文完整呈現了在華為云 CCE 高可用集群部署 Dify 平臺并構建大模型知識庫的實戰過程,涵蓋從 ModelArts Studio 開通大模型服務、創建委托與 OBS 桶等準備工作,到 CCE 集群參數配置、模型供應商對接及 Embedding 與 Rerank 模型部署的全流程,幫助開發者高效利用華為云資源,以簡潔架構實現 Dify 平臺的高可用部署與知識庫搭建,快速落地大模型應用開發。