華為云 Flexus+DeepSeek 征文|華為云Dify 平臺 CCE 高可用集群部署與大模型高質量知識庫構建指南

華為云 Flexus+DeepSeek 征文|華為云Dify 平臺 CCE 高可用集群部署與大模型高質量知識庫構建指南

文章目錄

    • 華為云 Flexus+DeepSeek 征文|華為云Dify 平臺 CCE 高可用集群部署與大模型高質量知識庫構建指南
      • 前言
        • 1、ModelArts Studio大模型開通
        • 2、Dify平臺CCE高可用集群部署
          • 2.1 創建rf_admin_trust委托
          • 2.2 獲取OBS桶名
          • 2.3 獲取AK、SK密鑰
          • 2.4 CCE集群高可用部署
        • 3、Dify平臺模型供應商配置
        • 4、高質量知識庫配置Embedding及Rerank模型
          • 4.1 部署Embedding及Rerank模型
          • 4.2 高質量知識庫模型供應商配置
            • 4.2.1 ECS公網IP獲取
            • 4.2.2 Ollama模型安裝
            • 4.2.3 Xorbits Inference模型安裝
      • 資源刪除銷毀
      • 華為云CCE高可用集群部署Dify平臺
      • 總結

前言

本文聚焦華為云 Flexus 與 DeepSeek 深度整合場景,為開發者提供從 ModelArts Studio 大模型服務開通、CCE 高可用集群自動化部署 Dify 平臺,到 Embedding 與 Rerank 模型部署及高質量知識庫構建的全流程實戰指南。通過華為云容器服務多節點冗余架構、彈性擴縮容能力與 Dify 微服務架構的結合,詳解如何高效構建兼具高可用性、彈性擴展與安全合規的大模型應用開發環境,助力企業快速落地智能問答、知識管理等 AI 場景應用。

1、ModelArts Studio大模型開通

1、領取開通在線推理提供服務,點擊ModelArts Studio控制臺

在這里插入圖片描述

2、點擊模型推理-在線推理

在這里插入圖片描述

3、開通商用服務或者免費服務都可以,如果是體驗使用可以暫時使用免費服務,等到有更高的需求可以使用商用服務,另外說明商用服務是按Token計費

  • 免費服務開通:僅適合用于體驗模型,且受嚴格的速率限制。平臺可能會不定時調整其適用模型、免費額度、有效期等內容

在這里插入圖片描述

  • 商用服務:將為您提供商用級別的推理API服務,開放后您可以獲取付費API服務

在這里插入圖片描述

2、Dify平臺CCE高可用集群部署

個人建議官方文檔搭配博主的流程一起看,因為官方文檔有的地方可能不是那么詳細

  • 創建rf_admin_trust委托和創建OBS桶名:官方文檔
  • 獲取訪問密鑰AK/SK:官方文檔
2.1 創建rf_admin_trust委托

1、統一身份認證-委托-創建委托-創建rf_admin_trust委托

在這里插入圖片描述

2、創建委托

  • 委托名稱:rf_admin_trust

  • 委托類型:云服務

  • 云服務:選擇RFS

在這里插入圖片描述

3、立即授權

在這里插入圖片描述

4、搜索框中輸入"Tenant Administrator"并勾選搜索結果,單擊"下一步"

在這里插入圖片描述

5、選擇所有資源,并單擊確定完成配置

在這里插入圖片描述

在這里插入圖片描述

6、委托列表中出現rf_admin_trust委托則創建成功

在這里插入圖片描述

7、在云容器引擎CCE控制臺,實現授權cce_admin_trustcce_cluster_agency委托

云容器引擎CCE控制臺

在這里插入圖片描述

8、委托確認

在這里插入圖片描述

2.2 獲取OBS桶名

1、創建桶(配置桶名即可,其他默認后續可以修改)-立即創建

在這里插入圖片描述

2、桶列表顯示則表示創建成功

在這里插入圖片描述

2.3 獲取AK、SK密鑰

1、我的憑證-訪問密鑰

在這里插入圖片描述

2、新增訪問密鑰

在這里插入圖片描述

3、下載密鑰

在這里插入圖片描述

4、保存密鑰,如下獲取到了access_key

在這里插入圖片描述

5、可以在訪問密鑰列表中查看訪問密鑰ID(AK),在下載的.csv文件中查看秘密訪問密鑰(SK)

在這里插入圖片描述

2.4 CCE集群高可用部署

1、點擊一鍵部署(CCE容器高可用部署)

在這里插入圖片描述

2、選擇模板(默認配置即可)

  • 創建方式:已有模板

  • 模板來源:URL

  • 模板 URL:系統默認

在這里插入圖片描述

3、參數配置

配置項名稱說明注意事項
cce_node_pool_passwordCCE 集群 node 節點密碼,用于集群節點登錄需符合密碼格式要求(具體格式需參考平臺規范,避免因格式錯誤導致任務回滾)
pgsql_passwordPostgreSQL 數據庫的管理員密碼取值范圍需符合數據庫密碼強度要求(如長度、字符類型等)
pgsql_user_passwordPostgreSQL 數據庫的 database 用戶密碼同上
redis_passwordRedis 數據庫密碼需滿足 Redis 密碼復雜度要求
css_passwordCSS 向量數據庫的密碼確保與 CSS 服務密碼規則一致
obs_bucket填寫已創建的 OBS 桶名稱需與實際創建的桶名完全一致
access_key訪問密鑰 ID(AK)從華為云賬號中獲取有效的 AK
secret_key秘密訪問密鑰(SK),從下載的.csv 文件中查看需確保 SK 的正確性,避免泄露
ecs_password部署 Embedding 和 Reranker 模型的云服務器密碼符合云服務器密碼策略(如大小寫字母、數字、特殊字符組合)

重要注意事項:

  • 密碼格式檢查:所有密碼需嚴格遵循對應服務的格式要求(如長度、字符類型、特殊字符限制等),格式錯誤會導致任務執行時回滾報錯
  • 信息準確性:OBS 桶名、AK/SK 等信息需與實際創建的資源完全一致,避免因名稱或密鑰錯誤導致認證失敗
  • 唯一性驗證:創建資源棧前,確認名稱未被其他資源棧使用,避免命名沖突

在這里插入圖片描述

4、資源棧設置

IAM權限委托:選擇上面已經創建的委托

回滾設置和刪除保護:可以根據需要開啟,默認是關閉,建議開啟回滾設置,如果創建失敗華為云會自動刪除創建的一些列配置,如果不開啟需要手動刪除非常麻煩

在這里插入圖片描述

5、配置確認

確認自己所做的配置有沒有問題,如果問題創建執行任務即可,創建執行任務確認即可

在這里插入圖片描述

在這里插入圖片描述

6、部署-執行

在這里插入圖片描述

在這里插入圖片描述

7、基本信息-狀態等待部署完成即可

在這里插入圖片描述

8、等待部署完成(預計10-20分鐘)

在這里插入圖片描述

在這里插入圖片描述

9、瀏覽器地址訪問

在這里插入圖片描述

10、通過瀏覽器訪問鏈接來訪問Dify - LLM 應用開發平臺

在這里插入圖片描述

11、設置的管理員賬戶信息

在這里插入圖片描述

12、登錄后顯示如下頁面,代表Dify - LLM 應用開發平臺已經部署成功

在這里插入圖片描述

3、Dify平臺模型供應商配置

1、Dify - LLM 應用開發平臺模型供應商配置(接入DeepSeek)

在這里插入圖片描述

2、模型供應商中找到OpenAI-API-compatible并且安裝

在這里插入圖片描述

3、安裝成功如下所示

在這里插入圖片描述

4、DeepSeek模型供應商配置(OpenAI-API-compatible供應商)

在這里插入圖片描述

5、配置頁面

在這里插入圖片描述

6、API Key獲取:ModelArts Studio控制臺,點擊API KEY管理,創建自己的API KEY,標簽和描述根據自己的填即可,獲取到自己的API KEY注意保存(只會顯示一次自己的API KEY)

在這里插入圖片描述

在這里插入圖片描述

7、自定義 API endpoint 地址獲取:ModelArts Studio控制臺,點擊在線推理,選擇自己的服務,商用服務或者免費服務的用法相同,點擊調用說明獲取自定義API endpoint 地址

在這里插入圖片描述

8、點擊OpenAI SDK復制API接口信息,這個就是自己的API endpoint 地址

在這里插入圖片描述

9、Dify - LLM 應用開發平臺填寫獲取到的API KEY和自定義 API endpoint 地址和模型名稱

在這里插入圖片描述

10、點擊保存,頁面會顯示修改成功,配置成功頁面如下

在這里插入圖片描述

4、高質量知識庫配置Embedding及Rerank模型
4.1 部署Embedding及Rerank模型

1、登錄華為云解決方案實踐,選擇快速部署Embedding及Rerank模型

在這里插入圖片描述

2、點擊進入-下滑至方案架構

在這里插入圖片描述

3、區域選擇

成本預算:3~6元(按需計費:Flexus云服務器X實例2.28元/小時,彈性公網IP EIP0.80元/GB,體驗本方案預計成本不超過6元)

在這里插入圖片描述

4、選擇模板

  • 默認配置下一步

在這里插入圖片描述

5、參數配置

  • 按模板要求對部分資源加密取消勾選
  • ecs_password:云服務器密碼,長度為8-26位,密碼至少必須包含大寫字母、小寫字母、數字和特殊字符(!@$%^-_=+[{}]:,./?)中的三種、

在這里插入圖片描述

6、資源棧設置

開啟回滾設置:開啟回滾表示操作失敗時,會自動回滾至系統所保存的上一個成功的資源狀態。創建后可在資源棧詳情頁面修改。

在這里插入圖片描述

7、配置確認

在這里插入圖片描述

8、創建執行計劃

在這里插入圖片描述

9、部署

在這里插入圖片描述

10、執行計劃

在這里插入圖片描述

11、基本信息中等待狀態改變為部署完成即可完成部署

在這里插入圖片描述

在這里插入圖片描述

4.2 高質量知識庫模型供應商配置
4.2.1 ECS公網IP獲取

1、ECS公網IP獲取

在這里插入圖片描述

在這里插入圖片描述

4.2.2 Ollama模型安裝

1、安裝bge-m3(embedding)和bge-reranker-v2-m3 (reranker)模型供應商

  • Ollama安裝

在這里插入圖片描述

在這里插入圖片描述

2、Ollama模型供應商配置

在這里插入圖片描述

  • 模型類型:Text Embedding
  • 模型名稱:bge-m3
  • 基礎URL:http://ECS公網IP:11434(如上前提有獲取流程)
  • 端口號:11434

在這里插入圖片描述

3、Xorbits Inference模型安裝

在這里插入圖片描述

在這里插入圖片描述

4.2.3 Xorbits Inference模型安裝

1、Xorbits Inference模型配置

模型類型: Rerank

模型名稱與模型UID均填寫:bge-reranker-v2-m3

服務器URL:http://ECS公網IP:9997

端口號:9997

在這里插入圖片描述

在這里插入圖片描述

2、模型成功配置

在這里插入圖片描述
如上即完成了華為云集群部署以及高質量知識庫配置Embedding及Rerank模型的創建和配置,后續即可直接在華為云Dify平臺中,直接創建高質量知識庫,經濟知識庫默認配置,不需要特殊創建過程。

資源刪除銷毀

Tip:

  • 刪除資源棧的流程官方文檔比較詳細可以參考官方文檔
  • 資源刪除銷毀單機部署和CCE集群高可用部署的方式相同

1、進入資源編排服務控制臺,找到剛創建成功的資源棧,單擊行操作列的刪除,頁面彈出確認刪除框,在輸入框中再次輸入Delete,單擊確定,即可刪除

在這里插入圖片描述

2、如果啟用刪除保護的情況下刪除資源堆棧,則會顯示錯誤消息

在這里插入圖片描述

3、只需要將刪除保護關閉再刪除即可(此處我并未開啟所以不做演示)

在這里插入圖片描述

華為云CCE高可用集群部署Dify平臺

基于華為云 CCE 高可用集群部署 Dify 平臺,開發者利用 CCE 多節點冗余、自動擴縮容及網絡隔離能力,結合 Dify 微服務架構實現組件彈性擴展,通過華為云 RDS/Redis/EVS 保障數據高可用,以簡潔架構快速構建安全可靠的應用環境

?高可用性:華為云 CCE 提供多節點冗余架構,控制平面默認 3 個控制節點,通過 etcd 集群保證數據一致性,單節點故障不影響集群運行。工作節點支持自動擴縮容,能根據負載動態調整數量。同時,Dify 平臺的組件如數據庫采用華為云 RDS for PostgreSQL 高可用版,緩存使用 ElastiCache for Redis 主從架構,確保關鍵組件的高可用性,實現服務自愈,減少業務中斷時間

?彈性擴展:CCE 集群支持自動擴縮容,可根據 Dify 平臺的業務負載動態調整工作節點數量。Dify 平臺本身采用微服務架構,各個組件可獨立進行水平擴展,如 Web 服務、API 網關等無狀態服務可通過增加副本數量來提升并發處理能力,以應對不同規模的業務流量變化

?安全可靠:華為云 CCE 通過 VPC 網絡隔離、安全組規則以及 Kubernetes NetworkPolicy 實現網絡與安全隔離,保護 Dify 組件通信安全。數據方面,采用云硬盤 EVS 持久化存儲,支持多副本數據冗余和自動數據備份,RDS 支持數據靜態加密和傳輸加密,確保 Dify 數據的安全性和完整性。同時,華為云 CCE 服務通過多項安全合規認證,滿足企業級的安全合規需求

總結

本文完整呈現了在華為云 CCE 高可用集群部署 Dify 平臺并構建大模型知識庫的實戰過程,涵蓋從 ModelArts Studio 開通大模型服務、創建委托與 OBS 桶等準備工作,到 CCE 集群參數配置、模型供應商對接及 Embedding 與 Rerank 模型部署的全流程,幫助開發者高效利用華為云資源,以簡潔架構實現 Dify 平臺的高可用部署與知識庫搭建,快速落地大模型應用開發。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/86072.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/86072.shtml
英文地址,請注明出處:http://en.pswp.cn/web/86072.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

測試校招/應屆刷題知識路線

需要重點關注計算機基礎知識和測試相關技能 對于即將參加校招或應屆的同學,測試崗位需要重點關注計算機基礎知識和測試相關技能。 掌握操作系統、計算機網絡、數據庫等計算機基礎,同時熟悉測試基礎理論、測試方法、自動化測試工具 (如 Selenium、JMeter)和編程語言(如 Py…

華為云Flexus+DeepSeek征文 | 基于華為云的 Dify-LLM 企業級 AI 開發平臺部署指南

前言 在人工智能技術迅猛發展的今天,大語言模型(LLM)已成為推動企業智能化轉型的核心引擎。然而,如何高效、安全地將 LLM 能力整合到實際業務場景中,仍然是許多開發者面臨的挑戰。Dify 作為一款開源的 LLM 應用開發平…

Dify×奇墨科技:開源+本土化,破解企業AI落地難題

在人工智能技術迅猛發展的今天,企業亟需高效、安全的AI應用開發工具。開源LLMOps平臺Dify.AI憑借其靈活性與開放性,已成為開發者構建AI應用的首選之一。而它在中國市場的規模化落地,離不開本土合作伙伴的強力支撐——奇墨科技作為Dify中國大陸…

Vue3+Spring boot 前后端防抖增強方案

我將基于您提供的防抖切面代碼進行改進,主要優化點包括使用Redis實現分布式防抖、增強鍵生成策略、改進異常處理等。以下是完整的改進方案: 1. 改進的防抖注解 (Debounce.java) java 復制 下載 package com.weiyu.anno;import java.lang.annotation…

Cppcheck 使用教程:本地 + CMake + GitHub Actions 自動分析實戰

Cppcheck 是一款強大的 C/C 靜態分析工具,專注于發現內存泄漏、未初始化變量、死代碼、未使用函數等問題。它不依賴編譯器,適合在持續集成和本地開發中快速定位潛在 Bug。 本文將手把手教你如何: 安裝 Cppcheck 在命令行中使用 集成到 CMak…

Mac Parallels Desktop Kali 2025 代理設置

Mac Parallels Desktop Kali 2025 代理設置 核心步驟: kali設置橋接wifi 查看kali和主機ip 運行命令ifconfig查看kali ip: mac主機ip: kali設置proxy ip填寫主機ip,port為主機proxy端口 enjoy

通義靈碼編程智能體深度評測(Qwen3模型+終端操作+MCP工具調用實戰)

1 引言 隨著AI編程助手進入工具鏈集成時代,通義靈碼作為阿里云推出的智能編程解決方案,其Qwen3模型與MCP(Multi-tool Calling Platform)的協同能力引發開發者關注。本文將基于真實開發場景,從代碼理解、終端操作和工具鏈調用三個維度展開深度…

SpringBoot電腦商城項目--商品詳情+加入購物車

商品詳情 1. 持久層 1.1. 規劃sql語句 根據id查詢商品詳情 1.2 mapper層編寫抽象方法 /*** 根據商品id查詢商品詳情* param id 商品id* return 匹配的id商品詳情,如果沒有匹配的數據,則返回null*/Product findById(Integer id); 1.3 xml文件中編寫sq…

上交卡爾動力聯合提出FastDrive!結構化標簽實現自動駕駛端到端大模型更快更強

最近將類人的推理能力融入到端到端自動駕駛系統中已經成為了一個前沿的研究領域。其中,基于視覺語言模型的方法已經吸引了來自工業界和學術界的廣泛關注。 現有的VLM訓練范式嚴重依賴帶有自由格式的文本標注數據集,如圖1(a)所示。雖然這些描述能夠捕捉豐…

C# 委托(什么是委托)

什么是委托 可以認為委托是持有一個或多個方法的對象。當然,一般情況下你不會想要“執行”一個對 象,但委托與典型的對象不同。可以執行委托,這時委托會執行它所“持有"的方法。 本章將揭示創建和使用委托的語法和語義。在本章后面&am…

iTwin briefcase, checkpoint ,standalone

在 iTwin.js 中,briefcase 和 checkpoint 都是 IModel 的不同連接類型,但它們的用途和特性不同: Briefcase 用途:用于本地編輯和同步。通常是用戶從 iModelHub 檢出(Check-out)后在本地生成的可寫副本。特…

媒體AI關鍵技術研究

一、引言 隨著人工智能技術的迅猛發展,媒體行業正經歷前所未有的變革。AI技術不僅重塑了內容生產和傳播模式,更為媒體創意發展提供了全新可能。在數字化、移動化和信息爆炸的大背景下,傳統媒體面臨巨大挑戰,而AI技術為行業帶來了…

Cargo 與 Rust 項目

一、Rust 項目:現代化的系統編程單元 Rust 項目 是用 Rust 語言編寫的軟件工程單元,具有以下核心特征: 核心組件: src/ 目錄:存放 Rust 源代碼(.rs 文件) Cargo.toml:項目清單文件…

uni-app總結6-配合iOS App項目開發apple watch app

假設你已經用uni-app開發好了一個iOS端的app,現在想要開發一個配套的apple watch app。改怎么去開發呢?是不是一頭霧水,這篇文章就會介紹一些apple watch app開發的知識以及如何在uni-app開發的iOS app基礎上去開發配套的watch app。 一、apple watch 開發知識 apple watc…

神經網絡的本質 邏輯回歸 python的動態展示

神經網絡的本質 邏輯回歸 python的動態展示 邏輯回歸運行圖相關代碼什么是邏輯回歸和ai的關系邏輯回歸公式流程與實際案例解析**一、邏輯回歸的數學公式流程**1. **線性組合階段**2. **激活函數(Sigmoid)**3. **概率預測與決策**4. **交叉熵損失函數**5.…

sql server中的with 鎖各種區別

📘 SQL Server 常用 WITH (Hint) 用法與組合場景對照表 Hint 組合作用說明常見用途是否阻塞他人是否讀臟數據備注WITH (NOLOCK)不加共享鎖,允許讀取未提交數據報表導出、大數據分頁??等價于 READ UNCOMMITTED,臟讀風險高WITH (HOLDLOCK)保持…

KES數據庫部署工具使用

一、啟動部署工具 Windows系統 #命令行 ${安裝目錄}/ClientTools/guitools/DeployTools/deploy.exeLinux系統 #命令行 [rootnode ~]# ${安裝目錄}/ClientTools/guitools/DeployTools/deploy二、環境配置 1.硬件要求 #都是最小配置 CPU:主流32或64位 內存&#…

TB62211FNG是一款采用時鐘輸入控制的PWM斬波器的兩相雙極步進電機驅動器

TB62211FNG是一款采用時鐘輸入控制的PWM斬波器的兩相雙極步進電機驅動器。該器件采用BiCD工藝制造,額定電壓為40伏/1.0安培。片上電壓調節器允許使用單一VM電源控制步進電機。 特點: ? 雙極性步進電機驅動器 ? 脈沖寬度調制(PWM&#xf…

uni-app項目實戰筆記24--uniapp實現圖片保存到手機相冊

前提條件:微信小程序要想實現保存圖片到本地相冊需要到微信公眾平臺--小程序--開發管理中配置服務器域名中的downloadFile合法域名: \uniapp提供了saveImageToPhotosAlbum API實現保存的圖片到本地相冊。下面是它的配置參數: 參數名類型必填…

面試題-定義一個函數入參數是any類型,返回值是string類型,如何寫出這個函數,代碼示例

在 TypeScript 里,要定義一個入參為any類型、返回值為string類型的函數,可參考下面幾種實現方式: 1. 基礎實現 直接把入參轉換為字符串返回。 function anyToString(input: any): string {return String(input); // 使用String()進行類型轉…