華為云Flexus+DeepSeek征文|實戰體驗云服務器單機部署和CCE高可用的架構AI賦能

?

前引:“在數字化浪潮洶涌澎湃的今天,企業對云計算服務的需求已從基礎架構支撐,逐步轉向更深層次的AI賦能與業務創新驅動。面對復雜多變的市場環境,選擇一個強大、可靠且具備前瞻性的云服務伙伴,無疑是企業實現高速增長的關鍵。作為全球領先的ICT基礎設施和智能終端提供商,華為在云計算領域同樣深耕多年,其華為云平臺憑借深厚的技術積累和獨特的生態優勢,正日益成為眾多企業數字化轉型的首選。本文將帶您深入探索華為云的各項服務,從核心技術、AI能力到實際應用場景,全面測評華為云在助力企業構建智能化未來方面的真實表現~

目錄

DeepSeek R1/V3商用服務開通

商用服務開通體驗

云服務單機部署

CCE高可用部署

Dify-LLM的登錄

MaaS服務對接

搭建自己的AI工作流

搭建Agent

搭建知識庫問答助手

算力、效率體驗

建議

心得分享


DeepSeek R1/V3商用服務開通

(1)新人需要先進行認證、登錄

(2)選擇ModelArts Studio控制臺

(3)選擇在線推理,選自己喜歡的模型開通體驗即可

商用服務開通體驗

一進入界面,就可以看見ModelArts Studio控制臺,畫面既簡潔又有技術感,例如:

整個開通過程簡單的三步就可以完成,DeepSeek R1/V3的體驗也很強,包括貼心贈送的免費額度,這不用用戶一上來就需要付費,可以先選擇體驗,給用戶的感受很好,點贊!

云服務單機部署

(1)首先我們需要在ModelArts Studio控制臺完成授權,保證單機部署成功

(2)選擇華為云單機部署

(3)我們可以直接用默認配置,選擇下一步

(4)這里只需要注意密碼的格式正確即可,加密、版本都可以自由選擇,再選擇下一步

(5)回滾是建議開啟的,很大的提高效率;刪除保護自定義即可,我們點擊下一步

(6)確認配置沒問題之后,就可以選擇創建執行計劃了

(7)等它創建成功,就點擊開始部署

(8)確認執行

(9)從執行計劃開始,整個過程大概10分鐘左右,還是很快的

(10)等他部署完成,這樣我們就完成了云服務器的單機部署

CCE高可用部署

高可用的部署比較云服務器單機部署更加的復雜一些,如果沒有仔細閱讀文檔部署指南,失誤多次是很正常的,包括CCE集群的一直報錯,這可能是沒有委托、授權等原因造成,下面開始教程~

(1)選擇高可用部署,打開

(2)這個默認配置我們可以不管,直接點擊下一步

(3)這里的任何密碼都需要嚴格按照規定設置,否則很容易部署失敗

(4)現在我們看到這個頁面的下面,有三個需要特別特別注意,它們一般就是部署失敗的原因,下面我們會分別獲取這三個變量,請注意教程,避免填錯!

首先我們來看桶名稱的獲取:

(1)在控制臺直接搜索:桶,找到桶列表,點擊創建

(2)配置的話我推薦低頻的,這樣計費可以減少一些,再點擊下一步

(3)這樣我們就創建完成了,這個桶的名字復制粘貼即可

秘鑰ID、秘鑰的獲取:

(1)在控制臺搜索:我的憑證

(2)這里還是建議重新設置一個秘鑰:點擊創建秘鑰,會生成一個小文檔,下載下來

(3)然后打開下載的那個文檔,我就得到了秘鑰、秘鑰ID,復制粘貼即可

上面我們就分別獲取了桶名稱、秘鑰、秘鑰ID,分別復制粘貼在對應的配置欄即可

(5)配置欄配置好之后,我們可以看見這里有個委托,這是必須設置的

委托的獲取與授權:

(1)點擊創建委托

(2)搜索:rf_admin_trust,如果沒有就點擊創建

(3)委托名字設置為:rf_admin_trust,點擊云服務、RFS,這是最重要的一步,然后完成

(4)點擊立刻授權,配置權限

(5)搜索下面這個權限,進行添加

(6)選擇所有資源,然后確定就完成了創建

(7)打開云容器引擎CCE,授權委托,這個過程大概需要等15分鐘左右緩存才有效果

授權之后等15分鐘緩沖,再繼續開始配置部署!

(6)點擊創建執行計劃

(7)完成配置確認

(8)待創建成功之后,開始部署

(9)這個過程大概18分鐘或者20分鐘左右,需要耐心等待,待部署成功就可以了

Dify-LLM的登錄

不管是高可用部署還是云服務單機部署,我們在部署成功之后都會生成一個IP地址,例如下面這樣,我們復制IP在瀏覽器打開,這里以CCE高可用的部署成功為基礎,復制IP打開!

(1)設置郵箱密碼

(2)重新輸入郵箱密碼

(3)進入到這個頁面就完成了,下面我們開始配置AI

MaaS服務對接

因為我們在后面搭建AI時,都要以DeepSeek等模型作為基礎,否則后面沒有模型可以使用

?(1)點擊設置

(2)供應商找到這個模型,添加

(3)下面我們分別獲取這三個變量

首先是名稱、地址:

(1)打開ModelArts Studio,選擇在線推理然后點擊模型調用說明(需要使用開通的模型)

(2)打開右邊的OpenAI ,這兩個就是地址名稱,粘貼復制在配置欄

接下來是秘鑰的獲取:

(1)打開ModelArts Studio控制臺,選擇下面的API管理

(2)點擊創建秘鑰

(3)創建成功之后,秘鑰只會顯示一次,注意復制粘貼一次性

?上面我們已經獲取完了秘鑰、秘鑰地址、名稱,下面我們回到配置

(4)完成配置

(5)下面這樣就表示對接完成了

搭建自己的AI工作流

(1)在工作室選擇導入DSL文件

(2)復制下面的USL到對話框,然后創建

https://documentation-samples.obs.cn-north-4.myhuaweicloud.com/solution-as-code-publicbucket/solution-as-code-moudle/building-a-dify-llm-application-development-platform/workflow/DeepSeek_searXNG%E8%81%94%E7%BD%91%E6%90%9C%E7%B4%A2_%E7%9F%A5%E8%AF%86%E5%BA%93.yml

(3)找到知識檢索,然后右邊點擊“+”

(4)這個文檔是個性的,可以插入學生信息、歷史問題、社會安全等各種文檔

(5)導入文檔之后,就像下面這樣就可以了

(6)再在工作流找到“搜索”,這里需要復制下面的URL,注意是高可用還是單機部署,注意區分

選擇聯網搜索插件,單擊授權按鈕,并添加URL。單機版部署填寫Dify服務器私網IP:http://{ECS私網IP}:8080;高可用部署填寫URL:http://searxng:8080。如下圖所示,單擊“保存”后,即可設置成功。(ECS私網IP是部署Dify的虛機的內網ip,如連接不通,請檢查虛機的安全組是否放通8080端口號)

(7)接下來在整個工作流找這種帶黃色感嘆號的,這表示是要切換模型的,比如下面這個:

重新在整個工作流查找這種黃色感嘆號的,都需要切換模型,和上面操作相同

(8)處理完之后點擊發布

(9)點擊運行,接下來在工作室就可以看到自己的工作流了

搭建Agent

(1)點擊創建空白應用

(2)選擇Agent,設置名字,點擊下一步

(3)點擊生成提示詞并且應用

(4)配置自己喜歡的參數,沒問題之后在發布,運行即可(記住先更新)

(5)這樣我們就可以在工作室開始正常使用了

搭建知識庫問答助手

(1)在知識庫選擇創建

(2)添加個性化文檔,點擊下一步即可

(3)點擊查看文檔是否添加成功、可用

(4) 顯示“可用”,就代表搭建完成了,這樣在后面配置AI的時候,就可以使用這個文檔了,相當于給AI插入指定信息,它可以在這里面搜索內容

算力、效率體驗

在本次華為云CCE容器引擎部署Dify-LLM的體驗中,最直觀的感受是??彈性算力資源帶來的高效與成本平衡??。通過一鍵部署功能,單機版僅需10分鐘即可完成環境搭建,且資源按需計費(如Flexus云服務器X實例0.95元/小時),適合個人開發者低成本體驗。而高可用版通過CCE集群自動擴縮容能力,實現了資源動態分配——在模型推理高峰時段,CCE集群自動擴容節點保障響應速度,低峰時縮減資源,綜合成本控制在35~70元/小時,相比傳統自建IDC節省約60%運維投入,部署時間大概20分鐘左右,對比傳統的,還是快很多的。下面我們來看它對比單機部署體現出來的優勢:

??穩定性??:CCE集群的多節點負載均衡避免了單點故障,實測QPS(每秒查詢率)提升40%;

??擴展性??:通過Redis緩存和CSS向量數據庫的集成,復雜AI Agent的并發處理能力提升2.3倍;

??智能調度??:NAT網關與彈性公網IP的聯動,使跨國API調用延遲降低至80ms以內,遠優于常規云服務

建議

??成本優化建議??:針對高頻推理場景,建議提供“階梯式預留實例”選項,例如承諾月均資源用量可享額外折扣,進一步降低企業成本;

文檔細節補充??:部署指南中CCE集群日志排查部分稍顯簡略,可增加常見錯誤代碼(如EIP綁定超時)的解決方案示意圖;

社區互動增強??:希望開設“方案對比實驗室”專欄,鼓勵用戶上傳不同配置的性能測試報告,促進技術經驗共享

心得分享

此次體驗充分感受到華為云“用AI解放生產力”的理念——從彈性算力調度到分鐘級部署,既降低了大模型應用的入門門檻,又通過CCE容器引擎保障了企業級穩定性。作為開發者,我看到了一個費用低、技術高、穩定的部署體驗,期待未來能看到更多類似“一鍵遷移傳統模型到Dify”的進階功能,持續降低AI落地的技術摩擦!

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/83606.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/83606.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/83606.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

雷卯針對易百納G610Q-IPC-38E 模組防雷防靜電方案

一、應用場景 1、智能監控 2、智能家居 3、工業自動化 4、機器人 5、智能交通 6、醫療影像 7、教育科研 二、 功能概述 1 HI3516CV610(ARM Cortex-A7 MP2) 2 AI算力 1Tops 3 模組集成 4M30FPS Sensor,支持最高 6M30fps 的 ISP 圖像…

生成對抗網絡(GAN)基礎原理深度解析:從直觀理解到形式化表達

摘要 本文詳細解析 生成對抗網絡(GAN) 的 核心原理,從通俗類比入手,結合印假鈔與警察博弈的案例闡述生成器 與 判別器 的對抗機制;通過模型結構示意圖,解析 噪聲采樣、樣本生成 及判別流程;基于…

OptiStruct結構分析與工程應用:無限元法介紹

13.3 無限元方法 本節將詳細闡述如何利用無限元方法求解外聲場分析,具體包括無限元方法基本理論,無限單元介紹、無限元分析建模指南及檢查,最后以一個實例講解整個分析設置過程。 13.3.1 無限元分析基礎理論 無限元求解外聲場的基本原理如…

判斷:有那種使用了局部變量的遞歸過程在轉換成非遞歸過程時才必須使用棧

這道題的關鍵在于理解遞歸轉非遞歸與 “是否用棧” 的本質邏輯,和 “局部變量” 無關,核心看遞歸的調用上下文是否需要保存。 一、遞歸的本質:依賴 “調用棧” 遞歸函數執行時,系統會用調用棧保存: 每層遞歸的參數、…

leetcode1443. 收集樹上所有蘋果的最少時間-medium

1 題目:收集樹上所有蘋果的最少時間 官方標定難度:中 給你一棵有 n 個節點的無向樹,節點編號為 0 到 n-1 ,它們中有一些節點有蘋果。通過樹上的一條邊,需要花費 1 秒鐘。你從 節點 0 出發,請你返回最少需…

MySQL 索引底層原理剖析:B+ 樹結構、索引創建維護與性能優化策略全解讀

引言 在 MySQL 數據庫的世界里,索引是提升查詢性能的關鍵利器。然而,很多開發者雖然知道索引的重要性,但對于索引背后的底層原理卻知之甚少。本文將深入 MySQL 索引的底層實現,剖析 B 樹的結構特點,以及如何利用這些知…

【Delphi】實現在多顯示器時指定程序運行在某個顯示器上

在多顯示器時代,經常會出現期望將程序運行在某個指定的顯示器上,特別是在調試程序的時候,期望切換分辨率,單步調試時,此時容易導致互相卡住,非常不方便,但是通過指定程序運行在不同的顯示器上就…

不動產登記區塊鏈系統(Vue3 + Go + Gin + Hyperledger Fabric)

好久沒有介紹過新項目的制作了,之前做的一直都是Fisco Bcos的項目,沒有介紹過Hyperledger Fabric的項目,這次來給大家分享下。 系統概述 不動產登記與交易平臺是一個基于Hyperledger Fabric的綜合性管理系統,旨在實現不動產登記…

論文閱讀筆記——Large Language Models Are Zero-Shot Fuzzers

TitanFuzz 論文 深度學習庫(TensorFlow 和 Pytorch)中的 bug 對下游任務系統是重要的,保障安全性和有效性。在深度學習(DL)庫的模糊測試領域,直接生成滿足輸入語言(例如 Python )語法/語義和張量計算的DL A…

cocos3.X的oops框架oops-plugin-excel-to-json改進兼容多表單導出功能

在使用oops框架的過程中,它的導出數據并生成數據結構的插件oops-plugin-excel-to-json有些小的坑點,為滿足我個人習慣,對此部分進行了一個小的修改,有需要的拿去用,記錄下供大家參考; 一、配置:…

解決IDE編譯JAVA項目時出現的OOM異常問題

出現的異常如圖: java.lang.0utOfMemoryError:Java heap space 解決方案: 文件 --> 設置 搜索 編譯器(就點擊編譯器這行),找到構建進程,共享堆大小,設置大一些,例如 2048 MB。 …

【Linux內核】設備模型之udev技術詳解

目錄 1. udev技術概述 2. 技術層次分析 2.1 內核層交互 2.2 規則引擎層 2.3 用戶空間實現 3. 關鍵技術要點 3.1 動態設備節點管理 3.2 熱插拔處理 3.3 模塊化規則系統 3.3.1. 變量替換功能 3.3.2. 條件判斷能力 3.3.3. 實現機制 3.3.4 應用場景 3.3.5 擴展能力 4…

群論在現代密碼學中的應用探索與實踐 —— 從理論到C語言實現

1. 引言:數字時代的信息安全挑戰 隨著互聯網和數字技術的快速發展,信息安全問題變得日益嚴峻。無論是個人隱私保護,還是企業數據安全,乃至國家安全,都依賴于有效的加密技術保障信息的機密性和完整性。網絡攻擊、數據泄…

前端開發處理‘流式數據’與‘非流式數據’,在接收完整與非完整性數據時應該如何渲染和使用

在前端開發中,處理 非流式數據 和 流式數據 的方式不同。根據是否完整接收數據、是否實時渲染的需求,可以分為以下四種典型場景: 一、四類常見場景總結 類型數據完整性是否實時渲染適用技術/方法A完整數據(一次性返回&#xff09…

thymeleaf直接調用Spring Bean中定義的方法

thymeleaf中可以使用表達式工具對象&#xff0c;通過符號直接調Spring Bean中定義的方法 Spring Bean Component public class InvokeMethodBean {public String fun() { return "fun";} }thymeleaf中調用 <div th:text"${invokeMethodBean.fun()}"&…

虛擬斯德哥爾摩癥候群:用戶為何為缺陷AI辯護?

當韓國用戶美咲連續第七次為虛擬男友的算法錯誤辯解&#xff1a;“他只是太累了才會說傷人的話”&#xff0c;心理醫生在診斷書上寫下“數字依賴伴隨認知失調”。這種現象并非孤例——斯坦福2024年研究顯示&#xff0c;62%長期使用情感AI的用戶會主動為系統缺陷尋找合理化解釋&…

tryhackme——Abusing Windows Internals(進程注入)

文章目錄 一、Abusing Processes二、進程鏤空三、線程劫持四、DLL注入五、Memory Execution Alternatives 一、Abusing Processes 操作系統上運行的應用程序可以包含一個或多個進程&#xff0c;進程表示正在執行的程序。進程包含許多其他子組件&#xff0c;并且直接與內存或虛…

[藍橋杯]密碼脫落

密碼脫落 題目描述 X 星球的考古學家發現了一批古代留下來的密碼。 這些密碼是由 A、B、C、D 四種植物的種子串成的序列。 仔細分析發現&#xff0c;這些密碼串當初應該是前后對稱的&#xff08;也就是我們說的鏡像串&#xff09;。 由于年代久遠&#xff0c;其中許多種子…

Python繪圖庫及圖像類型

折線圖&#xff08;plot&#xff09; 繪圖庫介紹 Python中繪制折線圖的全面指南_python繪制折線圖-CSDN博客https://blog.csdn.net/2301_81064905/article/details/139689644 核心作用說明趨勢分析揭示數據隨時間推移的上升/下降趨勢、周期性波動或轉折點變化對比在單一圖表…

4種常見Python設計愛心創意實現方法

在Python中設計愛心創意有多種實現方式&#xff0c;以下介紹4種常見方法&#xff0c;并附上完整代碼&#xff1a; 方法1&#xff1a;使用數學方程繪制&#xff08;Matplotlib&#xff09; ??原理??&#xff1a;使用參數方程繪制心形曲線 ??效果??&#xff1a;光滑的數…