華為云Flexus+DeepSeek征文|Linux命令實現兩種部署的性能捕獲+(硅基+Maas)模型添加教學

前引:“在數字化浪潮洶涌澎湃的今天,企業對云計算服務的需求已從基礎架構支撐,逐步轉向更深層次的AI賦能與業務創新驅動。面對復雜多變的市場環境,選擇一個強大、可靠且具備前瞻性的云服務伙伴,無疑是企業實現高速增長的關鍵。作為全球領先的ICT基礎設施和智能終端提供商,華為在云計算領域同樣深耕多年,其華為云平臺憑借深厚的技術積累和獨特的生態優勢,正日益成為眾多企業數字化轉型的首選。本文將帶您深入探索華為云的各項服務,從核心技術、AI能力到實際應用場景,全面測評華為云在助力企業構建智能化未來方面的真實表現~

目錄

一、DeepSeek R1/V3商用服務開通

二、商用服務開通體驗

三、云服務單機部署零基礎教學

四、執行Linux命令捕捉服務器性能

(1)可查看監控指標:

(2)用Linux命令安裝插件

(3)監控效果操作與展示:

五、CCE高可用部署零基礎教學

六、如何監控CCE集群性能

可監控指標:

兩種監控方法:

(1)Linux命令捕捉:

(2)云服務引擎:

七、Dify-LLM的登錄

八、如何添加硅基流動

九、如何添加Maas模型

十、算力、效率體驗

十一、建議

十二、心得分享


一、DeepSeek R1/V3商用服務開通

(1)新人需要先進行認證、登錄

(2)選擇ModelArts Studio控制臺,選擇在線推理,選自己喜歡的模型開通體驗即可

(3)在ModelArts Studio控制臺看是否有權限未開啟,這可能導致后面使用模型時報錯??

二、商用服務開通體驗

一進入界面,就可以看見ModelArts Studio控制臺,畫面既簡潔又有技術感,例如:

整個開通過程簡單的三步就可以完成,DeepSeek R1/V3的體驗也很強,包括貼心贈送的免費額度,這不用用戶一上來就需要付費,可以先選擇體驗,給用戶的感受很好,狠狠點贊!

三、云服務單機部署零基礎教學

(1)選擇華為云單機部署

(2)我們可以直接用默認配置,選擇下一步

(3)這里只需要注意密碼的格式正確即可,加密、版本都可以自由選擇,再選擇下一步

(4)回滾是建議開啟的,很大的提高效率;刪除保護自定義即可,我們點擊下一步

(5)確認配置沒問題之后,就可以選擇創建執行計劃了

(6)等它創建成功,就點擊開始部署

(8)從執行計劃開始,整個過程大概10分鐘左右,還是很快的

(9)等他部署完成,這樣我們就完成了云服務器的單機部署獲取Dify平臺的IP

四、執行Linux命令捕捉服務器性能

(1)可查看監控指標:

CPU使用率:查看CPU是否空閑或過于繁忙

內存使用率:監控內存是否充足

磁盤使用率:監控磁盤空間是否即將耗盡

磁盤讀寫速率(IOPS):分析磁盤性能瓶頸

網絡入/出帶寬:查看公網或內網流量情況

包括:GPU使用率/顯存使用率

華為云云服務監控 :這是最簡單、最實用的測量工具,采用圖形化趨勢分析

(2)用Linux命令安裝插件

(1)先等自己的云服務器部署成功

(2)點擊遠程登錄

(3)點擊立刻登錄

(4)先輸入root,然后回車,再輸入部署設置的密碼(注意:密碼的輸入不會顯示)再回車

(5)這樣的界面下,我們需要回到云監控服務復制 Linux 的執行命名

(6)然后回到登錄界面,點擊左上角的復制粘貼,粘貼命名然后發送

(7)這樣就表示成功了,然后等待3~5分鐘,就可以開始我們的“操作步驟”查看部署性能了

(3)監控效果操作與展示:

此監控需要在插件安裝成功之后才可以更好的展示效果!

(1)在云監控服務,點擊這個已經部署的實例

(2)點擊“監控”,點擊“操作系統監控”,這樣就可以查看部署的服務器實時性能參數了

五、CCE高可用部署零基礎教學

高可用的部署比較云服務器單機部署更加的復雜一些,如果沒有仔細閱讀文檔部署指南,失誤多次是很正常的,包括CCE集群的一直報錯,這可能是沒有委托、授權等原因造成,下面開始教程~

(1)選擇高可用部署,打開

(2)這個默認配置我們可以不管,直接點擊下一步

(3)這里的任何密碼都需要嚴格按照規定設置,否則很容易部署失敗

(4)現在我們看到這個頁面的下面,有三個需要特別特別注意,它們一般就是部署失敗的原因,下面我們會分別獲取這三個變量,請注意教程,避免填錯!

首先我們來看桶名稱的獲取:

(1)在控制臺直接搜索:桶,找到桶列表,點擊創建

(2)配置的話我推薦低頻的,這樣計費可以減少一些,再點擊下一步

(3)這樣我們就創建完成了,這個桶的名字復制粘貼即可

秘鑰ID、秘鑰的獲取:

(1)在控制臺搜索:我的憑證

(2)這里還是建議重新設置一個秘鑰:點擊創建秘鑰,會生成一個小文檔,下載下來

(3)然后打開下載的那個文檔,我就得到了秘鑰、秘鑰ID,復制粘貼即可

上面我們就分別獲取了桶名稱、秘鑰、秘鑰ID,分別復制粘貼在對應的配置欄即可

(5)配置欄配置好之后,我們可以看見這里有個委托,這是必須設置的

委托的獲取與授權:

(1)可以直接搜索“委托”

(2)在委托欄搜索:rf_admin_trust,如果沒有就點擊創建

(3)委托名字設置為:rf_admin_trust,點擊云服務、RFS,這是最重要的一步,然后完成

(4)點擊立刻授權,配置權限

(5)搜索下面這個權限,進行添加

(6)選擇所有資源,然后確定就完成了創建

(7)打開云容器引擎CCE,授權委托,這個過程大概需要等15分鐘左右緩存才有效果

授權之后等15分鐘緩沖,再繼續開始配置部署!

(6)點擊創建執行計劃

(7)完成配置確認

(8)待創建成功之后,開始部署

(9)這個過程大概18分鐘或者20分鐘左右,需要耐心等待,待部署成功就可以了

六、如何監控CCE集群性能

可監控指標:

工作負載狀態:您的應用是否都在正常運行?

節點列表:列出集群中所有的云服務器節點,每個節點的狀態、IP、CPU和內存的分配率

集群資源概覽:整個集群總的CPU、內存的 請求量和 限制量

CPU使用率、內存、磁盤I/O、網絡帶寬等

兩種監控方法:

(1)直接使用華為云監控控制臺是最直觀、最集成、最快捷的方法

(2)使用云服務引擎CCE監測CCE節點信息

(1)Linux命令捕捉:

與云服務單機部署一致,可直接參考都是先部署->完成插件安裝->進入Flexus X實例查看圖像分析,效果展示:

(2)云服務引擎:

(1)進入云服務引擎CCE,找到集群管理

?(2)點擊集群管理,就可以看見已經部署的集群了,點擊進去

(3)左邊工作欄找到“節點管理”,再點擊“節點”->“監控”

(4)可以點擊“查看更多數據”,就可以觀察集群的性能圖形化分析了

七、Dify-LLM的登錄

不管是高可用部署還是云服務單機部署,我們在部署成功之后都會生成一個IP地址,例如下面這樣,我們復制IP在瀏覽器打開,這里以CCE高可用的部署成功為基礎,復制IP打開!

(1)設置郵箱密碼

(2)重新輸入郵箱密碼

(3)進入到這個頁面就完成了,下面我們開始配置AI

八、如何添加硅基流動

由于之前一直是在華為云直接添加模型,這里教學如何調用其它模型!配置更豐富!

?(1)點擊設置

(2)供應商找到硅基流動這個模型,安裝添加

(3)登錄硅基流動

(4)點擊模型廣場

(5)最上面就獲取了模型名稱

(6)再點擊API秘鑰,創建

(7)這里我們就獲取了秘鑰

?(8)分別粘貼在配置欄

(9)然后點擊設置

?(10)這里的秘鑰還是在硅基里面獲取

(11)這樣就可以使用了

九、如何添加Maas模型

(1)在模型供應商找到Maas安裝添加

(2)點擊添加模型

(3)下面我們需要分別獲取這三個配置

(4)在ModelArts Studio控制臺找到API管理,創建獲取API

(5)接著在“在線推理”獲取模型名稱、API URL

(6)粘貼完這三個配置后,可以直接點擊保存

(7)點擊“設置”,繼續在ModelArts Studio控制臺獲取API,再點擊保存

(8)這樣我們就添加完成了

十、算力、效率體驗

在本次華為云CCE容器引擎部署Dify-LLM的體驗中,最直觀的感受是??彈性算力資源帶來的高效與成本平衡??。通過一鍵部署功能,單機版僅需10分鐘即可完成環境搭建,且資源按需計費(如Flexus云服務器X實例0.95元/小時),適合個人開發者低成本體驗。而高可用版通過CCE集群自動擴縮容能力,實現了資源動態分配——在模型推理高峰時段,CCE集群自動擴容節點保障響應速度,低峰時縮減資源,綜合成本控制在35~70元/小時,相比傳統自建IDC節省約60%運維投入,部署時間大概20分鐘左右,對比傳統的,還是快很多的。下面我們來看它對比單機部署體現出來的優勢:

??穩定性??:CCE集群的多節點負載均衡避免了單點故障,實測QPS(每秒查詢率)提升40%;

??擴展性??:通過Redis緩存和CSS向量數據庫的集成,復雜AI Agent的并發處理能力提升2.3倍

??智能調度??:NAT網關與彈性公網IP的聯動,使跨國API調用延遲降低至80ms以內,遠優于常規云服務

十一、建議

??成本優化建議??:針對高頻推理場景,建議提供“階梯式預留實例”選項,例如承諾月均資源用量可享額外折扣,進一步降低企業成本;

文檔細節補充??:部署指南中CCE集群日志排查部分稍顯簡略,可增加常見錯誤代碼(如EIP綁定超時)的解決方案示意圖;

社區互動增強??:希望開設“方案對比實驗室”專欄,鼓勵用戶上傳不同配置的性能測試報告,促進技術經驗共享

十二、心得分享

此次體驗充分感受到華為云“用AI解放生產力”的理念——從彈性算力調度到分鐘級部署,既降低了大模型應用的入門門檻,又通過CCE容器引擎保障了企業級穩定性。作為開發者,我看到了一個費用低、技術高、穩定的部署體驗,期待未來能看到更多類似“一鍵遷移傳統模型到Dify”的進階功能,持續降低AI落地的技術摩擦!

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/93919.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/93919.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/93919.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

langchain--1--prompt、output格式、LCEL示例

環境:本地使用ollama部署的deepseek-r1:1.5b模型 本文示例包含: [1] 非LCEL的調用方法[2] LCEL的調用方法[3] prompt template的簡單使用,除了PromptTemplate模板,還有一些其它模板,可去查看官網[4] 輸出:json格式、py…

【算法】指數滑動濾波器

指數滑動濾波器作用原理特點公式代碼優化升級作用 首先這個濾波器能夠將一些突變的信號對系統的影響降低,能夠平滑輸入信號,濾除噪聲,減少測量數據的瞬間波動和干擾,就是實現輸入信號不能不變,數值不會突然變大&#…

STM32F4—電源管理器

Power supply schemesPower supply supervisorInternal reset ON有PDR_ON pin的MCU,PDR_ON pin被拉高的時候電源監視器被使能。沒有PDR_ON pin的MCU默認一直使能。內部集成了power-on reset (POR) / power-down reset (PDR)POR(上電復位)&…

MySQL鎖的分類 MVCC和S/X鎖的互補關系

各位看官,大家早安午安晚安呀~~~如果您覺得這篇文章對您有幫助的話歡迎您一鍵三連,小編盡全力做到更好 歡迎您分享給更多人哦今天我們來學習:MySQL鎖的分類 && MVCC和S/X鎖的互補關系1.鎖分類1.按鎖粒度分類:全局鎖&#…

第五屆智能通信與計算國際學術會議(ICICC 2025)

重要信息 官網:www.ic-icc.org 時間:2025年8月15-16日 地點:中國 南京 第五屆智能通信與計算國際學術會議(ICICC 2025)定于2025年8月15-16日在中國 南京舉行。隨著信息技術的飛速發展,智能通信與計算領域的研究與…

基于C#和NModbus4庫實現的Modbus RTU串口通信

基于C#和NModbus4庫實現的Modbus RTU串口通信&#xff0c;包含完整的界面設計和功能實現&#xff1a;一、項目依賴配置NuGet包安裝&#xff1a; Install-Package NModbus4 Install-Package System.IO.Ports窗體控件布局&#xff1a; <!-- 基礎控件配置 --> <ComboBox …

想要批量提取視頻背景音樂?FFmpeg 和轉換器都安排上

你是否遇到過這樣的情況&#xff1f;看到一個超贊的短視頻&#xff0c;里面的背景音樂特別好聽&#xff0c;想單獨保存下來當手機鈴聲或收藏&#xff0c;卻不知道怎么把音樂從視頻里“摳”出來&#xff1f;別擔心&#xff01;今天就為大家分享兩種簡單易行的方法&#xff0c;無…

為什么MCP協議是AI集成的未來API

一、企業AI應用的核心挑戰與架構演進 當前企業AI落地面臨三大核心痛點&#xff1a; ??系統集成困境??&#xff1a;需對接企業內部業務系統&#xff08;CRM/ERP等&#xff09;??異構環境兼容??&#xff1a;需整合第三方AI服務與傳統API??數據孤島突破??&#xff1…

Apache Tomcat樣例目錄session操縱漏洞解讀

【漏洞名稱】&#xff1a;Apache Tomcat樣例目錄session操縱漏洞 &#xff08;Apache Tomcat示例目錄漏洞&#xff09;【漏洞等級】&#xff1a;中危&#xff0c;5.9分。【漏洞描述】Apache Tomcat默認安裝頁面中存在examples樣例目錄&#xff0c;里面存放著Servlets、JSP、Web…

Go語言實戰案例:實現HTTP客戶端請求并解析響應

本文是 Go 網絡與并發實戰系列的第2篇&#xff0c;聚焦于如何使用 Go 實現一個 HTTP 客戶端&#xff0c;完成請求發送、響應解析、錯誤處理、Header與Body提取等完整流程。一、前言&#xff1a;為什么學習HTTP客戶端&#xff1f;在日常開發中&#xff0c;無論是調用 RESTful AP…

java的冒泡排序算法

冒泡排序是一種簡單的排序算法&#xff0c;通過重復遍歷待排序序列&#xff0c;比較相鄰元素并在必要時交換位置&#xff0c;最終實現排序。以下是Java實現的詳細說明&#xff1a;核心原理?比較相鄰元素?&#xff1a;從序列第一個元素開始&#xff0c;逐對比較相鄰元素的大小…

玻爾茲曼分布與玻爾茲曼探索

目錄 玻爾茲曼分布定義 玻爾茲曼探索&#xff1a; 1. 玻爾茲曼分布公式 2. 溫度 T 如何影響采樣結果&#xff1f; (1) 高溫 (T→∞)&#xff1a; (2) 低溫 (T→0)&#xff1a; (3) 中等溫度 (T∈(0,∞))&#xff1a; 3. 直觀示例 4. 實際應用中的意義 5.核心誤區澄清…

【工具】jsDelivr CDN完全指南:免費高速的開源項目CDN服務

前言 在現代Web開發中&#xff0c;內容分發網絡&#xff08;CDN&#xff09;已經成為提升網站性能的重要工具。jsDelivr作為一個免費、快速、可靠的開源CDN服務&#xff0c;為全球開發者提供了優質的靜態資源分發服務。無論是加速GitHub倉庫訪問、分發npm包&#xff0c;還是為…

OSPF筆記整理

一、OSPF 基礎特性1. 技術背景&#xff08;對比 RIP&#xff09;RIP 的缺陷&#xff1a;最大跳數 15 限制、周期性發送全路由表&#xff08;占用帶寬&#xff09;、收斂慢、以跳數為度量值、易產生環路、30 秒更新間隔。OSPF 的改進&#xff1a;無跳數限制&#xff08;支持大規…

sqLite 數據庫 (3):以編程方式使用 sqLite,4 個函數,以及 sqLite 移植,合并編譯

&#xff08;22&#xff09; 只有四個函數 &#xff1a;以及 &#xff1a;&#xff08;23&#xff09;以及 &#xff1a;&#xff08;24&#xff09;&#xff08;25&#xff09; sqLite 的源代碼很少 &#xff1a;&#xff08;26&#xff09;&#xff08;27&#xff09;&#x…

Nginx跨域問題與 MIME 類型錯誤深度排錯指南:解決 MIME type of “application/octet-stream“ 報錯

前言&#xff1a;在 Web 開發中&#xff0c;跨域請求和資源加載錯誤是前端工程師和運維人員經常遇到的棘手問題。本文將詳細解析 Nginx 環境下跨域配置的多種方案、gzip 類型參數的優化要點&#xff0c;以及.mjs 文件 MIME 類型錯誤的解決方法&#xff0c;并結合排錯思路和原理…

什么是大端?什么是小端?如何驗證?

什么是大端&#xff1f;什么是小端&#xff1f;如何驗證&#xff1f; 在計算機系統中&#xff0c;大端&#xff08;Big-Endian&#xff09; 和小端&#xff08;Little-Endian&#xff09; 是兩種不同的字節序&#xff08;Byte Order&#xff09;&#xff0c;用于描述多字節數據…

JavaScript 語句和函數

1. JavaScript 語句 1&#xff09;if語句 if (condition) statement1 else statement2這里的條件&#xff08;condition&#xff09;可以是任何表達式&#xff0c;并且求值結果不一定是布爾值。 ECMAScript會自動調用Boolean()函數將這個表達式的值轉換為布爾值。 如果條件…

代碼隨想錄刷題Day22

替換數字 這道題比較簡單&#xff0c;遇到字母就copy到新的字符數組&#xff0c;如果是遇到數字&#xff0c;就在新字符數組中加入number的字符串。代碼如下&#xff1a; #include<stdio.h> #include<ctype.h> #include<string.h> #define Max 1000000 int…

邏輯回歸參數調優實戰指南

邏輯回歸的參數調節參數展示 LogisticRegression(penaltyl2,dualFalse,tol1e4,C1.0,fit_interceptTrue,intercept_scaling1,class_weightNone,random_stateNone,solverliblinear,max_iter100,multi_classovr,verbose0,warm_startFalse, n_jobs1)在前面的學習中&#xff0c;我們…