華為云Flexus+DeepSeek征文 | 基于華為云ModelArts Studio搭建AnythingLLM聊天助手

華為云Flexus+DeepSeek征文 | 基于華為云ModelArts Studio搭建AnythingLLM聊天助手

  • 引言
  • 一、ModelArts Studio平臺介紹
    • 華為云ModelArts Studio簡介
    • ModelArts Studio主要特點
  • 二、AnythingLLM介紹
    • AnythingLLM 簡介
    • AnythingLLM主要特點
    • AnythingLLM地址
  • 三、安裝AnythingLLM應用
    • 下載AnythingLLM軟件
    • 安裝AnythingLLM工具
  • 四、開通DeepSeek-R1-0528商用服務
    • 訪問ModelArts Studio控制臺
    • DeepSeek-R1-0528 介紹
    • 開通DeepSeek-R1-0528服務
    • 生成API Key
    • 復制及保存OpenAI SDK信息
  • 五、AnythingLLM基本配置工作
    • 設置系統語言
    • 配置AI提供商
    • 新建工作區
    • 測試對話
  • 六、使用體驗
  • 七、實踐總結

引言


隨著人工智能技術的發展,本地化部署的大語言模型(LLM)逐漸成為構建個性化智能服務的關鍵。AnythingLLM 作為一個開源的本地聊天助手解決方案,以其高效、安全和易用性受到了廣泛關注。借助華為云 ModelArts Studio 強大的 AI 工程化能力,我們能夠快速搭建并部署 AnythingLLM,實現從概念到應用的無縫銜接。通過本次實踐,我們將展示如何利用華為云的彈性計算資源和一站式服務,輕松創建一個功能強大的私有 AI 助手。


一、ModelArts Studio平臺介紹

華為云ModelArts Studio簡介

華為云ModelArts Studio是基于ModelArts構建的一站式大模型即服務平臺(MaaS),深度整合昇騰算力資源與全鏈路開發工具,為開發者提供從數據準備、模型訓練微調、提示詞工程到應用部署的全流程解決方案。平臺不僅預置主流開源大模型,還具備海量數據智能預處理、自動化標注、分布式訓練及模型自動生成能力,全面覆蓋AI模型全生命周期管理。無論是深耕算法的工程師、AI領域初學者,還是尋求智能化轉型的企業,都能依托ModelArts Studio的高效開發能力,快速實現AI應用的高質量落地與規模化部署。

  • 華為云ModelArts Studio平臺地址:https://www.huaweicloud.com/product/modelarts/studio.html

在這里插入圖片描述

ModelArts Studio主要特點

  • ? 模型全、免配置、免調優、性能優
    業界 SOTA 大模型覆蓋度高達 99%,內置最優超參配置,結合昇騰算子優化與顯存管理,顯著提升訓練與推理性能。

  • ? 開箱即用,一站式模型開發服務
    提供模型調優、壓縮、部署、評測等全棧工具,功能覆蓋大模型全生命周期,用戶無需搭建即可直接使用。

  • ? 資源一站式按需開通,建設周期短
    計算資源可分鐘級獲取,支持按需計費、彈性擴縮容,并具備斷點續訓與故障快速恢復能力。

  • ? 多服務組合競爭力,一站式應用能力集成
    支持 MCP Server、LangChain、RAG、Agent、Guard、九問等組件即插即用,靈活構建復雜 AI 應用場景。

  • ? 兼容性強,適配主流框架與自定義需求
    全面支持 TensorFlow、PyTorch、MindSpore 等主流 AI 框架,同時支持用戶自研算法框架接入。

二、AnythingLLM介紹

AnythingLLM 簡介

AnythingLLM 是由 Mintplex Labs Inc. 開發的一款企業級本地化文檔聊天機器人解決方案,是目前全球首個支持完整本地大語言模型(LLM)交互的開源桌面應用。它不僅能夠與任何文檔內容進行智能對話,還提供強大的向量數據庫管理、API 集成和多用戶權限控制功能,適用于知識庫問答、企業私有化部署、AI 助手構建等多種場景。Everything is local by default —— 模型、文檔、聊天記錄全部存儲于本地,真正實現隱私優先、安全可控。

AnythingLLM主要特點

  • 🔐 無需賬戶注冊,開箱即用,保護用戶隱私
  • 💻 全平臺支持,兼容 macOS、Windows、Linux
  • ?? 一鍵安裝,無需復雜配置即可快速啟動
  • 📁 支持多種文檔格式:PDF、TXT、DOCX、CSV、MD 等
  • 💬 雙模式聊天體驗:保留上下文的對話模式 & 快速問答的查詢模式
  • 📚 自動向量化文檔,高效處理大型資料庫
  • 🔍 引用文獻標注功能,回答結果來源清晰可查
  • 🧠 內置 LLM 支持,本地運行無依賴云端服務
  • 📈 成本優化設計,文檔嵌入僅需一次費用,節省高達 90%
  • 🌐 開發者友好 API,便于深度集成與定制開發
  • 👥 多用戶權限管理,滿足團隊協作與企業部署需求
  • 🧱 可嵌入網頁小部件,輕松集成到網站或平臺中
  • ?? 支持云端部署,靈活適配本地與在線使用場景

AnythingLLM地址

🚀 官網地址:https://useanything.com
📦 GitHub 地址:https://github.com/Mintplex-Labs/anything-llm


三、安裝AnythingLLM應用

下載AnythingLLM軟件

AingDesk下載地址:https://anythingllm.com/desktop,我們選擇Windows x64位版本進行下載。

在這里插入圖片描述

安裝AnythingLLM工具

下載AnythingLLMk安裝包后,在本地Windows上直接安裝即可。

在這里插入圖片描述

安裝安裝提示,依次點擊下一步安裝即可。

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

安裝AnythingLLM完成,打開后如下所示:

在這里插入圖片描述

四、開通DeepSeek-R1-0528商用服務

訪問ModelArts Studio控制臺

我們登錄華為云官網后,在ModelArts Studio介紹頁中(官網地址:https://www.huaweicloud.com/product/modelarts/studio.html),我們點擊“ModelArts Studio控制臺”后,即可進入ModelArts Studio控制臺頁面。

在這里插入圖片描述

在這里插入圖片描述

DeepSeek-R1-0528 介紹

DeepSeek-R1-0528 是 DeepSeek 最新推出的大語言模型版本,專為提升復雜代碼生成數學推理能力而設計。該模型在訓練數據和算法架構上進行了深度優化,顯著提升了以下方面的能力:

  • 邏輯推理準確性
  • 程序生成效率
  • 數學問題求解能力

適用于如自動化編程、科研輔助、金融建模、數據分析等對精度與性能要求極高的高端應用場景,是開發者與研究人員的理想選擇。


?? 華為云 ModelArts Studio(MaaS 平臺)正式接入 DeepSeek-R1-0528

華為云 ModelArts Studio 是一站式 AI 開發平臺,現已全面接入 DeepSeek-R1-0528,進一步豐富了其 MaaS(Model as a Service)服務能力

基于 昇騰云的強大算力底座,用戶可實現:

? 一鍵部署調用
? 低成本靈活擴展
? 高效應對復雜AI任務

此次合作不僅顯著增強了平臺在代碼生成數學推理方面的表現,也大幅降低了使用門檻與成本,助力開發者與企業快速構建智能化應用,推動 AI 技術落地。


📌 立即體驗 DeepSeek-R1-0528,開啟智能開發新篇章!

開通DeepSeek-R1-0528服務

在ModelArts Studio控制臺首頁的左側菜單欄中,我們選擇模型推理——在線推理,選擇商務服務DeepSeek-R1-0528,點擊“開通服務”。

在這里插入圖片描述

備注:

服務類型描述注意事項
免費服務適合用于體驗模型,受嚴格的速率限制。平臺可能會不定時調整其適用模型、免費額度、有效期等內容。
- 單個模型提供200萬token推理額度。額度消耗完后可選擇開通商用級別的推理API服務或部署為付費服務使用。
商用服務提供商用級別的推理API服務。開通后可獲取付費API服務(僅限貴陽一)。
- 用戶可以前往費用中心查看模型服務的優惠折扣發放和使用情況。可以前往“我的服務”部署為個人服務后付費使用。

點擊“開通服務”后,我們勾選同意協議,確認“立即開通”。

在這里插入圖片描述

生成API Key

進入API Key管理頁面。可以選擇“創建API Key”,注意保存此API Key,建議保存在本地以便后續使用。

在這里插入圖片描述

復制及保存OpenAI SDK信息

我們可以查看DeepSeek-R1-0528的使用說明,只需要點擊“調用說明”選項。

在這里插入圖片描述

調用說明如下所示,我們將DeepSeek-R1-0528服務的OpenAI SDK相關文件復制,保存在本地文本文件或本地筆記中。

在這里插入圖片描述

五、AnythingLLM基本配置工作

設置系統語言

點擊界面左下角的設置圖標,進入系統設置界面。

在這里插入圖片描述

在外觀——系統偏好——顯示語言中,選擇顯示 AnythingLLM 界面所用的語言設置為Chinese。

在這里插入圖片描述

配置AI提供商

🔐 LLM 首選項配置說明

LLM 首選項用于設置你所使用的 大語言模型(LLM)聊天服務與嵌入服務 的提供商憑據和相關參數。為確保 AnythingLLM 能夠正常運行,請務必保證所填寫的 API 密鑰是最新的且準確無誤。錯誤或過期的密鑰將導致模型無法調用。

📘 建議參考以下配置信息進行設置,以確保服務順利連接與運行。

  • LLM提供商:Generic OpenAI(通過自定義配置連接任何兼容 OpenAI API 的服務)
  • Base URL: https://api.modelarts-maas.com
  • API Key: 填寫剛才保存的API Key
  • Chat Model Name: deepseek-r1-250528
  • Token context window: 2048 (模型能夠處理的輸入文本(包括對話歷史和當前輸入)的最大長度為 2048 個 token,超出此限制的部分將被截斷。)
  • Max Tokens: 1024 (模型每次回復時最多生成 1024 個 token 的內容,這決定了輸出響應的最大長度。

在這里插入圖片描述

新建工作區

在AnythingLLM的主界面中,點擊【新工作區】選項。

在這里插入圖片描述

填寫工作區名稱,這里就填寫為測試工作區,點擊“保存”。

在這里插入圖片描述

測試對話

我們先開始在對話框中尋味“你是誰”,AnythingLLM經過深度思考并給出回答。

在這里插入圖片描述

六、使用體驗

在本次基于 華為云 ModelArts Studio 搭建 AnythingLLM AI 聊天助手 的實踐中,我深刻感受到華為云平臺在 AI 工程化落地方面的強大能力。ModelArts Studio 提供了一站式的模型部署、服務管理與接口調試功能,極大簡化了 AnythingLLM 的本地大模型運行環境搭建過程。無論是資源配置、容器管理還是公網訪問設置,操作都直觀高效,即使是初次接觸 AI 部署的開發者也能快速上手。更令人印象深刻的是其出色的資源調度能力和穩定的運行表現,即使面對高并發請求,系統依然保持低延遲響應,充分展現了華為云 Flexus 彈性算力和 ModelArts Studio 服務的強大性能。

七、實踐總結


🎯 實踐總結

在本次基于 華為云 ModelArts Studio 搭建 AnythingLLM AI 聊天助手 的實踐中,我深刻體會到華為云在 AI 開發領域的強大支撐能力。ModelArts Studio 提供了從模型部署、服務管理到 API 接口調用的一站式解決方案,極大地簡化了本地大語言模型的部署流程。整個過程無需復雜配置,即可快速構建一個穩定、高效的 AI 助手運行環境,真正實現了“開箱即用”的智能開發體驗。

? 為什么選擇華為云 ModelArts Studio?

  • ? 高效部署:一鍵部署 AnythingLLM,支持多種模型接入,操作流暢無卡頓
  • 🔧 靈活配置:資源彈性伸縮,適配不同規模的 AI 應用場景
  • 📊 可視化監控:實時查看服務狀態與資源使用情況,運維更輕松
  • ?? 云原生架構:依托華為云 Flexus 彈性算力,保障高并發下的穩定響應
  • 🌐 公網訪問便捷:內網穿透配置簡單,快速對外提供服務

華為云 ModelArts Studio 不僅降低了 AI 開發的技術門檻,更為開發者提供了強大的工具支持與穩定的運行環境。無論是個人學習、團隊協作,還是企業級應用落地,它都是值得信賴的選擇!


本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/84508.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/84508.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/84508.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

板凳-------Mysql cookbook學習 (十--5)

6.11 計算年齡 2025年6月11日星期三 --創建表、初始化數據 drop table if exists sibling; create table sibling (name char(20),birth date );insert into sibling (name,birth) values(Gretchen,1942-04-14); insert into sibling (name,birth) values(Wilbur,1946-11-28)…

SAP RESTFUL接口方式發布SICF實現全路徑

其他相關資料帖可參考: https://blog.csdn.net/woniu_maggie/article/details/146210752 https://blog.csdn.net/SAPmatinal/article/details/134349125 https://blog.csdn.net/weixin_44382089/article/details/128283417 【業務場景】 外部系統不想通過RFC (需…

在windows中安裝或卸載nginx

首先在nginx的安裝目錄下cmd查看nginx的版本: 在看windows的服務中是否nginx注冊為服務了 如果注冊了服務就先將服務卸載了 在nginx的安裝目錄cmd執行命令 NginxService.exe uninstall “NginxService”是對應的注冊的服務名稱 關閉所有的相關nginx的服務這個也…

FaceFusion 技術深度剖析:核心算法與實現機制揭秘

在 AI 換臉技術蓬勃發展的浪潮中,FaceFusion 憑借其出色的換臉效果和便捷的操作,成為眾多用戶的首選工具。從短視頻平臺上的創意惡搞視頻,到影視制作中的特效合成,FaceFusion 都展現出強大的實用性。而這一切的背后,是…

2. Web網絡基礎 - 協議端口

深入解析協議端口與netstat命令:網絡工程師的實戰指南 在網絡通信中,協議端口是服務訪問的門戶。本文將全面解析端口概念,并通過netstat命令實戰演示如何監控網絡連接狀態。 一、協議端口核心知識解析 1. 端口號的本質與分類 端口范圍類型說…

嵌入式學習筆記 - freeRTOS vTaskPlaceOnEventList()函數解析

vTaskPlaceOnEventList( &( pxQueue->xTasksWaitingToSend ), xTicksToWait ); 函數第一個參數為消息隊列等待插入鏈表, void vTaskPlaceOnEventList( List_t * const pxEventList, const TickType_t xTicksToWait ) { configASSERT( pxEventList ); /…

Ubuntu 配置使用 zsh + 插件配置 + oh-my-zsh 美化過程

Ubuntu 配置使用 zsh 插件配置 oh-my-zsh 美化過程 引言zsh 安裝及基礎配置oh-my-zsh 安裝及美化配置oh-my-zsh 安裝主題美化配置主題自定義主題 插件安裝及配置官方插件查看及啟用插件安裝 主題文件備份.zshrcre5et_self.zsh-theme 同步發布在個人筆記Ubuntu 配置使用 zsh …

Xilinx FPGA 重構Multiboot ICAPE2和ICAPE3使用

一、FPGA Multiboot 本文主要介紹基于IPROG命令的FPGA多版本重構,用ICAP原語實現在線多版本切換。需要了解MultiBoot Fallback點擊鏈接。 如下圖所示,ICAP原語可實現flash中n1各版本的動態切換,在工作過程中,可以通過IPROG命令切…

springMVC-11 中文亂碼處理

前言 本文介紹了springMVC中文亂碼的解決方案,同時也貼出了本人遇到過的其他亂碼情況,可以根據自身情況選擇合適的解決方案。 其他-jdbc、前端、后端、jsp亂碼的解決 Tomcat導致的亂碼解決 自定義中文亂碼過濾器 老方法,通過javaW…

mysql-innoDB存儲引擎事務的原理

InnoDB 存儲引擎支持 ACID 事務,其事務機制是通過 Redo Log(重做日志)、Undo Log(回滾日志) 和 事務日志系統 來實現的。下面詳細解析 InnoDB 事務的工作原理。 1.事務的基本特性(ACID) 特性描…

在GIS 工作流中實現數據處理

通過將 ArcPy 應用于實際的 GIS 工作流,我們可以高效地完成數據處理任務,節省大量時間和精力。接下來,本文將結合具體案例,詳細介紹如何運用 ArcPy 實現 GIS 數據處理的全流程。 數據讀取與合并 假設我們有多個 shapefile 文件&a…

第十四屆藍橋杯_省賽B組(C).冶煉金屬

題目如下: 拿到題我們來看一下,題目的意思,就是求出N個記錄中的最大最小值,言外之意就是,如果超過了這個最大值不行,如果小于這個最小值也不行,所以我們得出,這道題是一個二分答案的題目&#x…

??Android 如何查看CPU架構?2025年主流架構有哪些??

在開發安卓應用或選購手機時,了解設備的CPU架構至關重要。不同的架構影響性能、兼容性和能效比。那么,??如何查看安卓設備的CPU架構?2025年主流架構有哪些?不同架構之間有什么區別??? 本文將為你詳細解答。 ??1.…

飛算 JavaAI 2.0.0:開啟老項目迭代維護新時代

在軟件開發領域,老項目的迭代與維護一直是開發團隊面臨的難題。代碼邏輯混亂、技術棧陳舊、開發效率低下等問題,讓老項目改造猶如一場 “噩夢”。而飛算 JavaAI 2.0.0 版本的正式上線,通過三大核心能力升級,為老項目開發帶來了全新…

Linux初步介紹

Linux是一種開源的類Unix操作系統內核,廣泛應用于服務器、桌面、嵌入式設備等各種計算平臺。它由Linus Torvalds于1991年首次開發,因其穩定性、安全性和靈活性,被全球開發者和企業廣泛采用。 特點: 開放性(開源&#…

OneNet + openssl + MQTT

1.OneNet 使用的教程 1.在網絡上搜索onenet,注冊并且登錄賬號。 2.產品服務-----物聯網服務平臺立即體驗 3.在底下找到立即體驗進去 4.產品開發------創建產品 5.關鍵是選擇MQTT,其他的內容自己填寫 6.這里產品以及開發完成,接下來就是添加設…

行為設計模式之Memento(備忘錄)

行為設計模式之Memento(備忘錄) 前言: 備忘錄設計模式,有點像vmware快照可以回滾,idea的提交記錄同樣可以混滾,流程引擎中流程可以撤銷到或者回滾到某個指定的狀態。 1)意圖 在不破壞封裝性的…

動畫直播如何顛覆傳統?解析足球籃球賽事的數據可視化革命

在5G和AI技術快速發展的今天,體育賽事直播正在經歷一場深刻的變革。傳統視頻直播雖然能提供真實的比賽畫面,但在戰術可視化、數據深度和交互體驗方面存在明顯短板。而基于實時數據驅動的動畫直播技術,正通過創新的方式彌補這些不足&#xff0…

二刷蒼穹外賣 day01

nginx nginx反向代理 將前端發送的請求由nginx轉發到后端服務器 好處: 提速:nginx本身可緩存數據 負載均衡:配置多臺服務器,大量請求來臨可均衡分配 保證后端安全:不暴露后端服務真實地址 server{listen 80;server_…

5.2 HarmonyOS NEXT應用性能診斷與優化:工具鏈、啟動速度與功耗管理實戰

HarmonyOS NEXT應用性能診斷與優化:工具鏈、啟動速度與功耗管理實戰 在HarmonyOS NEXT的全場景生態中,應用性能直接影響用戶體驗。通過專業的性能分析工具鏈、針對性的啟動速度優化,以及精細化的功耗管理,開發者能夠構建"秒…