GPUStack昇騰Atlas300I duo部署模型DeepSeek-R1【GPUStack實戰篇2】

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

2025年4月25日GPUStack發布了v0.6版本,為昇騰芯片910B(1-4)和310P3內置了MinIE推理,新增了310P芯片的支持,很感興趣,所以我馬上來搗鼓玩玩看哈
官方文檔:https://docs.gpustack.ai/latest/installation/ascend-cann/online-installation/
目前GPUStack的Ascend MindIE推理引擎支持的模型列表:https://www.hiascend.com/document/detail/zh/mindie/100/whatismindie/mindie_what_0003.html


部署GPUStack

可以參考我之前寫的:鯤鵬+昇騰部署集群管理軟件GPUStack,兩臺服務器搭建雙節點集群【實戰詳細踩坑篇】

啟動并創建容器:

docker run -d --name gpustack \--restart=unless-stopped \--device /dev/davinci0 \--device /dev/davinci1 \--device /dev/davinci_manager \--device /dev/devmm_svm \--device /dev/hisi_hdc \-v /usr/local/dcmi:/usr/local/dcmi \-v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \-v /usr/local/Ascend/driver/lib64/:/usr/local/Ascend/driver/lib64/ \-v /usr/local/Ascend/driver/version.info:/usr/local/Ascend/driver/version.info \-v /etc/ascend_install.info:/etc/ascend_install.info \--network=host \--ipc=host \-v gpustack-data:/var/lib/gpustack \gpustack/gpustack:latest-npu-310p

部署DeepSeek-R1

在這里插入圖片描述
(1)登錄后選擇模型,搜索:deepseek,選擇deepseek-ai/DeepSeek-R1-Distill-Qwen-7B模型,后端選擇:Ascend MindIE,然后點保存。

在這里插入圖片描述

下載完成后運行報錯,查了一下,目前適配的Ascend MindIE是1.0.0版本,還沒適配DeepSeek-R1!

在這里插入圖片描述

以下為報錯日志:

2025-04-27 06:42:05,038 [ERROR] model.py:39 - [Model]	>>> Exception:call aclnnInplaceZero failed, detail:EZ9999: Inner Error!
EZ9999: [PID: 43453] 2025-04-27-06:42:05.032.406 Parse dynamic kernel config fail.TraceBack (most recent call last):AclOpKernelInit failed opTypeZerosLike ADD_TO_LAUNCHER_LIST_AICORE failed.[ERROR] 2025-04-27-06:42:05 (PID:43453, Device:0, RankID:-1) ERR01100 OPS call acl api failed
Traceback (most recent call last):File "/usr/local/lib/python3.11/dist-packages/model_wrapper/model.py", line 37, in initializereturn self.python_model.initialize(config)^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "/usr/local/lib/python3.11/dist-packages/model_wrapper/standard_model.py", line 146, in initializeself.generator = Generator(^^^^^^^^^^File "/usr/local/lib/python3.11/dist-packages/mindie_llm/text_generator/generator.py", line 119, in __init__self.warm_up(max_prefill_tokens, max_seq_len, max_input_len, max_iter_times, inference_mode)File "/usr/local/lib/python3.11/dist-packages/mindie_llm/text_generator/generator.py", line 303, in warm_upraise eFile "/usr/local/lib/python3.11/dist-packages/mindie_llm/text_generator/generator.py", line 296, in warm_upself._generate_inputs_warm_up_backend(input_metadata, inference_mode, dummy=True)File "/usr/local/lib/python3.11/dist-packages/mindie_llm/text_generator/generator.py", line 378, in _generate_inputs_warm_up_backendself.generator_backend.warm_up(model_inputs, inference_mode=inference_mode)File "/usr/local/lib/python3.11/dist-packages/mindie_llm/text_generator/adapter/generator_torch.py", line 198, in warm_upsuper().warm_up(model_inputs)File "/usr/local/lib/python3.11/dist-packages/mindie_llm/text_generator/adapter/generator_backend.py", line 170, in warm_up_ = self.forward(model_inputs, **kwargs)^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "/usr/local/lib/python3.11/dist-packages/mindie_llm/utils/decorators/time_decorator.py", line 38, in wrapperreturn func(*args, **kwargs)^^^^^^^^^^^^^^^^^^^^^File "/usr/local/lib/python3.11/dist-packages/mindie_llm/text_generator/adapter/generator_torch.py", line 153, in forwardlogits = self.model_wrapper.forward(model_inputs, self.cache_pool.npu_cache, **kwargs)^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "/usr/local/lib/python3.11/dist-packages/mindie_llm/modeling/model_wrapper/atb/atb_model_wrapper.py", line 89, in forwardlogits = self.forward_tensor(^^^^^^^^^^^^^^^^^^^^File "/usr/local/lib/python3.11/dist-packages/mindie_llm/modeling/model_wrapper/atb/atb_model_wrapper.py", line 116, in forward_tensorlogits = self.model_runner.forward(^^^^^^^^^^^^^^^^^^^^^^^^^^File "/usr/local/Ascend/atb-models/atb_llm/runner/model_runner.py", line 193, in forwardreturn self.model.forward(**kwargs)^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "/usr/local/Ascend/atb-models/atb_llm/models/base/flash_causal_lm.py", line 452, in forwardself.init_ascend_weight()File "/usr/local/Ascend/atb-models/atb_llm/models/qwen2/flash_causal_qwen2.py", line 150, in init_ascend_weightweight_wrapper = self.get_weights()^^^^^^^^^^^^^^^^^^File "/usr/local/Ascend/atb-models/atb_llm/models/qwen2/flash_causal_qwen2.py", line 132, in get_weightsweight_wrapper = WeightWrapper(self.soc_info, self.tp_rank, attn_wrapper, mlp_wrapper)^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "/usr/local/Ascend/atb-models/atb_llm/utils/data/weight_wrapper.py", line 49, in __init__self.placeholder = torch.zeros(1, dtype=torch.float16, device="npu")^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
RuntimeError: call aclnnInplaceZero failed, detail:EZ9999: Inner Error!
EZ9999: [PID: 43453] 2025-04-27-06:42:05.032.406 Parse dynamic kernel config fail.TraceBack (most recent call last):AclOpKernelInit failed opTypeZerosLike ADD_TO_LAUNCHER_LIST_AICORE failed.[ERROR] 2025-04-27-06:42:05 (PID:43453, Device:0, RankID:-1) ERR01100 OPS call acl api failed
2025-04-27 06:42:05,042 [ERROR] model.py:42 - [Model]	>>> return initialize error result: {'status': 'error', 'npuBlockNum': '0', 'cpuBlockNum': '0'}
[2025-04-27 06:42:05.146668+00:00] [43225] [43226] [server] [WARN] [llm_daemon.cpp:64] : [Daemon] received exit signal[17]
[2025-04-27 06:42:05.146771+00:00] [43225] [43226] [server] [INFO] [llm_daemon.cpp:69] : Daemon wait pid with 43453, status 9
[2025-04-27 06:42:05.146776+00:00] [43225] [43226] [server] [ERROR] [llm_daemon.cpp:74] : ERR: Daemon wait pid with 43453 exit, Please check the service log or python log.
[ERROR] TBE(43892,python3):2025-04-27-06:42:05.253.179 [../../../../../../latest/python/site-packages/tbe/common/repository_manager/utils/repository_manager_log.py:30][log] [../../../../../../latest/python/site-packages/tbe/common/repository_manager/route.py:65][repository_manager] Subprocess[task_distribute] raise error[]
[ERROR] TBE(43893,python3):2025-04-27-06:42:05.253.179 [../../../../../../latest/python/site-packages/tbe/common/repository_manager/utils/repository_manager_log.py:30][log] [../../../../../../latest/python/site-packages/tbe/common/repository_manager/route.py:65][repository_manager] Subprocess[task_distribute] raise error[]
[ERROR] TBE(43891,python3):2025-04-27-06:42:05.253.179 [../../../../../../latest/python/site-packages/tbe/common/repository_manager/utils/repository_manager_log.py:30][log] [../../../../../../latest/python/site-packages/tbe/common/repository_manager/route.py:65][repository_manager] Subprocess[task_distribute] raise error[]
[ERROR] TBE(43890,python3):2025-04-27-06:42:05.253.179 [../../../../../../latest/python/site-packages/tbe/common/repository_manager/utils/repository_manager_log.py:30][log] [../../../../../../latest/python/site-packages/tbe/common/repository_manager/route.py:65][repository_manager] Subprocess[task_distribute] raise error[]
[ERROR] TBE(43888,python3):2025-04-27-06:42:05.253.207 [../../../../../../latest/python/site-packages/tbe/common/repository_manager/utils/repository_manager_log.py:30][log] [../../../../../../latest/python/site-packages/tbe/common/repository_manager/route.py:65][repository_manager] Subprocess[task_distribute] raise error[]
[ERROR] TBE(43887,python3):2025-04-27-06:42:05.253.222 [../../../../../../latest/python/site-packages/tbe/common/repository_manager/utils/repository_manager_log.py:30][log] [../../../../../../latest/python/site-packages/tbe/common/repository_manager/route.py:65][repository_manager] Subprocess[task_distribute] raise error[]
[ERROR] TBE(43889,python3):2025-04-27-06:42:05.253.262 [../../../../../../latest/python/site-packages/tbe/common/repository_manager/utils/repository_manager_log.py:30][log] [../../../../../../latest/python/site-packages/tbe/common/repository_manager/route.py:65][repository_manager] Subprocess[task_distribute] raise error[]
[ERROR] TBE(43886,python3):2025-04-27-06:42:05.253.290 [../../../../../../latest/python/site-packages/tbe/common/repository_manager/utils/repository_manager_log.py:30][log] [../../../../../../latest/python/site-packages/tbe/common/repository_manager/route.py:65][repository_manager] Subprocess[task_distribute] raise error[]
[ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared!
[ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared!
[ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared!
[ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared!
[ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared!
[ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared!
[ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared!
[ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared!
/usr/lib/python3.11/multiprocessing/resource_tracker.py:254: UserWarning: resource_tracker: There appear to be 30 leaked semaphore objects to clean up at shutdownwarnings.warn('resource_tracker: There appear to be %d '
Daemon is killing...
[2025-04-27 06:42:10.147021][43225][localhost.localdomain][system][stop][endpoint][success]
[2025-04-27 06:42:10.147044][43225][localhost.localdomain][system][stop][mindie server][success]

部署Qwen2.5模型

目前看qwen2.5系列是支持的,所以嘗試一下
在這里插入圖片描述

在這里插入圖片描述
在這里插入圖片描述
也不行,我是真服了,報錯日志和上面一模一樣


發現問題了,原來也是要改模型權重的精度,不支持BF16,需要改成FP16
在這里插入圖片描述
運行成功了!

在這里插入圖片描述

測試對話

在這里插入圖片描述
低參數基本都會有這個問題,我改回測高參數的模型,測試Qwen2.5-7B-Instruct正常

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/77466.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/77466.shtml
英文地址,請注明出處:http://en.pswp.cn/web/77466.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Linux進程詳細解析

1.操作系統 概念 任何計算機系統都包含?個基本的程序集合,稱為操作系統(OS)。籠統的理解,操作系統包括: ? 內核(進程管理,內存管理,文件管理,驅動管理) ? 其他程序&#xff08…

解決兩個技術問題后小有感觸-QZ Tray使用經驗小總結

老朋友都知道,我現在是一家軟件公司銷售部門的項目經理和全棧開發工程師,就是這么“奇怪”的崗位,大概我是公司銷售團隊里比較少有技術背景、銷售業績又不那么理想的銷售。 近期在某個票務系統項目上駐場,原來我是這個項目的項目…

Centos 7.6安裝redis-6.2.6

1. 安裝依賴 確保系統已經安裝了必要的編譯工具和庫: sudo yum groupinstall "Development Tools" -y sudo yum install gcc make tcl -y 2. 解壓 Redis 源碼包 進入 /usr/local/ 目錄并解壓 redis-6.2.6.tar.gz 文件: cd /usr/local/ sudo ta…

Ejs模版引擎介紹,什么是模版引擎,什么是ejs,ejs基本用法

** EJS 模板引擎**,讓你徹底搞明白什么是模板引擎、什么是 EJS、怎么用、語法、最佳實踐等等: 📚 一、什么是模板引擎? 模板引擎是前后端分離之前的一種服務器端“渲染技術”。它的主要作用是: 將 HTML 頁面和后端傳遞…

2025.4.21-2025.4.26學習周報

目錄 摘要Abstract1 文獻閱讀1.1 模型架構1.1.1 動態圖鄰接矩陣的構建1.1.2 多層次聚合機制模塊1.1.3 AHGC-GRU 1.2 實驗分析 總結 摘要 在本周閱讀的論文中,作者提出了一種名為AHGCNN的自適應層次圖卷積神經網絡。AHGCNN通過將監測站點視為圖結構中的節點&#xf…

6.1 客戶服務:智能客服與自動化支持系統的構建

隨著企業數字化轉型的加速,客戶服務作為企業與用戶交互的核心環節,正經歷從傳統人工服務向智能化、自動化服務的深刻變革。基于大語言模型(LLM)和智能代理(Agent)的技術為構建智能客服與自動化支持系統提供…

java Optional

我還沒用過java8的一些語法,有點老古董了,記錄下Optional怎么用。 從源碼看,Optional內部持有一個對象, 有一些api對這個對象進行判空處理。 靜態方法of ,生成Optional對象, 但這個value不能為空&#…

【Java面試筆記:進階】24.有哪些方法可以在運行時動態生成一個Java類?

在Java中,運行時動態生成類是實現動態編程、框架擴展(如AOP、ORM)和插件化系統的關鍵技術。 1.動態生成Java類的方法 1.從源碼生成 直接生成源碼文件:通過Java程序生成源碼并保存為文件。編譯源碼: 使用ProcessBuilder啟動javac進程進行編譯。使用Java Compiler API(ja…

基于Jamba模型的天氣預測實戰

深入探索Mamba模型架構與應用 - 商品搜索 - 京東 DeepSeek大模型高性能核心技術與多模態融合開發 - 商品搜索 - 京東 由于大氣運動極為復雜,影響天氣的因素較多,而人們認識大氣本身運動的能力極為有限,因此以前天氣預報水平較低 。預報員在預…

GAMES202-高質量實時渲染(Real-Time Shadows)

目錄 Shadow MappingshadowMapping的問題shadow mapping背后的數學PCF(Percentage Closer Filtering)PCSS(Percentage closer soft shadows)VSSM(Variance Soft Shadow Mapping)優化步驟3優化步驟1SAT&…

iphonex uniapp textarea標簽兼容性處理過程梳理

嗨,我是小路。今天主要和大家分享的主題是“iphonex uniapp textarea標簽兼容性處理過程梳理”。 在uniapp項目中,經常會使用到uniapp原生的textarea標簽,但在手機兼容性這塊,textarea并不是很好用,會出現一些…

C++ 區分關鍵字和標識符

1. 關鍵字(Keywords) 定義:關鍵字是編程語言預定義的具有特定意義的單詞。它們是語言的一部分,C編譯器具有特殊的理解規則,不能作為用戶自定義的標識符。作用:關鍵字用于定義語言結構,如聲明變…

杭電oj(1087、1203、1003)題解

DP 即動態規劃(Dynamic Programming),是一種通過把原問題分解為相對簡單的子問題,并保存子問題的解來避免重復計算,從而解決復雜問題的算法策略。以下從幾個方面簡述動態規劃: 基本思想 動態規劃的核心在…

一鍵多環境構建——用 Hvigor 玩轉 HarmonyOS Next

引言 在 HarmonyOS Next 的應用開發中,常常需要針對不同環境(測試、預發、線上)或不同簽名(調試、正式)輸出多個 APP/HAP 包。雖然 HarmonyOS 提供了多目標構建(Multi-Target Build)能力&#…

qt/c++云對象瀏覽器

簡介 本項目為基于QT5和C11的云對象存儲可視化管理工具 源碼獲取 int main(){ printf("源碼聯系綠泡泡:%s","joyfelic"); return 0; }

【Ubuntu】提升 docker ps -a 輸出的可讀性:讓 Docker 容器狀態更清晰

提升 docker ps -a 輸出的可讀性:讓 Docker 容器狀態更清晰 當我們使用 docker ps -a 查看所有 Docker 容器時,輸出的信息通常會非常多,尤其是在容器數量較多時。默認輸出中包含容器 ID、名稱、鏡像、狀態、端口等信息,容易讓人眼…

Spring Security自定義身份認證

盡管項目啟動時,Spring Security會提供了默認的用戶信息,可以快速認證和啟動,但大多數應用程序都希望使用自定義的用戶認證。對于自定義用戶認證,Spring Security提供了多種認證方式,常用的有In-Memory Authentication…

在亞馬遜云服務器上部署WordPress服務

在亞馬遜云服務器上部署WordPress服務第一步:創建EC2實例第二步:初始設置與安裝第三步:配置MySQL與WordPress第四步:配置Apache與WordPress第五步:訪問WordPress第六步:測試數據庫連接第七步:使…

Web3.0的認知補充(去中心化)

涉及開發技術: Vue Web3.js Solidity 基本認知 Web3.0含義: 新一代互聯網思想:去中心化及用戶為中心的互聯網 數據:可讀可寫可授權 核心技術:區塊鏈、NFT 應用:互聯網上應用 NFT &…

如何修復寶可夢時時刻刻冒險無法正常工作

寶可夢的時時刻刻冒險模式是一項強大的功能,即使應用程序關閉,它也能追蹤你的步行距離。它的工作原理是將你的步數與 iOS 上的 Apple Health 或 Android 上的 Google Fit 同步。它對于孵化寶可夢蛋和賺取好友糖果至關重要,但一旦它停止工作&a…