Atlas 800I A2 離線部署 DeepSeek-R1-Distill-Llama-70B

一、環境信息

1.1、硬件信息

Atlas 800I A2

1.2、環境信息

注意:這里驅動固件最好用商業版,我這里用的社區版有點小問題

操作系統:openEuler 22.03 LTS
NPU驅動:Ascend-hdk-910b-npu-driver_24.1.rc3_linux-aarch64.run
NPU固件:Ascend-hdk-910b-npu-firmware_7.5.0.1.129.run
MindIE鏡像:2.0.T3-800I-A2-py311-openeuler24.03-lts

二、安裝驅動固件

2.1、創建運行用戶和所屬組

groupadd HwHiAiUser
useradd -g HwHiAiUser -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash

2.2、安裝驅動(根據提示選擇是否重啟)

./Ascend-hdk-910b-npu-driver_24.1.rc3_linux-aarch64.run --full --install-for-all

2.3、安裝固件(根據提示選擇是否重啟)

./Ascend-hdk-910b-npu-firmware_7.5.0.1.129.run --full

三、創建容器

docker run -itd --privileged  --name=deepseek-70b --net=host \--shm-size 500g \--device=/dev/davinci0 \--device=/dev/davinci1 \--device=/dev/davinci2 \--device=/dev/davinci3 \--device=/dev/davinci4 \--device=/dev/davinci5 \--device=/dev/davinci6 \--device=/dev/davinci7 \--device=/dev/davinci_manager \--device=/dev/hisi_hdc \--device=/dev/devmm_svm \-v /usr/local/Ascend/driver:/usr/local/Ascend/driver \-v /usr/local/Ascend/firmware:/usr/local/Ascend/firmware \-v /usr/local/sbin/npu-smi:/usr/local/sbin/npu-smi \-v /usr/local/sbin:/usr/local/sbin \-v /etc/hccn.conf:/etc/hccn.conf \-v /data:/data \swr.cn-south-1.myhuaweicloud.com/ascendhub/mindie:2.0.T3-800I-A2-py311-openeuler24.03-lts \bash

四、配置、啟動MindIE服務

4.1、配置環境變量

vim ~/.bashrcsource /usr/local/Ascend/ascend-toolkit/set_env.sh
source /usr/local/Ascend/nnal/atb/set_env.sh
source /usr/local/Ascend/atb-models/set_env.sh
source /usr/local/Ascend/mindie/set_env.sh# 日志打印(默認Error級別)
export MINDIE_LOG_TO_STDOUT=1# 虛擬內存
export PYTORCH_NPU_ALLOC_CONF=expandable_segments:True# ATB WorkSpace 使能
export ATB_WORKSPACE_MEM_ALLOC_ALG_TYPE=3
export ATB_WORKSPACE_MEM_ALLOC_GLOBAL=1 # 單線程加速權重加載
export OMP_NUM_THREADS=1# 設置精度飽和模式,防止fp16引起的上下溢出
export INF_NAN_MODE_ENABLE=0# 關閉確定性計算
export HCCL_DETERMINISTIC=false# 使能AIV,暫時還有問題性問題,不建議線上業務使用,性能復現必須開啟
export HCCL_OP_EXPANSION_MODE="AIV"# 使能內存復用
export ATB_LAYER_INTERNAL_TENSOR_REUSE=1
export ATB_OPERATION_EXECUTE_ASYNC=1
export ATB_CONVERT_NCHW_TO_ND=1
export ATB_WORKSPACE_MEM_ALLOC_GLOBAL=1
export ATB_WORKSPACE_MEM_ALLOC_ALG_TYPE=3
export ATB_CONTEXT_WORKSPACE_SIZE=0
export ATB_LAUNCH_KERNEL_WITH_TILING=1
export ATB_LLM_ENABLE_AUTO_TRANSPOSE=0# CPU親和性調度
export CPU_AFFINITY_CONF=1
export TASK_QUEUE_ENABLE=1
unset ASCEND_LAUNCH_BLOCKING

4.2、配置mindie配置文件

# 修改MindIE配置文件
cd /usr/local/Ascend/mindie/latest/mindie-service/
vim conf/config.json

?修改點標紅項:

{
? ? "Version" : "1.0.0",
? ? "LogConfig" :
? ? {
? ? ? ? "logLevel" : "Info",
? ? ? ? "logFileSize" : 20,
? ? ? ? "logFileNum" : 20,
? ? ? ? "logPath" : "logs/mindie-server.log"
? ? },

? ? "ServerConfig" :
? ? {
? ? ? ? "ipAddress" : "0.0.0.0",
? ? ? ? "managementIpAddress" : "127.0.0.2",
? ? ? ? "port" : 1025,
? ? ? ? "managementPort" : 1026,
? ? ? ? "metricsPort" : 1027,
? ? ? ? "allowAllZeroIpListening" : true,
? ? ? ? "maxLinkNum" : 1000,
? ? ? ? "httpsEnabled" : false,
? ? ? ? "fullTextEnabled" : false,
? ? ? ? "tlsCaPath" : "security/ca/",
? ? ? ? "tlsCaFile" : ["ca.pem"],
? ? ? ? "tlsCert" : "security/certs/server.pem",
? ? ? ? "tlsPk" : "security/keys/server.key.pem",
? ? ? ? "tlsPkPwd" : "security/pass/key_pwd.txt",
? ? ? ? "tlsCrlPath" : "security/certs/",
? ? ? ? "tlsCrlFiles" : ["server_crl.pem"],
? ? ? ? "managementTlsCaFile" : ["management_ca.pem"],
? ? ? ? "managementTlsCert" : "security/certs/management/server.pem",
? ? ? ? "managementTlsPk" : "security/keys/management/server.key.pem",
? ? ? ? "managementTlsPkPwd" : "security/pass/management/key_pwd.txt",
? ? ? ? "managementTlsCrlPath" : "security/management/certs/",
? ? ? ? "managementTlsCrlFiles" : ["server_crl.pem"],
? ? ? ? "kmcKsfMaster" : "tools/pmt/master/ksfa",
? ? ? ? "kmcKsfStandby" : "tools/pmt/standby/ksfb",
? ? ? ? "inferMode" : "standard",
? ? ? ? "interCommTLSEnabled" : false,
? ? ? ? "interCommPort" : 1121,
? ? ? ? "interCommTlsCaPath" : "security/grpc/ca/",
? ? ? ? "interCommTlsCaFiles" : ["ca.pem"],
? ? ? ? "interCommTlsCert" : "security/grpc/certs/server.pem",
? ? ? ? "interCommPk" : "security/grpc/keys/server.key.pem",
? ? ? ? "interCommPkPwd" : "security/grpc/pass/key_pwd.txt",
? ? ? ? "interCommTlsCrlPath" : "security/grpc/certs/",
? ? ? ? "interCommTlsCrlFiles" : ["server_crl.pem"],
? ? ? ? "openAiSupport" : "vllm"
? ? },

? ? "BackendConfig" : {
? ? ? ? "backendName" : "mindieservice_llm_engine",
? ? ? ? "modelInstanceNumber" : 1,
? ? ? ? "npuDeviceIds" : [[0,1,2,3,4,5,6,7]],
? ? ? ? "tokenizerProcessNumber" : 8,
? ? ? ? "multiNodesInferEnabled" : false,
? ? ? ? "multiNodesInferPort" : 1120,
? ? ? ? "interNodeTLSEnabled" : false,
? ? ? ? "interNodeTlsCaPath" : "security/grpc/ca/",
? ? ? ? "interNodeTlsCaFiles" : ["ca.pem"],
? ? ? ? "interNodeTlsCert" : "security/grpc/certs/server.pem",
? ? ? ? "interNodeTlsPk" : "security/grpc/keys/server.key.pem",
? ? ? ? "interNodeTlsPkPwd" : "security/grpc/pass/mindie_server_key_pwd.txt",
? ? ? ? "interNodeTlsCrlPath" : "security/grpc/certs/",
? ? ? ? "interNodeTlsCrlFiles" : ["server_crl.pem"],
? ? ? ? "interNodeKmcKsfMaster" : "tools/pmt/master/ksfa",
? ? ? ? "interNodeKmcKsfStandby" : "tools/pmt/standby/ksfb",
? ? ? ? "ModelDeployConfig" :
? ? ? ? {
? ? ? ? ? ? "maxSeqLen" : 2560,
? ? ? ? ? ? "maxInputTokenLen" : 2048,
? ? ? ? ? ? "truncation" : false,
? ? ? ? ? ? "ModelConfig" : [
? ? ? ? ? ? ? ? {
? ? ? ? ? ? ? ? ? ? "modelInstanceType" : "Standard",
? ? ? ? ? ? ? ? ? ? "modelName" : "deepseek-70b",
? ? ? ? ? ? ? ? ? ? "modelWeightPath" : "/data/70b",
? ? ? ? ? ? ? ? ? ? "worldSize" : 8,
? ? ? ? ? ? ? ? ? ? "cpuMemSize" : 5,
? ? ? ? ? ? ? ? ? ? "npuMemSize" : -1,
? ? ? ? ? ? ? ? ? ? "backendType" : "atb",
? ? ? ? ? ? ? ? ? ? "trustRemoteCode" : false
? ? ? ? ? ? ? ? }
? ? ? ? ? ? ]
? ? ? ? },

? ? ? ? "ScheduleConfig" :
? ? ? ? {
? ? ? ? ? ? "templateType" : "Standard",
? ? ? ? ? ? "templateName" : "Standard_LLM",
? ? ? ? ? ? "cacheBlockSize" : 128,

? ? ? ? ? ? "maxPrefillBatchSize" : 50,
? ? ? ? ? ? "maxPrefillTokens" : 8192,
? ? ? ? ? ? "prefillTimeMsPerReq" : 150,
? ? ? ? ? ? "prefillPolicyType" : 0,

? ? ? ? ? ? "decodeTimeMsPerReq" : 50,
? ? ? ? ? ? "decodePolicyType" : 0,

? ? ? ? ? ? "maxBatchSize" : 200,
? ? ? ? ? ? "maxIterTimes" : 512,
? ? ? ? ? ? "maxPreemptCount" : 0,
? ? ? ? ? ? "supportSelectBatch" : false,
? ? ? ? ? ? "maxQueueDelayMicroseconds" : 5000
? ? ? ? }
? ? }
}

# 設置權重的配置文件的權限
chmod 750 {/path-to-weights/config.json}# 拉起服務
nohup ./bin/mindieservice_daemon > output.log 2>&1 &# 停止服務
ps -ef | grep mindieservice
pkill -9 mindieservice

五、測試

curl http://IP:1025/v1/chat/completions -d '{"model": "改為mindie配置文件中設置的名稱","messages": [{"role": "user", "content": "請告訴我關于人工智能的一些信息。"}],"stream": true}'

六、部署open-webui

# 修改點:
# OPENAI_API_BASE_URLS:改為自己的推理服務接口IP
# /data/open-webui:open-webui的數據存儲目錄docker run -itd --name open-webui \
--net host \
-e PORT=3006 \
-e OPENAI_API_BASE_URLS=http://192.168.50.1:1025/v1 \
-v /data/open-webui:/app/backend/data \
022ecf5a33b8 bash

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/77541.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/77541.shtml
英文地址,請注明出處:http://en.pswp.cn/web/77541.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

NLP預處理:如何 處理表情符號

一、說明 本系列文總結了在NLP處理中,進行文本預處理的一些內容、步驟、處理工具包應用。本篇專門談論網上文章表情符號處理,對于初學者具有深刻學習和實驗指導意義。 二、介紹 表情符號已成為現代交流不可或缺的一部分,尤其是在社交媒體、…

C++/SDL 進階游戲開發 —— 雙人塔防(代號:村莊保衛戰 14)

🎁個人主頁:工藤新一 🔍系列專欄:C面向對象(類和對象篇) 🌟心中的天空之城,終會照亮我前方的路 🎉歡迎大家點贊👍評論📝收藏?文章 文章目錄 二…

解鎖空間數據新質生產力暨:AI(DeepSeek、ChatGPT)、Python、ArcGIS Pro多技術融合下的空間數據分析、建模與科研繪圖及論文寫作

人工智能(AI)與ArcGIS Pro的結合,為空間數據處理和分析開辟了前所未有的創新路徑。AI通過強大的數據挖掘、深度學習及自動化能力,可高效處理海量、多源、異構的空間數據,極大提升了分析效率與決策支持能力。而ArcGIS P…

18.2.go語言redis中使用lua腳本

在 Redis 中使用 Lua 腳本可以實現原子性操作、減少網絡開銷以及提高執行效率。 Redis 執行 Lua 腳本的原理 Redis 內置了 Lua 解釋器,能夠直接在服務器端執行 Lua 腳本。當執行 Lua 腳本時,Redis 會將腳本作為一個整體執行,保證腳本執行期…

?Unity_Demolition Media Hap (播放Hap格式視頻 超16K大分辨率視頻 流暢播放以及幀同步解決方案)

播放大分辨率視頻以及實現局域網視頻同步是許多開發者會遇到的需求,AVPro有一個 Ultra Edition版本,也能播放Hap格式視頻,之外就是Demolition Media Hap插件啦,實測即使是 7208*3808 大分辨率的視頻幀率還是能穩定在30幀,它能幫助我們輕松解決這些問題??。 一、插件概述 …

AI大模型知識與醫療項目實踐 - Java架構師面試實戰

AI大模型知識與醫療項目實踐 - Java架構師面試實戰 本文模擬了一場互聯網大廠的Java架構師面試,圍繞AI大模型知識、工具以及其在醫療項目中的實踐和趨勢展開討論。 第一輪提問 面試官: 馬架構,請您介紹一下AI大模型的基本概念及其在醫療領…

Windows 的文件系統不區分大小寫,Linux區分

在 Windows 系統中,文件系統默認是不區分大小寫的。這意味著在 Windows 上,文件名 ui_BalanceMeasureScreenUI.h 和 ui_balancemeasurescreenui.h 被視為同一個文件。因此,即使你在代碼中使用了不同的大小寫方式來引用同一個文件,…

Unity 資源合理性檢測

一:表格過度配置,表格資源是否在工程中存在,并輸出不存在的資源 import pandas as pd import glob import osassets [] count 0# 遍歷configs文件夾下所有xlsx文件 for file_path in glob.glob(configs/*.xlsx):count 1try:sheets pd.re…

Python爬蟲實戰:獲取高考資源網各學科精品復習資料

一、引言 高考資源網擁有豐富的高考復習資料,對于我們而言,獲取這些資源并整理分享能為考生提供有價值的幫助。然而,手動從網站查找和下載資源效率低且易出錯。利用 Python 爬蟲技術可實現自動化資源獲取,提高工作效率。但在爬取過程中,需考慮網站反爬機制,采取相應措施…

DuckDB:現代數據分析的“SQLite“內核革命

在數據工程、數據科學快速演進的今天,一個新的名字正在快速躥紅:DuckDB。 有人稱它是數據分析領域的SQLite,也有人稱它為下一代輕量級OLAP引擎。 無論哪種稱呼,都離不開一個事實: DuckDB 重新定義了小型數據倉庫和本地…

GIS開發筆記(16)解決基于osg和osgearth三維地圖上添加placeNode圖標點擊不易拾取的問題

一、實現效果 二、實現原理 在圖標添加的位置同時添加一個紅色圓球,半徑為5000~8000米,圖標和圓球掛接到同一個group節點,group節點再掛接到根節點,當點擊到圓球時,通過遍歷父節點就可以找到被點擊的圖標節點。 三、參考代碼 //添加圖標代碼 #pragma once #include &…

計算機網絡學習筆記 1-3章

第 1 章 計算機網絡體系結構 【考綱內容】 (一)計算機網絡概述 計算機網絡的概念、組成與功能;計算機網絡的分類; 計算機網絡的性能指標 (二)計算機網絡體系結構與參考模型 計算機網絡分層結構&#xff…

基于NVIDIA RTX 4090的COLMAP 3.7安裝指南:Ubuntu 20.04 + CUDA 11.8環境配置【2025最新版!!】

一、引言 三維重建技術作為計算機視覺領域的核心方向,在數字孿生、自動駕駛等領域具有重要應用價值。COLMAP作為開源的SfM(Structure-from-Motion)工具,其GPU加速特性可顯著提升重建效率。由于最新研究三維重建的需要&#xff08…

Spring Boot 依賴管理: `spring-boot-starter-parent` 與 `spring-boot-dependencies`

前言 在 Spring Boot 的開發實踐中,依賴管理是構建高質量應用的基礎。spring-boot-starter-parent 和 spring-boot-dependencies 是 Spring Boot 提供的兩大核心依賴管理工具,它們在簡化依賴版本控制、統一配置等方面發揮著關鍵作用。 一、核心概念解析…

【MySQL】基本查詢

目錄 增加 查詢 基本查詢 where子句 結果排序 篩選分頁結果 修改(更新) 刪除 普通刪除 截斷表 插入查詢結果 聚合函數 分組查詢 這一節的內容是對表內容的增刪查改,其中重點是表的查詢 增加 語法: INSERT [INTO] table_name [(column [, …

【C++詳解】C++入門(二)引用、內聯函數、nullptr宏

文章目錄 一、引用引用的概念和定義引用的功能引用的特性const引用const用法回顧權限的放大縮小const引用的功能 指針和引用的關系 二、內聯函數三、nullptr補充結構體指針變量類型重定義 一、引用 引用的概念和定義 C祖師爺為了優化在部分場景中使用指針會出現的效率較低和比…

畢業設計-基于深度學習的實時網絡入侵檢測系統

項目技術說明 深度學習實時網絡入侵檢測系統是一種利用深度學習技術對網絡流量進行實時分析,以識別和阻止潛在網絡攻擊的安全解決方案。相比傳統基于規則的入侵檢測系統(IDS),這種系統能夠通過學習網絡流量的正常模式和異常模式,更有效地檢測…

中藥企業數字化轉型:從傳統制造到智能制藥的跨越

在當今數字化浪潮下,中藥企業正積極擁抱變革,努力實現從傳統制造向智能制藥的跨越,以適應市場競爭和滿足人們對中藥質量與效率的更高要求。 在原料管理環節,企業通過采用物聯網技術,對中藥材種植、采集過程進行全程監…

Vue 2 的響應式 API 和 Vue 3 的組合式 API 的詳細對比,從核心機制、使用方式、代碼示例及優缺點展開

以下是 Vue 2 的響應式 API 和 Vue 3 的組合式 API 的詳細對比,從核心機制、使用方式、代碼示例及優缺點展開: 1. Vue 2 的響應式 API 核心機制 基于 Object.defineProperty: 通過劫持對象的 getter 和 setter 實現數據變化追蹤。限制&…

“八股訓練營”學習總結

在參加為期 40 天的八股訓練營的這段時間里,我收獲滿滿,不僅在知識技能上得到了提升,更在學習習慣和自我認知方面有了很大的進步。 在知識層面,訓練營涵蓋了網絡、數據庫、緩存以及python測試開發等多方面的知識點。 網絡方面&a…