華為昇騰920b服務器部署DeepSeek翻車現場

最近到禍一臺HUAWEI Kunpeng 920 5250,先看看配置。之前是部署的訊飛大模型,發現資源利用率太低了。把5臺減少到3臺,就出了他

硬件配置信息

基本硬件信息

按照慣例先來看看配置。一共3塊盤,500G的系統盤,+ 2塊3T固態,后面把固態硬盤也組合成了邏輯卷

內存是1.5T的,比我電腦硬盤都大

[root@localhost ~]# lsblk
NAME                    MAJ:MIN RM   SIZE RO TYPE MOUNTPOINTS
sda                       8:0    0 446.6G  0 disk 
├─sda1                    8:1    0   600M  0 part /boot/efi
├─sda2                    8:2    0     1G  0 part /boot
└─sda3                    8:3    0   445G  0 part ├─openeuler-root      253:0    0    70G  0 lvm  /├─openeuler-swap      253:1    0     4G  0 lvm  [SWAP]└─openeuler-home      253:2    0   371G  0 lvm  /home
nvme1n1                 259:0    0   2.9T  0 disk 
└─nvme1n1p1             259:4    0   2.9T  0 part └─vg_data01-lv_data01 253:3    0   5.8T  0 lvm  /data
nvme0n1                 259:1    0   2.9T  0 disk 
└─nvme0n1p1             259:3    0   2.9T  0 part └─vg_data01-lv_data01 253:3    0   5.8T  0 lvm  /data[root@localhost ~]# df -Th | awk '$2 !~ /overlay/ && $2 !~ /tmpfs/'
文件系統                        類型      容量  已用  可用 已用% 掛載點
/dev/mapper/openeuler-root      ext4       69G   45G   21G   69% /
/dev/sda2                       ext4      974M   72M  835M    8% /boot
/dev/sda1                       vfat      599M  5.8M  594M    1% /boot/efi
/dev/mapper/openeuler-home      ext4      365G  4.6G  342G    2% /home
/dev/mapper/vg_data01-lv_data01 ext4      5.8T  4.3T  1.3T   78% /data
[root@localhost ~]# cat /etc/os-release 
NAME="openEuler"
VERSION="22.03 LTS"
ID="openEuler"
VERSION_ID="22.03"
PRETTY_NAME="openEuler 22.03 LTS"
ANSI_COLOR="0;31"[root@localhost ~]# uname -a
Linux localhost.localdomain 5.10.0-60.18.0.50.oe2203.aarch64 #1 SMP Wed Mar 30 02:43:08 UTC 2022 aarch64 aarch64 aarch64 GNU/Linux
[root@localhost ~]# lscpu
架構:               aarch64CPU 運行模式:     64-bit字節序:           Little Endian
CPU:                 192在線 CPU 列表:    0-191
廠商 ID:            HiSiliconBIOS Vendor ID:    HiSilicon型號名稱:         Kunpeng-920BIOS Model name: HUAWEI Kunpeng 920 5250型號:           0每個核的線程數: 1每個座的核數:   48座:             4步進:           0x1Frequency boost: disabledCPU 最大 MHz:   2600.0000CPU 最小 MHz:   200.0000BogoMIPS:       200.00標記:           fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm jscvt fcma dcpop asimddp asimdfhm ssbs
Caches (sum of all): L1d:               12 MiB (192 instances)L1i:               12 MiB (192 instances)L2:                96 MiB (192 instances)L3:                192 MiB (8 instances)
NUMA:                NUMA 節點:        8NUMA 節點0 CPU:   0-23NUMA 節點1 CPU:   24-47NUMA 節點2 CPU:   48-71NUMA 節點3 CPU:   72-95NUMA 節點4 CPU:   96-119NUMA 節點5 CPU:   120-143NUMA 節點6 CPU:   144-167NUMA 節點7 CPU:   168-191
Vulnerabilities:     Itlb multihit:     Not affectedL1tf:              Not affectedMds:               Not affectedMeltdown:          Not affectedSpec store bypass: Mitigation; Speculative Store Bypass disabled via prctlSpectre v1:        Mitigation; __user pointer sanitizationSpectre v2:        Not affectedSrbds:             Not affectedTsx async abort:   Not affected
[root@localhost ~]# free -htotal        used        free      shared  buff/cache   available
Mem:           1.5Ti        12Gi        26Gi        20Mi       1.4Ti       1.5Ti
Swap:          4.0Gi        12Mi       4.0Gi
NPU/GPU信息

由于沒有部署任何AI、模型,所以空載著

[root@localhost ~]# npu-smi info
+------------------------------------------------------------------------------------------------+
| npu-smi 24.1.rc1                 Version: 24.1.rc1                                             |
+---------------------------+---------------+----------------------------------------------------+
| NPU   Name                | Health        | Power(W)    Temp(C)           Hugepages-Usage(page)|
| Chip                      | Bus-Id        | AICore(%)   Memory-Usage(MB)  HBM-Usage(MB)        |
+===========================+===============+====================================================+
| 0     910B3               | OK            | 89.7        35                0    / 0             |
| 0                         | 0000:C1:00.0  | 0           0    / 0          3159 / 65536         |
+===========================+===============+====================================================+
| 1     910B3               | OK            | 88.6        38                0    / 0             |
| 0                         | 0000:C2:00.0  | 0           0    / 0          3159 / 65536         |
+===========================+===============+====================================================+
| 2     910B3               | OK            | 91.8        36                0    / 0             |
| 0                         | 0000:81:00.0  | 0           0    / 0          3159 / 65536         |
+===========================+===============+====================================================+
| 3     910B3               | OK            | 87.2        36                0    / 0             |
| 0                         | 0000:82:00.0  | 0           0    / 0          3159 / 65536         |
+===========================+===============+====================================================+
| 4     910B3               | OK            | 88.8        41                0    / 0             |
| 0                         | 0000:01:00.0  | 0           0    / 0          3159 / 65536         |
+===========================+===============+====================================================+
| 5     910B3               | OK            | 95.7        44                0    / 0             |
| 0                         | 0000:02:00.0  | 0           0    / 0          3159 / 65536         |
+===========================+===============+====================================================+
| 6     910B3               | OK            | 93.5        39                0    / 0             |
| 0                         | 0000:41:00.0  | 0           0    / 0          3160 / 65536         |
+===========================+===============+====================================================+
| 7     910B3               | OK            | 89.2        40                0    / 0             |
| 0                         | 0000:42:00.0  | 0           0    / 0          3160 / 65536         |
+===========================+===============+====================================================+
+---------------------------+---------------+----------------------------------------------------+
| NPU     Chip              | Process id    | Process name             | Process memory(MB)      |
+===========================+===============+====================================================+
| No running processes found in NPU 0                                                            |
+===========================+===============+====================================================+
| No running processes found in NPU 1                                                            |
+===========================+===============+====================================================+
| No running processes found in NPU 2                                                            |
+===========================+===============+====================================================+

開始部署DeepSeek

ollama方法

根據網上資料看,只要用ollama部署就行,后面發現這個行不通。因為ollama只適配了英偉達的GPU,像華為的根本就行不通啊,

ollama的安裝腳本也是去下載英偉達的驅動,結果就是下載失敗,就算下載成功了也不能安裝上去

https://zhuanlan.zhihu.com/p/22081569918

0

最后折騰了很久

使用 nohup ollama run

部署一個1.5B的試試,發現可以運行了。但是總覺得不對境。回答問題太慢了,用時3分鐘。CPU使用率也是狂飆。NPU是一點沒有使上勁啊

ollama run deepseek-r1:1.5b

在這里插入圖片描述

容器部署方法

最后決定下載權重+容器部署。結果這里就有遇到了坑點

需要用到git lfs 工具 和 華為的鏡像。因為這是ARM服務器,所有git lfs命令也很難找,歐拉的yum源還沒有提供,最后翻來覆去在github最新的V3.6.1找到了。使用二進制命令接安裝腳本既可以實現。這樣就能通過git install ,git push 去拉取近1TB的權重了

https://github.com/git-lfs/git-lfs/releases

在這里插入圖片描述

在這里插入圖片描述

再說說這個華為的鏡像吧,不得不吐槽。華為這是把鏡像當寶貝供著嗎,下載還需要申請權限,不是一般人還申請不下來。還好我們這里條件都滿足

晚上提交的申請,第二天早上就通過了

在這里插入圖片描述

最后參照了好幾個教程,不是啟動失敗,就吃出現權限拒絕,服了

華為服務器社區:https://www.hiascend.com/software/modelzoo/models/detail/68457b8a51324310aad9a0f55c3e56e3

天翼云社區: https://www.ctyun.cn/document/10027724/10944583

在這里插入圖片描述在這里插入圖片描述

部署R1模型提示不兼容…

天翼云社區: https://www.ctyun.cn/document/10027724/10944583

在這里插入圖片描述

[外鏈圖片轉存中…(img-LlsPC4Gm-1739689559814)]

部署R1模型提示不兼容…

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/70142.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/70142.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/70142.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python的那些事第二十三篇:Express(Node.js)與 Python:一場跨語言的浪漫邂逅

摘要 在當今的編程世界里,Node.js 和 Python 像是兩個性格迥異的超級英雄,一個以速度和靈活性著稱,另一個則以強大和優雅聞名。本文將探討如何通過 Express 框架將 Node.js 和 Python 結合起來,打造出一個高效、有趣的 Web 應用。我們將通過一系列幽默風趣的實例和表格,展…

Word中接入大模型教程

前言 為什么要在word中接入大模型呢? 個人覺得最大的意義就是不用來回切換與復制粘貼了吧。 今天分享一下昨天實踐的在word中接入大模型的教程。 在word中接入大模型最簡單的方式就是使用vba。 vba代碼要做的事,拆分一下就是: 獲取用戶…

open3d繪制平面

在Open3D中繪制平面通常涉及到創建一個平面模型并將其可視化。Open3D是一個開源庫,主要用于3D數據的處理和可視化,但它主要用于3D數據的處理,并不直接支持繪制2D平面。如果你想在Open3D中“繪制”一個平面,你可以通過以下幾種方法來實現類似的效果: 方法1:使用o3d.geome…

DeepSeek R1 與 OpenAI O1:機器學習模型的巔峰對決

我的個人主頁 我的專欄:人工智能領域、java-數據結構、Javase、C語言,希望能幫助到大家!!!點贊👍收藏? 一、引言 在機器學習的廣袤天地中,大型語言模型(LLM)無疑是最…

WebGPU頂點插槽進階優化指南:釋放GPU渲染性能

本文基于WebGPU官方規范與實踐經驗,深入探討頂點緩沖區的性能優化策略,涵蓋數據布局、資源管理、渲染流程等多個維度,并附詳細代碼注釋與性能對比分析。 一、數據布局優化:降低內存與帶寬壓力 1. 內存對齊策略 GPU對內存訪問有嚴…

數據結構實現順序表的尾插,尾刪,按值查找/修改/刪除,按下標查找/增加/刪除

頭文件&#xff1a;head.h #ifndef __HEAD_H__ #define __HEAD_H__#include <stdio.h> #include <string.h> #include <stdlib.h> #define MAXSIZE 20enum num {success,false-1};typedef int datatype;typedef struct {int len;datatype data[MAXSIZE]; }S…

基于Spring Boot+Vue的寵物服務管理系統(源碼+文檔)

項目簡介 寵物服務管理系統實現了以下功能&#xff1a; 基于Spring BootVue的寵物服務管理系統的主要使用者分為用戶管理模塊&#xff0c;由于系統運行在互聯網絡中&#xff0c;一些游客或者病毒惡意進行注冊&#xff0c;產生大量的垃圾用戶信息&#xff0c;管理員可以對這些…

2. grafana插件安裝并接入zabbix

一、在線安裝 如果不指定安裝位置&#xff0c;則默認安裝位置為/var/lib/grafana/plugins 插件安裝完成之后需要重啟grafana 命令在上一篇講到過 //查看相關幫助 [rootlocalhost ~]# grafana-cli plugins --help //從列舉中的插件過濾zabbix插件 [rootlocalhost ~]# grafana…

【Linux】Ubuntu Linux 系統——Python集成開發環境

??大家好&#xff0c;我是練小杰&#xff0c;今天周四了&#xff0c;明天就周五了&#xff0c;再堅持堅持又能休息了&#xff01;&#xff01;&#x1f606; 本文是有關Linux 操作系統中Python集成開發環境基礎知識&#xff0c;后續將添加更多相關知識噢&#xff0c;謝謝各位…

DeepSeek+即夢 做AI視頻

DeepSeek做AI視頻 制作流程第一步&#xff1a;DeepSeek 生成視頻腳本和分鏡 第二步&#xff1a;生成分鏡圖片繪畫提示詞第三步&#xff1a;生成分鏡圖片第四步&#xff1a;使用可靈 AI 工具&#xff0c;將生成的圖片轉成視頻。第五步&#xff1a;剪映成短視頻 DeepSeek 真的強&…

react傳遞函數與回調函數原理

為什么 React 允許直接傳遞函數&#xff1f; 回調函數核心邏輯 例子&#xff1a;父組件控制 Modal 的顯示與隱藏 // 父組件 (ParentComponent.tsx) import React, { useState } from react; import { Modal, Button } from antd; import ModalContent from ./ModalContent;co…

【Spring AI】基于SpringAI+Vue3+ElementPlus的QA系統實現(前端)

整理不易&#xff0c;請不要吝嗇你的贊和收藏。 1. 前言 這篇文章是 Spring AI Q&A 系統的前端實現。這篇文章將介紹如何快速搭建一個基于 vue3 ElementPlus 的前端項目&#xff0c;vue3 項目的目錄結構介紹&#xff0c;如何在前端實現流式響應&#xff0c;如何高亮顯示…

企業級API集成方案:基于阿里云函數計算調用DeepSeek全解析

解決方案鏈接&#xff1a;https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms?utm_contentg_1000401616 何為DeepSeek R1 DeepSeek R1模型有諸多技術優勢。高效架構設計使其能更高效提取特征&#xff0c;減少冗余計算&#xff0c;提升數據處理速度、…

K8s學習總結

文章目錄 介紹Kubernetes 核心組件k8s安裝環境安裝組件 常用命令測試1. 創建一個測試應用程序2. 檢查 Pod 是否運行 3. 暴露應用讓外部訪問4. 查看服務的暴露端口5. 訪問 nginx 服務6. 驗證節點調度 如有錯誤&#xff0c;敬請指針&#xff0c;謝謝! 介紹 Kubernetes&#xff0…

前端為什么要使用new Promise包裹一個函數

在前端開發中&#xff0c;使用 new Promise 包裹一個函數主要是為了將原本不支持 Promise 規范的操作轉化為支持 Promise 規范的操作&#xff0c;從而可以更好地處理異步操作&#xff0c;提升代碼的可讀性和可維護性。下面詳細介紹這么做的常見原因和應用場景&#xff1a; 1. …

說下JVM中一次完整的GC流程?

大家好&#xff0c;我是鋒哥。今天分享關于【說下JVM中一次完整的GC流程?】面試題。希望對大家有幫助&#xff1b; 說下JVM中一次完整的GC流程? 1000道 互聯網大廠Java工程師 精選面試題-Java資源分享網 JVM中的一次完整的垃圾回收&#xff08;GC&#xff09;流程可以概括為…

dnslog+sqlmap外帶數據

目錄 爆庫 爆表 爆列 爆數據 sqlmapDNSlog 外帶參數 –dns-domain參數注入 –dns-domain參數為dnslog平臺的域名&#xff08;我們也可以使用本地&#xff09; 爆庫 python sqlmap.py -u "http://127.0.0.1/sqli/less-8/index.php/?id1" -techniqueB -dns-dom…

提升顧客轉化率:融合2+1鏈動模式AI智能名片與S2B2C商城小程序的創新策略

摘要&#xff1a;在數字化轉型的背景下&#xff0c;零售商面臨著提升顧客轉化率的巨大挑戰。本文旨在探討如何通過整合顧客行為數據、21鏈動模式、AI智能名片及S2B2C商城小程序等新興技術與商業模式&#xff0c;來精準定位顧客需求&#xff0c;優化營銷策略&#xff0c;從而提高…

以若依移動端版為基礎,實現uniapp的flowable流程管理

1.前言 此代碼是若依移動端版為基礎&#xff0c;實現flowable流程管理&#xff0c;支持H5、APP和微信小程序三端。其中&#xff0c;APP是在安卓在雷電模擬器環境下完成的&#xff0c;其他環境未測試&#xff0c;此文章中所提及的APP均指上述環境。移動端是需要配合若依前后端分…

《全球網絡安全政策法律發展研究報告 (2024) 》

全球視野&#xff0c;深度剖析 報告以全球視野為出發點&#xff0c;深度剖析了2024年各國在網絡安全政策法律方面的最新進展。從局部區域沖突延宕到關鍵信息基礎設施(關基)安全保護規則的持續細化&#xff0c;從數據安全政策立法的蓬勃發展到個人信息保護立法的不斷完善&#…