海光の初體驗

背景

  1. 八張K100的風扇已經將近一年沒轉過了…
  2. 早在今年4月29日,Qwen3正式發布并全部開源8款「混合推理模型」。作為Qwen系列中的最新一代大型語言模型,Qwen3在推理、指令遵循、工具調用、多語言能力等方面進行了全面增強。
  3. 海光DCU(Deep Computing Unit,深度計算單元)是海光信息推出的高端GPGPU架構AI加速卡,致力于為行業客戶提供自主可控的全精度通用AI加速計算解決方案。憑借卓越的算力性能和完備的軟件生態,海光DCU已在科教、金融、醫療、政務、智算中心等多個領域實現規模化應用。

突然

請添加圖片描述

部署

在這里插入圖片描述
拉鏡像

docker pull image.sourcefind.cn:5000/dcu/admin/base/custom:vllm0.8.4-ubuntu22.04-dtk25.04-rc7-das1.5-py3.10-20250429-dev-qwen3-only

起容器

docker run -it   --network=host   --hostname=localhost   --name Qwen3-vllm_test   -v /opt/hyhal:/opt/hyhal:ro   -v $PWD:/workspace   --ipc=host   --device=/dev/kfd   --device=/dev/mkfd   --device=/dev/dri   --shm-size=512G   --privileged   --group-add video   --cap-add=SYS_PTRACE   -u root   --security-opt seccomp=unconfined -v /nfs2:/home/weight  image.sourcefind.cn:5000/dcu/admin/base/custom:vllm0.8.4-ubuntu22.04-dtk25.04-rc7-das1.5-py3.10-20250429-dev-qwen3-only   /bin/bash

裝依賴

pip install -U transformers

起服務

cd workspace
vllm serve /home/weight/Qwen3-32B -tp 4 --enforce-eager

請添加圖片描述

一氣呵成

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/87169.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/87169.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/87169.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

場外交易(OTC)財富管理系統開發及解決方案報告

——跨境金融科技賦能機構客戶新增長 一、OTC市場現狀與機構業務痛點 1. 政策機遇與市場擴容 “北向互換通”期限延長:2025年7月1日,中國外匯交易中心聯合香港交易所將利率互換合約期限延長至30年,首日交易規模達15.3億元,填補超…

pytorch底層原理學習--JIT與torchscript

文章目錄 0 目的1 TorchScript1.1 語言特性的限定性1.2 設計目的:模型表達的專注性 2pytorch JIT(Just-in-time compilation)2.1pytorch JIT定義2.1pytorch JIT整個過程:1. 前端轉換層:生成靜態計算圖2. 中間表示層(IR…

Ubuntu+Nginx+php+SQLite3+typecho手動搭建個人博客

零.Ubuntu環境 一.安裝nginx 使用以下指令進行nginx web服務器安裝: apt-get install nginx 如果提示找不到安裝包,也可以更新一下系統的apt環境包: sudo apt update 安裝完成后,可以使用以下指令查看nginx是否處于激活狀態&#…

網絡協議概念與應用層

1.概念 1.1 例子 點外賣 上述這個過程,就是自定義協議 自定義協議,具體的方式也是非常靈活的 2.幾種開發中更常見的格式 2.1xml 上古時期的組織數據的格式 通過標簽來組織數據 xml的優勢:讓數據的可讀性變得更好了 劣勢:標簽寫起來繁瑣,傳輸的時候也占用更多網絡帶寬 2.2…

pytorch學習—7.處理多維特征的輸入

2. 線性模型 3.梯度下降算法 4.反向傳播(用pytorch算梯度) 5.用pytorch實現線性回歸 6.logistic回歸 7.處理多維特征的輸入_嗶哩嗶哩_bilibili 7.1代碼復現: import numpy as np import torch import matplotlib.pyplot as plt# 1. 獲取數據集 xy_data = np.lo

AI助手“智普清言”《三元》(Python)詩解

文本邏輯解清晰,詩意對應技法輕。 筆記模板由python腳本于2025-07-01 06:54:55創建,本篇筆記適合喜歡python三元語句的coder翻閱。 學習的細節是歡悅的歷程 博客的核心價值:在于輸出思考與經驗,而不僅僅是知識的簡單復述。 Pytho…

本地RAG實戰:用Spring AI+Ollama+DeepSeek+ChromaDB增強文檔問答

本文手把手教你在本地部署RAG系統: 用 Spring AI 整合 Ollama(運行DeepSeek中文模型)ChromaDB 存儲本地文檔(PDF/TXT)向量Java程序實現:文檔解析 → 語義檢索 → 增強生成 最終效果:模型回答更準…

Python 數據分析:DataFrame,生成,用字典創建 DataFrame ,鍵值對數量不一樣怎么辦?

目錄 1 示例代碼2 歡迎糾錯3 論文寫作/Python 學習智能體------以下關于 Markdown 編輯器新的改變功能快捷鍵合理的創建標題,有助于目錄的生成如何改變文本的樣式插入鏈接與圖片如何插入一段漂亮的代碼片生成一個適合你的列表創建一個表格設定內容居中、居左、居右S…

Java 并發編程的 CAS(Compare and Swap)是什么?

CAS(Compare and Swap,比較并交換) 并非 Java 語言特有的概念,而是現代計算機硬件提供的一條核心原子指令。在 Java 并發編程中,它扮演著“幕后英雄”的角色,是構建高性能、無鎖并發工具(如原子…

【UnityAssetBundle】AssetBundle打包

AssetBundle生成AB包資源文件方式: Unity編輯器開發,自定義打包工具;官方提供好的打包工具,Asset Bundle Browser 打包 選擇一個資源,new一個壓縮包名稱或選擇一個壓縮包名稱 點擊Window->AssetBundle Browser&…

Hush Puppies大中華區鞋類業務移交品牌方繼續經營

據悉,隨著百麗集團運營的暇步士(Hush Puppies)大中華區鞋類授權的到期,暇步士(Hush Puppies)鞋類業務已開始運營權移交。其中線上渠道授權于2025年6月30日正式到期,線下渠道將于2025年12月31日前…

解釋LLM怎么預測下一個詞語的

解釋LLM怎么預測下一個詞語的 通過上文詞的向量進行映射 在Transformer架構的大語言模型(如GPT系列、BERT等)中,詞語會先被轉化為詞向量。在預測下一個詞時,模型會基于之前所有詞的向量表示(并非僅僅上一個詞,但上一個詞的向量是重要信息來源之一)進行計算。 以GPT-2…

DAY 49 CBAM注意力

目錄 DAY 49 CBAM注意力1.通道注意力模塊復習2.空間注意力模塊3.CBAM的定義作業:嘗試對今天的模型檢查參數數目,并用tensorboard查看訓練過程 DAY 49 CBAM注意力 1.通道注意力模塊復習 2.空間注意力模塊 3.CBAM的定義 import torch import torch.nn …

【網絡】Linux 內核優化實戰 - net.ipv4.conf.all.rp_filter

目錄 net.ipv4.conf.all.rp_filter 參數詳解一、參數基本概念二、參數取值及含義三、反向路徑過濾的工作原理四、配置示例與注意事項五、與其他參數的關聯六、總結 net.ipv4.conf.all.rp_filter 參數詳解 一、參數基本概念 net.ipv4.conf.all.rp_filter 是 Linux 內核中用于控…

ElementUI el-select多選下拉框,回顯數據后無法重新選擇和修改

問題 ElementUI el-select多選下拉框,回顯數據后無法重新選擇和修改,點擊選擇和刪除都沒有反應,頁面也沒有報錯 方案一 網上搜出來的基本上都是這個解決辦法,但是我設置后沒有生效,還是無法選擇和修改 原因 下拉框數…

計算機視覺的新浪潮:擴散模型(Diffusion Models)技術剖析與應用前景

近年來,擴散模型(Diffusion Models, DMs)迅速崛起,成為計算機視覺領域最令人矚目的生成模型之一。從生成高質量圖像到風格遷移、圖像修復,再到文本驅動圖像生成(如 DALLE 2、Stable Diffusion、Midjourney&…

「Java流程控制」跳轉語句

今天來聊聊Java里的兩個重要跳轉語句——break和continue。它們就像馬路上的交通信號燈,能夠控制程序執行的流向。 break和continue break和continue在循環中的作用,特別像快遞分揀中心的工作場景: break:就像發現一個破損包裹,直接停止當前分揀流程,把它扔進異常品處理…

R1-Searcher使用強化學習增強語言模型解決問題的搜索能力

R1-Searcher:Incentivizing the Search Capability in LLMs via Reinforcement Learning 2025.3 https://github.com/RUCAIBox/R1-Searcher 針對的問題: 現有大型推理模型在時間敏感或知識密集型問題上通常僅使用模型內部知識,導致回答不準…

C++中的虛函數與純虛函數

文章目錄 虛函數 (Virtual Function)純虛函數 (Pure Virtual Function)主要區別實際應用示例 C中的虛函數和純虛函數是實現多態性的重要機制。 虛函數 (Virtual Function) 虛函數是在基類中用virtual關鍵字聲明的函數,它允許派生類重寫(override)該函數的實現。當…

(LeetCode 每日一題) 3330. 找到初始輸入字符串 I (字符串)

題目:3330. 找到初始輸入字符串 I 思路:字符串,時間復雜度0(n)。 默認沒有輸錯的情況ans1,而輸錯的情況,只會出現在連續相等字符串,假設這段字符串長度為ct,那么可能的情況為ct-1。累計這些和到…