【AI算力】關于國產算力的一些調研分析

隨著英偉達卡被禁售,國產顯卡市場逐漸崛起。以華為、曙光為第一梯隊代表,壁仞、燧原、寒武紀等為第二梯隊代表,場景覆蓋從圖像識別到大模型訓練、推理,落地領域包括金融、安防、智能汽車、IOT、智能客服等行業

國內主流的GPU提供商:

  • 昆侖芯:昆侖芯(北京)科技有限公司前身為百度智能芯片及架構部,于2021年4月完成獨立融資,首輪估值約130億元。是國內最早布局AI加速領域,深耕10余年,是一家在體系結構、芯片實現、軟件系統和場景應用均有深厚積累的AI芯片企業。
  • 壁仞科技:壁仞科技創立于 2019 年,在 GPU、DSA(專用加速器)和計算機體系結構等領域具有深厚的技術積累。公司致力于開發原創性的通用計算體系,建立高效的軟硬件平臺,同時在智能計算領域提供一體化的解決方案。
  • 燧原科技:燧原科技是一家專注于人工智能領域云端算力平臺的創業公司,致力為人工智能產業發展提供普惠的基礎設施解決方案,提供自主知識產權的高算力、高能效比、可編程的通用人工智能訓練和推理產品。其創新性架構、互聯方案和分布式計算及編程平臺,可廣泛應用于云數據中心、超算中心、互聯網、金融及智慧城市等多個人工智能場景。燧原科技是國內第一家同時擁有高性能云端訓練和云端推理產品的創業公司,同時也是國內第一個發布第二代人工智能訓練產品組合的公司。燧原科技自成立以來,已完成多輪融資,并發布了多款人工智能訓練和推理產品。
  • 海光:海光DCU(Data Center Unit)系列產品以GPGPU(通用并行計算圖形處理器)架構為基礎,兼容通用的“類CUDA”環境。該系列產品可廣泛應用于大數據處理、人工智能、商業計算等應用領域。海光DCU產品能適配、適應國際主流商業計算軟件和人工智能軟件,是國內具有全精度浮點數據和各種常見整型數據計算能力的GPGPU產品。其采用“類CUDA”通用并行計算架構,可廣泛應用于電信、金融、互聯網、教育、交通等重要行業或領域。
  • 寒武紀:寒武紀公司是一家專注于人工智能芯片領域的科技企業,成立于2016年。該公司的主要業務是設計、生產基于人工智能芯片的處理器,以及提供基于這些芯片的解決方案。這些芯片可以應用于各種需要人工智能處理能力的領域,如云計算、智能家居、智能安防等。
  • 華為昇騰:目前提供包括推理卡與訓練卡,訓練卡主要包括910A和910B,910A性能接入A10910B目前性能接近A800的80%,但生態有待完善

國內GPU廠商產品及參數

品牌昆侖芯壁仞科技?燧原科技?海光寒武紀華為海思?
產品R200BR100?i20?深算一號MLU370-X8昇騰910?
發布日期20212022?2021?202120222018?
半精度(FP16)128 TFLOPSNA?128 TFLOPS?NA96 TFLOPS?320 TFLOPS?
單精度(FP32)32 TFLOPS256 TFLOPS?32 TFLOPS?NA24 TFLOPS?NA?
雙精度(FP64)NANA?NA??? 10.8 TFLOPSNA?NA?
INT8256 TOPS2048 TOPS?256 TOPS???? NA256 TOPS640 TOPS?
CUDA兼容NA是?否?NA否?NA?

海外GPU廠商產品及參數:

品牌AMD?AMDNVIDIANVIDIANVIDIANVIDIANVIDIA
產品INSTINCT MI100??INSTINCT M1250?P100V100 SXM2T4A100 80GBH100 PCle?
發布日期2020202120162017201820202022
工藝7nm6nm16nm12nm12nm7nm4nm
半精度(FP16)184.6 TFLOPS362.1 TFLOPS21.2 TFLOPS125 TFLOPS65 TFLOPS312 TFLOPSNA
半精度(FP16 Tensor Core)NANA不支持不支持不支持不支持1600 TFLOPS*
單精度(FP32)?23.1 TFLOPS?45.3 TFLOPS10.6 TFLOPS15.7 TFLOPSNA19.5 TFLOPS48 TFLOPS
單精度(FP32 Tensor Float)46.1 TFLOPS(AMD為Matrix Core)?90.5 TFLOPS (AMD為Matrix Core)不支持不支持不支持156 TFLOPS800 TFLOPS
雙精度(FP64)?11.5 TFLOPS45.3 TFLOPS5.3 TFLOPS7.8 TFLOPS8.1 TFLOPS9.7 TFLOPS24TFLOPS
雙精度(FP64 Tensor Core)不支持90.5 TFLOPS (AMD為Matrix Core)?不支持不支持不支持19.5 TFLOPS48 TFLOPS?
INT8184.6 TOPs362.1 TOPsNANA130TOPs624TOPsNA
INT8(Tensor Core)不支持NA不支持不支持不支持不支持3200TOPs
CUDA兼容否?否?

國內外GPU卡的主要差距

1. 技術差距:國外GPU卡在技術研發方面領先,擁有較高的計算性能和能效比。而國內GPU卡在技術研發方面相對滯后,與國外產品存在一定的性能差距。

2. 編程軟件:主要是CUDA、Pytorch相關的軟件完善度不夠,需要一個比較長的時間來積累

3. 用戶生態:包括集成商生態,用戶生態,軟件生態、人才生態、行業生態、場景生態等需要完善

為了縮小國內外GPU卡的差距,國內企業需要加強自主研發和創新,提高技術研發能力;同時,需要加強生態系統建設,完善硬件、軟件、開發工具w和應用場景等方面的布局;還需要加強市場推廣和品牌建設,提高市場競爭力和影響力。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/215095.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/215095.shtml
英文地址,請注明出處:http://en.pswp.cn/news/215095.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

深度學習 Day15——P4猴痘病識別

🍨 本文為🔗365天深度學習訓練營 中的學習記錄博客🍖 原作者:K同學啊 | 接輔導、項目定制 文章目錄 前言1 我的環境2 代碼實現與執行結果2.1 前期準備2.1.1 引入庫2.1.2 設置GPU(如果設備上支持GPU就使用GPU,否則使用C…

前端食堂技術周刊第 108 期:StyleX 開源、Astro 4.0、Vitest v1、URL 設計最佳實踐、INP

美味值:🌟🌟🌟🌟🌟 口味:大紅袍鮮奶茶 食堂技術周刊倉庫地址:https://github.com/Geekhyt/weekly 大家好,我是童歐巴。歡迎來到前端食堂技術周刊,我們先來…

廟算兵棋推演平臺配置

9月23開始,9月26完成。因為那時剛從大連回來,十一之后又一個緊急項目當項目負責人,所以隔了這么久才發出來。 我嘗試進行制作平臺AI,想在我的小平板上配好,最好還可以移植。于是我采用WSL(windows自帶的do…

VSCode中如何查看EDI報文?

VSCode是開發人員常用的一款軟件,為了降低EDI報文的閱讀門檻,知行的開發人員設計了EDI插件,可以在VSCode中下載使用。 如何打開一個EDI報文——VSCode EDI插件介紹 EDI插件下載流程 進入VSCode,打開Extensions,在搜索…

在Ubuntu K8s中創建vnc用于瀏覽器調試

拉取vnc鏡像: ctr -n k8s.io image pull docker.io/dorowu/ubuntu-desktop-lxde-vnc:latest --platform:linux/amd64(導出成鏡像包) ctr -n k8s.io image pull docker.io/dorowu/ubuntu-desktop-lxde-vnc:latest --platform:linux/amd64dep…

Acrobat Pro中不能使用有道詞典取詞翻譯

編輯–>首選項–>安全性(增強–>啟動時啟用保護模式(預覽),取消前面的勾即可

uniapp - 簡單版本自定義tab欄切換

tab切換是APP開發最常見的功能之一,uniapp中提供了多種形式的tab組件供我們使用。對于簡單的頁面而言,使用tabbar組件非常方便快捷,可以快速實現底部導航欄的效果。對于比較復雜的頁面,我們可以使用tab組件自由定義樣式和內容 目錄…

2023年醫療器械行業分析(京東醫療器械運營數據分析):10月銷額增長53%

隨著我國整體實力的增強、國民生活水平的提高、人口老齡化、醫療保障體系不斷完善等因素的驅動,我國的醫療器械市場增長迅速。 根據鯨參謀電商數據分析平臺的相關數據顯示,今年10月份,京東平臺上醫療器械市場的銷量將近1200萬,環比…

什么是rocketmq?

在大規模分布式系統中,各個服務之間的通信是至關重要的,而RocketMQ作為一款分布式消息中間件,為解決這一問題提供了強大的解決方案。本文將深入探討RocketMQ的基本概念、用途,以及在實際分布式系統中的作用,并對Produc…

SU渲染受到電腦性能影響大嗎?如何提高渲染速度

一般3d設計師們在進行設計工作前都需要提供一臺高配電腦,那么你這知道su渲染對電腦要求高嗎?電腦帶不動su怎么解決?su對電腦什么配件要求高?今天這篇文章就詳細為大家帶來電腦硬件對su建模渲染的影響,以及su渲染慢怎么…

Python基礎期末復習 新手 2

雖然age 10在__init__方法中定義了一個局部變量age,但這個局部變量并不會影響類屬性age的值。類屬性是在類級別上定義的,不屬于任何一個實例。因此,在創建實例s1和s2時,它們的age屬性值都為類屬性的初始值0。 盡管對類的屬性值進…

cache教程 5.分布式節點的通信

0.對原教程的一些見解 其回顧完請求流程就是抽象了兩個接口,PeerPicker和PeerGetter。這樣操作,讀者閱讀時可能很難快速明白其含義,不好理解為什么就創建出兩個接口,感覺會比較疑惑。原教程的評論中也有討論這點。 本教程就先不創…

如何寫好PPT報告

寫好PPT的技巧和方法 PPT報告是現代工作和學習中常用的一種形式,它能夠通過圖文并茂的方式將信息傳達給觀眾。然而,很多人在制作PPT報告時并不知道如何下手,容易出現混亂的情況。為了幫助大家寫好PPT報告,下面總結了一些方法和…

Python爬取酷我音樂

🎈 博主:一只程序猿子 🎈 博客主頁:一只程序猿子 博客主頁 🎈 個人介紹:愛好(bushi)編程! 🎈 創作不易:喜歡的話麻煩您點個👍和?! 🎈…

pytest + yaml 框架 -59.用例失敗重跑機制pytest-rerunfailures

前言 有些接口可能不太穩定,第一次跑的時候由于網絡原因或者其它原因失敗,但是重新跑2次又成功了。 對于這種需要重新跑幾次的場景,可以使用用例失敗重跑機制,需安裝pytest-rerunfailures 插件。 場景示例 失敗重跑需要依賴 py…

【Axure原型分享】3D多柱狀圖_中繼器版

今天和大家分享3D多柱狀圖_中繼器版的原型模板,鼠標移入時,對應區域的背景會高亮變色,并且顯示對應柱狀體的數據。那這個原型是用Axure原生元件制作的,樣式交互都可以自行修改,圖表數據在中繼器表格里填寫,…

【二者區別】cuda和cudatoolkit

Pytorch 使用不同版本的 cuda 由于課題的原因,筆者主要通過 Pytorch 框架進行深度學習相關的學習和實驗。在運行和學習網絡上的 Pytorch 應用代碼的過程中,不少項目會標注作者在運行和實驗時所使用的 Pytorch 和 cuda 版本信息。由于 Pytorch 和 cuda 版…

mac安裝elasticsearch8.x

es下載地址: Past Releases of Elastic Stack Software | Elastic https://www.elastic.co/cn/downloads/past-releases#elasticsearch 選擇8.10版本 進入es bin目錄下執行啟動命令 ./elasticsearch 這個時候localhost:9200無法訪問 原因是是因為開啟了ssl認證…

R語言,table()函數實現統計每個元素出現的頻數+并將最終統計頻數結果轉換成dataframe數據框形式

在 R中,要統計dataframe數據框中每個元素出現的頻數,可以使用table()函數。以下是一個示例: 目錄 一、創建數據 二、統計第一列每個元素出現的頻數 三、統計第二列每個元素出現的頻數 四、將頻數結果轉換為數據框,并改列名 一…

Cannot find cache named ‘‘ for Builder Redis

當引入 Redissson 時,springCache 緩存機制失效 原因:springCache 默認使用本地緩存 Redisson 使用redis 緩存 最后都轉成redis了。。。 總感覺哪不對 兩者居然不共存