中國國產AI芯片的崛起

一、CUDA的壟斷

????????當討論半導體行業面臨的挑戰時,你首先想到的是什么?光刻機?3納米或者5納米技術?我們無法生產的完美方形芯片?是的,但也不完全是。

????????人們經常把半導體芯片歸類為硬件產業,但實際上,半導體芯片是一個硬件和軟件高度融合的產業,而且軟件往往發揮更重要的作用。

????????芯片的硬件是指運行指令的物理平臺,包括處理器、內存、存儲設備等。“晶體管數量”和“7 納米工藝”等與芯片相關的術語就是硬件參數的示例。

????????另一方面,軟件包括固件、驅動程序、操作系統、應用程序、運算符、編譯器、開發工具、模型優化、部署工具和應用程序生態系統等。軟件指導硬件如何響應用戶指令、處理數據和任務,同時通過特定算法和策略優化硬件資源的使用。“x86 指令集”、“深度學習運算符”和“CUDA 平臺”等術語通常與芯片軟件有關。

????????沒有硬件,軟件就無法運行。然而,沒有軟件,硬件只是一堆毫無意義的硅片。

????????2012年,隨著深度學習與GPU的結合在ImageNet大賽上大放異彩,人工智能一夜之間風靡全球,科技界開始將目光聚焦人工智能領域,深耕CUDA人工智能計算平臺的英偉達股價一路飆升,成為新時代的主導力量。

????????然而,軟件將成為人工智能時代的核心技術壁壘。

????????為了打破 Nvidia 的壟斷,前芯片老大英特爾和老對手 AMD 分別推出了 OneAPI 和 ROCm,與 CUDA 展開競爭。Linux 基金會聯合英特爾、谷歌、高通、Arm、三星等公司成立了 UXL 基金會(俗稱“反 CUDA 聯盟”),致力于開發一套新的開源軟件套件,讓 AI 開發者可以在任何成員公司的芯片上進行編程,試圖取代 CUDA 成為首選的 AI 開發平臺。

????????相反,Nvidia 一直在鞏固其 CUDA 護城河。

????????早在 2021 年,Nvidia 就公開表示禁止使用轉換層在其他硬件平臺上運行基于 CUDA 的軟件,并于 2024 年 3 月將此升級為徹底禁止,直接在 CUDA 的最終用戶許可協議中添加條款。

????????對于中國用戶來說,這項禁令的打擊更大。

????????2022年,英偉達被要求停止向中國市場供應高端GPU芯片,有效封鎖了中國的GPU芯片采購渠道。

????????如今其他芯片上運行CUDA軟件也被禁止,中國AI企業該怎么辦?

二、中國國產AI芯片的崛起

????????其實早在禁令頒布之前,中國芯片企業就已做好了準備。2015年,中國人工智能產業蓬勃發展,出現了“人工智能四龍”引領產業發展。

????????在這波因對卷積神經網絡(CNN)的興趣而引發的人工智能浪潮中,中國企業認識到了國產人工智能芯片的重要性。

????????這一時期,中國涌現出近百家AI芯片企業,既有寒武紀、必任科技、厚墨等創業公司,也有華為、阿里巴巴、百度等科技巨頭,以及傳統芯片廠商、挖礦設備廠商。

????????大家都紛紛加入這股潮流,整個行業蓬勃發展,似乎都有一個共同的目標:打造自主可控的國產AI芯片生態。

????????在此推動下,中國AI芯片企業很早就意識到了軟件、工具和生態對于芯片的重要性,因此在不斷升級迭代硬件產品的同時,投入了大量的時間和精力去解決軟件相關的問題。

????????CUDA 是一個封閉的軟件平臺,因此從頭開始構建原始軟件堆棧是突破 CUDA 生態系統障礙的關鍵。

三、中國AI芯片軟件平臺概況

????????中國的AI芯片創業公司在云端、邊緣端領域蓬勃發展,各有千秋。例如,必韌科技開發了BIRENSUPA軟件平臺,包括硬件抽象層、編程模型、BRCC編譯器、深度學習和通用計算加速庫、工具鏈、支持主流深度學習框架、自研推理加速引擎以及適用于各種場景的應用SDK,是國內為數不多的綜合性AI軟件開發平臺之一。

????????此外,專注于云端及車規級AI芯片的寒武紀推出了基礎軟件平臺;專注于集成式智能駕駛芯片的厚墨科技也推出了厚墨大道軟件平臺;專注于全GPU的摩爾線程推出了MUSA SDK及AI軟件平臺;專注于通用GPU(GPGPU)的天數芯推出了天數芯軟件棧。

????????與中國早期白手起家的芯片研究人員不同,當代中國AI芯片玩家大多擁有豐富的行業經驗,并了解類似CUDA的軟件工具對于AI開發人員的關鍵重要性。

????????因此,在2015年至2022年期間,這些玩家努力構建自己的硬件和軟件生態系統。他們設法在國際層面上趕上了一些,盡管他們仍然遠遠落后于像Nvidia這樣的全球巨頭,但Nvidia并沒有閑著,而是利用其在深度學習方面的專業性鞏固了自己的地位。

????????然而誰也沒有想到,新的變革契機這么快就到來了,2022年11月,ChatGPT橫空出世,再一次打破了行業的平衡。

四、大型模型是天賜的機會嗎?

????????2022年11月,隨著ChatGPT在全球引起轟動,大型語言模型(LLM)突然成為全球追捧的前沿技術,熱度遠超CNN。

????????對于一些中國AI芯片制造商來說,這被視為趕上競爭潮流的天賜良機。

????????更加有利的是,LLM的技術基礎是Transformer網絡,其最初有BERT、T5、GPT三條不同的路徑。

????????然而,自從ChatGPT的驚艷亮相后,GPT已經成為了絕對的主流,引領全球AI產業走向統一的認識。

????????在AI技術發展史上,如此程度的團結幾乎是聞所未聞的。

????????CUDA的先發優勢因此而突然縮小。

????????正是因為這種快速的融合,中國AI芯片廠商才得以快速上手對大型模型進行調優和適配,更重??要的是,此時他們已經可以與其他國際廠商在同一起跑線上。

????????目前,在Nvidia嚴禁在其他AI芯片硬件平臺上運行CUDA,加之美國芯片禁令進一步加重、全球算力緊缺的背景下,中國大模型軟件公司難以獲得最前沿的GPU芯片,因此如何將現有的大模型遷移到新的計算平臺上成為首要解決的痛點。

????????鑒于大模型訓練對計算集群的迫切需求,國內AI芯片企業正致力于加強集群能力。以采用GPGPU架構的璧人為例,客戶反饋璧人的SUPA在軟件團隊的支持下,短時間內完成了實際應用遷移,在主流開源大模型上的表現也呈現出良好的效果。

????????如果AI芯片廠商能夠提供簡單易用、低成本的遷移工具,有完善的模型適配能力以及成熟的集群部署經驗,那么大模型的快速落地就變得可行。

????????包括必韌在內的多家中國公司已完成對國內大部分開源大模型的適配,積累了豐富的千卡集群部署經驗,中國大模型合作伙伴自研模型適配時間已大幅縮短。除了幫助用戶快速從CUDA遷移到SUPA生態之外,大型模型公司還可以利用Biren的架構特性和SUPA的能力來擴展CUDA生態,進一步提升性能。

????????通過自下而上的開發,Biren 可以最大限度地發揮其硬件優勢,確保無論硬件到終端應用程序如何變化,其軟件堆棧始終能夠進行優化、迭代和調整。

????????當前,除了芯片層面,大機型軟件、算力、云計算等層面的國產化也在積極推進。

????????AI芯片公司作為整個AI生態的基礎構建者,尋求與大型模型、框架、集群公司進行深度合作,以最大化整體性能。

????????例如,必韌科技不僅與PaddlePaddle等框架開發商合作,不僅滿足企業用戶符合國際標準的開發需求,還專門定制了與國內環境兼容的解決方案,為中國AI企業提供更為順暢的融入之路。

????????同時,必韌還與Infinigence等中國算力優化公司達成合作,進一步高效推動AI計算的本土化發展。

????????為破解生態瓶頸,璧人通過搭建算力平臺、開源相關工具和庫、開放上層模型等方式推進軟件平臺建設,與框架、大模型合作伙伴進行聯合適配優化,建立生態合作,并通過與高校、科研機構、終端客戶等開展產學研合作等多種方式推進落地。

????????軟件無疑是最難突破的一道坎,也是目前各大AI芯片公司的共識重點。通過產學研的共同努力,一定可以取得突破。例如浙江大學的AI教學平臺Mo,就利用比人軟硬件資源作為教學實踐的基礎,為學生提供實踐機會,為國產軟件生態的長遠發展播下種子。

五、結論

????????毫無疑問,算力已成為人工智能時代的戰場,算力的嚴重短缺制約著各國人工智能技術的發展。

????????據報道,OpenAI首席執行官Sam Altman曾表示,“計算能力將成為未來的貨幣”,暗示人工智能的發展將演變為公司、組織甚至國家之間的大規模權力斗爭。

????????目前,Nvidia的GPU硬件憑借CUDA軟件方面的優勢,受到市場熱捧,長期處于供不應求的狀態。而大模型取代深度神經網絡成為新一代AI技術的興起,恰恰給了中國AI芯片玩家一個難得的追趕機會。

????????回顧過去二十年,英偉達之所以能主宰AI時代,得益于其在AI領域的先發優勢,借助深度學習的浪潮,憑借CUDA平臺取得對英特爾的戰略優勢。

????????如今,一條嶄新的道路即將再次出現,但這一次,中國企業已經做好準備。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/39948.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/39948.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/39948.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【大模型LLM面試合集】大語言模型基礎_llm概念

1.llm概念 1.目前 主流的開源模型體系 有哪些? 目前主流的開源LLM(語言模型)模型體系包括以下幾個: GPT(Generative Pre-trained Transformer)系列:由OpenAI發布的一系列基于Transformer架構…

Linux常用查看日志方法-如使用less查看日志文件

在Linux系統中,查看日志文件是常見的運維任務之一。less命令是一個非常強大的工具,用于查看長文本文件,例如日志文件。它允許你按頁瀏覽文件,并提供了一些便捷的導航和搜索功能。 使用less查看日志文件 假設你有一個日志文件/va…

linux環境安裝elasticsearch緩存數據庫和Kibana客戶端

linux環境安裝elasticsearch緩存數據庫,今天我們安裝7.17.18版本,并分析遇到的問題。 一、elasticsearch安裝運行 1、直接下載 wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.17.18-linux-x86_64.tar.gz2、解壓 tar -…

驚艷眼球的視覺盛宴【二】

當晨光初破黎明的靜謐,一片絢爛便悄然鋪展在蔚藍的天際。那一刻,大地蘇醒,萬物復蘇,我們仿佛踏入了一幅活生生的畫卷。霧氣繚繞之中,群山似乎在低語,古樹在輕搖,一切都沐浴在柔和而金黃的光芒之…

如何理解vuex中的每個概念(通俗易懂)

文章目錄 1. 什么是 Vuex?2. Vuex 的四個核心概念 1. 什么是 Vuex? 想象一下,你家里有一個大冰箱,所有家庭成員都可以訪問這個冰箱。每個人都可以往里面放東西,也可以從里面拿東西。這個冰箱就像是 Vuex 中的“狀態”…

戰略流程-麥肯錫企業數字化業務變革成熟度評估模型及案例深度解析

一、企業變革成熟度評估模型 企業變革成熟度診斷模型是一種評估工具,用于全面掃描和評估企業在變革轉型過程中的能力水平。該模型通過一系列量化指標和定性分析,對企業在不同變革領域的成熟度進行評分,從而幫助企業識別在變革過程中的優勢和…

第12天:上下文管理器

今日學習目標 了解上下文管理器的基本概念和作用學習如何使用 with 語句學習如何創建自定義上下文管理器理解上下文管理器的實際應用場景 1. 上下文管理器簡介 上下文管理器是一種用于管理資源的機制,它可以在一段代碼執行前后自動執行一些操作。最常見的上下文管…

QAM MMA

MMA是改進的CMA,有RCA和CMA的優點,還能對相位誤差進行修正。 N 5e5; % 仿真符號數 M 16; % QAM16msg randi([0 M-1],N,1); % 產生隨機符號 tx qammod(msg,M); % QAM調制test_snr 20:5:30; …

無畏契約/valorant匹配無反應、無法聯機、聯機報錯的解決辦法

無畏契約/valorant是一款熱度超高的戰術射擊游戲,通過其獨特的美漫英雄設計和豐富的戰術性,以及武器技能設計系統,在全球吸引了不少玩家的加入和喜愛。不過近期伴隨第九賽季更新,很多玩家重回服務器,卻遇到了匹配無反應…

進程和內存管理 如何檢查內存和CPU 內存的使用和剩余情況,當前CPU的負載情況,找進程id,結束某個進程

一、檢查內存 方法一:查看/proc/meminfo文件,又被稱為偽文件,記錄了內存的相關信息,不可用vi/vim打開編輯,可用cat等命令查看。 方法二:free -m 命令 以MB為單位來顯示內存情況。 二、檢查CPU 方法一…

基于用戶的協同過濾算法

目錄 原理: 計算相似度: 步驟: 計算方法:Jaccard相似系數、余弦相似度。 推薦 原理: 先“找到相似用戶”,再“找到他們喜歡的物品”--->人以群分。即,給用戶推薦“和他興趣相似的其他用…

C語言 輸出*的圖案(1,3,5,7,5,3,1順序)

輸出以下圖案&#xff08;不是直接輸出&#xff0c;且要求輸出時符號居中對齊&#xff09;。 * *** ***** ******* ***** *** * 這個程序輸出一個特定的圖案&#xff0c;符號居中對齊。 #include <stdio.h>int main() {int n 4; // 圖案的中間行數// 輸出上半部分for …

絕地求生PUBG服務器延遲太高 購買領取響應時間長怎么解決

絕地求生PUBG是一款特別熱門的射擊類吃雞游戲&#xff0c;游戲還有多張地圖可供玩家選擇&#xff0c;玩家們需要乘坐飛機空投跳傘至不同的各個角落&#xff0c;赤手空拳尋找武器&#xff0c;車輛以及物資&#xff0c;并在多種多樣的地形中展開戰斗。想要取得勝利&#xff0c;我…

分享一款可編輯本地電腦文件的在線編輯器

背景 之前見過在線版的VSCode&#xff0c;被驚訝到了。網頁上竟然可以編輯電腦本地的文件&#xff0c;打破了網頁無法編輯本地電腦文件的限制。一直好奇怎么做的。抽空研究了一下&#xff0c;然后發現其實也不難。 分析 先給大家介紹一下這款在線編輯器的效果。 左側欄為文件…

徹底解決網絡哈希沖突,百度百舸的高性能網絡 HPN 落地實踐

GPU 的通信性能對于大模型的訓練有著至關重要的影響。在 HPN 網絡工程實踐中&#xff0c;我們的核心關注點是如何充分利用網絡硬件資源的能力&#xff0c;將通信性能最大化&#xff0c;從而提升大模型端到端的訓練性能。 1 HPN 網絡 — AIPod 下圖是百度百舸的高性能網絡 …

Vue如何使用封裝接口

在Vue項目中封裝接口&#xff08;API&#xff09;是一個常見的需求&#xff0c;特別是在與后端服務進行交互時。封裝接口的目的是為了將請求邏輯與組件邏輯分離&#xff0c;提高代碼的可維護性和復用性。以下是一個簡單的步驟和示例&#xff0c;說明如何在Vue項目中封裝接口。 …

洛谷 P1020 [NOIP1999 提高組] 導彈攔截

題目描述 某國為了防御敵國的導彈襲擊&#xff0c;發展出一種導彈攔截系統。但是這種導彈攔截系統有一個缺陷&#xff1a;雖然它的第一發炮彈能夠到達任意的高度&#xff0c;但是以后每一發炮彈都不能高于前一發的高度。某天&#xff0c;雷達捕捉到敵國的導彈來襲。由于該系統…

下拉菜單顯示年份選項(月份也適用)

項目場景&#xff1a; 下拉菜單顯示年份選項&#xff08;月份也適用&#xff09; 前段語言Vue 問題描述 在列表的搜索欄常常需要提供年份、月份選擇&#xff0c;此文記錄一種簡單的年份下拉菜單的展示方式&#xff1a; <el-form-item label"年份" prop"yea…

戰略資訊 | TapData 牽手思想科技,開啟數據管理新篇章!

在這個數字化飛速發展的時代&#xff0c;數據已成為企業最寶貴的資產之一。為了更好地迎接新時代的訴求與挑戰&#xff0c;TapData 現已與思想科技達成了一項具有里程碑意義的戰略合作協議。這不僅是兩個企業之間的合作&#xff0c;更是對整個數據管理行業的一次重大推動。 思…

興業嚴選|北京市戶籍 多子女家庭買二套房個貸算首套

6月26日&#xff0c;北京市住房和城鄉建設委員會、中國人民銀行北京市分行、國家金融監督管理總局北京監管局、北京住房公積金管理中心聯合印發《關于優化本市房地產市場平穩健康發展政策措施的通知》。 明確支持多子女家庭改善性住房需求&#xff0c;對北京市戶籍二孩及以上的…