中科馭數HADOS 3.0:以四大架構革新,全面擁抱敏捷開發理念,引領DPU應用生態

一家成功的大算力芯片公司,其核心壁壘必須是軟硬兼備的,既要有芯片架構的強大技術壁壘,更要有持久投入的、生態兼容完備的軟件護城河。HADOS,就是中科馭數的軟件護城河。

——中科馭數高級副總裁 張宇

近日,在DPU基礎軟件開發上,中科馭數迎來了一項重要的突破成果——HADOS 正式來到3.0版本。

HADOS 3.0是國內DPU軟件研發平臺的一個里程碑版本,集結了中科馭數6年全部軟件研發投入與DPU在各行業廣泛落地經驗的整合和沉淀,體現了中科馭數全面擁抱敏捷開發的理念和方法,以及對高效、靈活、安全、易用的極致追求。

目前,HADOS 3.0核心代碼量已經超過126萬行,包含網絡、計算、存儲、安全等多層次API數量高達2765個,并且提供大量的開箱即用的組件和服務。相較于英特爾的IPDK和英偉達的DOCA,起步更早的HADOS在不少方面都有獨特的沉淀和優勢,包括云原生網絡、微服務治理、全卸載能力、DPU全仿真技術、生態兼容性、運營管控、國內安全加解密,以及最重要的人工智能場景下國產AI芯片和GPU芯片網絡方案等等方面。可以這么說,HADOS 3.0已經站在了業界最前沿,成為與國際巨頭英偉達和英特爾并駕齊驅的本土解決方案。

HADOS 3.0 沿用馭數經典軟件棧架構

為用戶提供全方位、多層次的開發體驗

從架構來看,HADOS3.0延續了此前兩個大版本的三個邏輯功能分區架構,分別是超高性能的設備驅動層(DDL),兼容性完備的應用驅動層(ADL),以及功能強大且好用的應用開發平臺層(ADP)。這也是中科馭數的經典軟件棧架構模型設計,旨在為用戶提供全方位、多層次的開發體驗。

設備驅動層(DDL),作為性能與靈活性兼備的“不二之選”,集成了DPU開發所需的全套驅動模塊與豐富的API接口,涵蓋超低延遲LDMA、RDMA、虛擬化、存儲加密等功能模塊,并且支持NP的網絡可編程,特別適用于追求極致性能與定制化的用戶。

應用驅動層(ADL),聚焦于“三U一體”高性能算力中心,通過優化的DPDK、SPDK、OVS、OVN,以及云原生和服務網格等技術組件,為網絡、計算、存儲提供全面加速服務,助力用戶輕松構建高性能算力底座,開箱即用,即刻享受DPU帶來的性能飛躍。

而應用開發平臺層(ADP),是HADOS的“敏捷”核心,配備了編譯、仿真、調試、部署的全棧工具包,其中HADEP——業界首款DPU Emulator,更是歷經三年精心打磨,實現了中科馭數DPU的全功能仿真,支持云化部署,讓客戶能夠在云端一鍵部署DPU設備集群,大幅縮短開發周期,加速項目落地。此外,HADEP還支持與真實DPU的混合部署,進一步提升研發效率。

在內部,中科馭數本身就是HADEP的“重度用戶”,基于云化部署的HADEP,搭建了自動化研發測試平臺,大大節省了硬件資源協調和占用開銷,提升了開發效率。這一舉措不僅是HADOS敏捷異構開發理念的生動實踐,也體現了馭數對研發效率與質量的不懈追求。

面對DPU開發平臺的復雜性,中科馭數構建了ADIP——一套多流水線自動化DevOps與自動化測試平臺,支持敏捷開發、持續集成、部署、安裝、測試、迭代,確保HADOS的構建與自動化測試,成為推動HADOS成功的“幕后英雄”。

HADOS 3.0四大架構革新

全面擁抱敏捷開發,引領DPU應用生態

架構革新之一:為云原生而“原生”

云原生技術,既承載了當前通用數據中心中主流方式,更是在當下以AIGC和大模型為代表的人工智能浪潮中,承擔核心算力操作系統角色,海量數據訓練以及大模型訓練、大模型推理都離不開云原生技術。

HADOS 3.0全面深度支持和擁抱原生網絡集群,提供云原生網絡加速、服務網格全卸載、裸金屬共池管理和網絡安全增強,為用戶打造了一個高效率、低成本、安全可靠的開發與運行平臺,提供了全面、高效的云原生解決方案。

架構革新之二:簡約而不簡單

深知客戶在運維過程中面臨的挑戰與需求,HADOS 3.0通過一系列智能化的管理工具與服務,提供強大的智能化運維支撐。HADOS 3.0引入了完善的運維管控遙測接口,與服務組件無縫集成,確保了對DPU集群的全面監控與高效管理。更值得一提的是,HADOS靈活地提供了普羅米修斯等系統服務,滿足客戶多樣化的運維需求。在此基礎上,HADOS傾力打造的DPU UMS統一管理系統,不僅能實時監測DPU設備的狀態,還能進行精細化的配置管理,確保集群的穩定運行與資源的高效利用。

通過這一平臺,用戶可以輕松實現設備的遠程控制、故障預警、性能優化等功能,極大降低了運維的復雜度與成本,釋放了更多精力專注于核心業務的創新與發展。

架構革新之三:層次化服務API,支持不同層次的二次開發

針對客戶對于DPU開發使用門檻高的痛點,HADOS 3.0提供從基礎到高級各個層次的服務API,更以直觀清晰的文檔,如全量、豐富的說明文檔、用戶手冊、最佳編程實踐與調優實踐指導,助力開發者快速打開DPU應用的大門,大幅縮短項目啟動周期,有效控制開發成本。

架構革新之四:一云多芯

“一云多芯”是當前業界整個高性能數據中心繞不過去的主流趨勢。為了順應這一多元化需求,HADOS 3.0支持“一云多芯”策略,讓DPU能夠與不同CPU、操作系統、GPU及IAAS層軟件系統無縫對接,做到全適配、全兼容承諾,讓客戶輕松構建“三U一體”高性能算力底座,一鍵部署,即刻體驗敏捷異構的效益。HADOS 3.0目前已成為業內唯一一款生態全兼容的DPU應用開發平臺,兼容了8款主流國產CPU平臺和10大國產操作系統。

六年磨一劍,HADOS已經成為業內適配最完全、競爭力最強、國內實際落地部署最多的DPU軟件開發平臺,累計部署量已經超過了萬卡級別。

HADOS 3.0每一行代碼,每一個功能模塊,都是基于中科馭數對用戶需求的深刻理解,為用戶提供了從底層硬件到上層應用的全方位加速,有效解決DPU開發與部署過程中的復雜性與挑戰,是對高性能計算與DPU規模化應用落地挑戰的有力回應。中科馭數將一如既往地站在DPU軟硬件技術探索前沿,與廣大用戶一道,共筑高性能計算的堅實基石。所有的這些努力,也都代表著一個信念——把敏捷易用送給客戶,把復雜挑戰留給馭數。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/42433.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/42433.shtml
英文地址,請注明出處:http://en.pswp.cn/web/42433.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

設計模式使用場景實現示例及優缺點(創建型模式——工廠方法模式、抽象工廠模式)

創建型模式 工廠方法模式 (Factory Method Pattern) 工廠方法模式(Factory Method Pattern)是一種創建型設計模式,提供了一個創建對象的接口,但由子類決定要實例化的類是哪一個。工廠方法模式讓類的實例化推遲到子類。這樣&…

關于MySQL mvcc

innodb mvcc mvcc 多版本并發控制 在RR isolution 情況下 trx在啟動的時候就拍了個快照。這個快照是基于整個數據庫的。 其實這個快照并不是說拷貝整個數據庫。并不是說要拷貝出這100個G的數據。 innodb里面每個trx有一個唯一的trxID 叫做trx id .在trx 開始的時候向innodb系…

嵌入式音頻處理技術的現在發展及未來的方向

嵌入式音頻處理技術:從音頻流媒體到聲音識別 嵌入式音頻處理技術的迅猛發展正在改變我們的生活方式,從音頻流媒體到聲音識別,這個領域為人們的生活和工作帶來了巨大的影響。本文將探討嵌入式音頻處理技術的最新趨勢和應用,以及提…

邏輯回歸模型(非回歸問題,而是解決二分類問題)

目錄: 一、Sigmoid激活函數:二、邏輯回歸介紹:三、決策邊界四、邏輯回歸模型訓練過程:1.訓練目標:2.梯度下降調整參數: 一、Sigmoid激活函數: Sigmoid函數是構建邏輯回歸模型的重要激活函數&am…

openlayers更改點坐標

我現在的需求是無人機點位根據ws傳輸的經緯度改變位置,在網上查了很多資料,終于是做出來了,如果有問題請指出。 效果圖,無人機可以來回移動 這里是核心代碼 // 添加飛機點位圖層let vectorLayerpointfunction DronepointLayer()…

Mercer 條件的基本概念及證明

Mercer 條件 是核函數理論中的一個重要概念,它確保了一個給定的對稱函數可以表示為某個高維特征空間中的內積。這個條件在支持向量機(SVM)和其他基于核方法的機器學習算法中非常重要。 文章目錄 基本介紹Mercer 條件的定義Mercer 定理實際應用…

Kafka(三)Producer第二篇

一,生產者架構 生產者客戶端由兩個線程協調運行,分別為主線程和Sender線程(發送線程)。 主線程:KafkaProducer創建消息,通過攔截器、序列化器和分區器之后緩存到消息收集器RecordAccumulator中;…

Redis 中的跳躍表(Skiplist)基本介紹

Redis 中的跳躍表(Skiplist)是一種用于有序元素集合的快速查找數據結構。它通過一個多級索引來提高搜索效率,能夠在對數時間復雜度內完成查找、插入和刪除操作。跳躍表特別適用于實現有序集合(sorted set)的功能&#…

大語言模型的直接偏好優化(DPO)對齊在PAI-QuickStart實踐

直接偏好優化(Direct Preference Optimization,DPO)算法是大語言模型對齊的經典算法之一,它巧妙地將獎勵模型(Reward Model)訓練和強化學習(RL)兩個步驟合并成了一個,使得訓練更加快…

MySQL 給數據表增加一列,一定會鎖表嗎?

在 MySQL 中,給數據表增加一列,是否會鎖表取決于使用的存儲引擎以及 MySQL 的版本。 InnoDB 存儲引擎在 MySQL 之前的行為 之前版本的 MySQL 中,如果你使用 ALTER TABLE 命令來增加一列,對于使用 InnoDB 存儲引擎的表&#xff0…

【算法】單調隊列單調棧

一、單調隊列 用來維護一段區間內的最大值或最小值,例如滑動窗口、區間最值等問題。 基本概念 單調隊列是一種存儲數據的隊列,其中元素的順序是單調遞增或單調遞減的。在算法競賽中,我們一般使用兩個單調隊列,一個維護單調遞增序…

【版面費優惠丨ACM獨立出版丨接受全文摘要投稿】2024年生物醫藥和智能技術國際學術會議(ICBIT 2024,8月23-25)

“2024年生物醫藥和智能技術國際學術會議(ICBIT 2024)”擬定于2024年8月23-25日于珠海召開。近年來,智能技術已經逐漸走入生物醫藥領域,并在與生物醫藥領域的融合創新中凸顯出巨大的發展潛力和社會價值。人工智能技術在生物醫藥領…

水處理基本知識

RO反滲透程序設計軟件下載 水處理基本知識 純水制備的核心工藝 核心工藝:純水(超純水)制備的主要處理工藝,結合前處理(預處理)工藝,輔助工藝及特殊工藝,組成完整的純水制備工藝。結…

優質作品集秘訣:8個技巧讓你的作品脫穎而出

制作一個高質量的投資組合不僅可以展示你的技能和創造力,還可以幫助你在求職和職業發展中脫穎而出。如何制作高質量的投資組合?今天給大家講述作品集的 8 個實用技能,幫助你制作出令人印象深刻的作品集! 1、精選作品 并不是所有…

飛睿智能會議室靜止雷達人體檢測傳感器,實時監測使用狀態,有人、無人智能感應節能減

在這個科技日新月異的時代,每一個細微的創新都可能成為推動行業創新的關鍵力量。今天,讓我們聚焦于一項看似不起眼卻實則潛力無限的技術——飛睿智能靜止雷達人體檢測傳感器,以及它在會議室這一商務交流核心區域中的巧妙應用。想象一下&#…

前端Canvas入門——怎么用Canvas畫一些簡單的圖案

Canvas作為前端的畫圖工具&#xff0c;其實用途還是蠻廣泛的&#xff0c;但是很多前端學習課程其實都很少涉及到這塊內容。 于是乎&#xff0c;就寫下這個了。 當然啦&#xff0c;目前還在學習摸索中。 一些實戰代碼&#xff0c;僅供參考&#xff1a; <canvasid"ctx&…

EtherCAT總線冗余讓制造更安全更可靠更智能

冗余定義 什么是總線冗余功能&#xff1f;我們都知道&#xff0c;EtherCAT現場總線具有靈活的拓撲結構&#xff0c;設備間支持線型、星型、樹型的連接方式&#xff0c;其中線型結構簡單、傳輸效率高&#xff0c;大多數的現場應用中也是使用這種連接方式&#xff0c;如下圖所示…

【Qt課設】基于Qt實現的中國象棋

一、摘 要 本報告討論了中國象棋程序設計的關鍵技術和方法。首先介紹了中國象棋的棋盤制作&#xff0c;利用Qt中的一些繪畫類的函數來進行繪制。在創作中國象棋棋子方面&#xff0c;首先&#xff0c;我們先定義一下棋子類&#xff0c;將棋子中相同的部分進行打包&#xff0c;使…

idea推送到gitee 401錯誤

在idea上推送時遇到這樣的問題&#xff0c;解決方法如下&#xff1a; 在https://的后面加上 用戶名:密碼 然后再提交就ok啦&#xff01;

三、SpringMVC

三、SpringMVC 1、SpringMVC簡介 1.1、什么是MVC MVC是一種軟件架構的思想&#xff0c;將軟件按照模型、視圖、控制器來劃分 M&#xff1a;Model&#xff0c;模型層&#xff0c;指工程中的JavaBean&#xff0c;作用是處理數據 JavaBean分為兩類&#xff1a; 一類稱為實體…