系統英偉達gpu驅動卸載_繞過CPU,英偉達讓GPU直連存儲設備

英偉達最近發布了一個新的GPUDirect Storage,暫且叫做GPU直連存儲,讓GPU直接連到NVMe存儲設備上。這一方案用到了RDMA設備來把數據從閃存存儲轉移到GPU本地的內存里,無需經過CPU還有系統內存。

如果這一舉措順利的話,英偉達就能擺脫對于CPU的依賴開辟一片全新的領地,全新的市場,比如數據科學和機器學習市場,這一市場將造就每年200億到250億美金的服務器市場,跟HPC和深度學習市場加起來的市場規模差不多一樣大。

英偉達在拼命的把要做的事情往GPU里放,去年十月份,英偉達發布了RAPIDS,這是一個開源的工具庫,用于幫助人們用GPU做分析和機器學習。RAPIDS可以對Apache Arrow, Spark等數據科學類的工具提供GPU加速,將GPU放入大數據企業應用的生態,這一領域現如今仍舊是以基于CPU的Hadoopp和Mapreduce這種方案。

RAPIDS涵蓋了機器學習的所有方面,包括監督式和無監督式的機器學習,還有各種數據處理方面的內容,但是,這一做法也遭到了一些懷疑。

GPU現在越做越大,連接性也越來越好,從應用的角度來看,GPU的通用也很好。與此同時,數據分析越來越負載,機器學習經常會集成到工作流程中,這樣一來,對TB級數據進行千萬億次計算的應用程序也會越來越多。

想做好這點必須有很好的可擴展性,通過NVLink和NVSwitch等技術可以連接多個GPU,組成一個巨大的加速器,該技術最初是為DGX架構設計的,這一架構主要也是為了解決規模更大,更復雜的神經網絡訓練問題。英偉達想把GPU的計算能力用于大數據的想法是說的通的,但唯獨就是缺少快速的數據存儲路徑。

通常,在GPU加速系統當中,所有的IO操作都會先經過主機端,也就是需要經過CPU指令把數據傳到主機內存里,然后才會到達GPU,CPU通常會通過“bounce buffer”來實現數據傳輸,“bounce buffer”是系統內存中的一塊區域,數據在傳輸到GPU之前會在這里保存一個副本。很明顯,這種中轉會引額外延遲和內存消耗,降低運行在GPU上的應用程序的性能,還會占用CPU資源,這就是GPUDirect Storage要解決的問題。

8384695629995a278159661495115c6e.png

英偉達方面表示這一技術能提升50%的IO帶寬,延遲能降低3.8倍。如果通過NVMeoF技術的話,GPU就能連上PB級別的存儲資源池,更厲害的是,英偉達聲稱數據存取的效率比內存的頁面緩存速度還要快。

英偉達表示,如果你的DGX-2系統里有16個GPU,主機端有1.5TB內存的話,GPUDirect Storage的吞吐帶寬能提升8倍(跟原來不支持GPUDirect Storage的DGX-2系統相比)。這是因為,DGX-2的吞吐帶寬能達到大約200GB/s,而原來依靠主機端內存的話,最多也就50GB/s。

多出來的這150GB/s傳輸速度對于數據分析型工作負載的提升將非常可觀,對于像深度學習這種文件密集型應用程序,對于傳統的HPC也將會帶來很大改觀。

英偉達的這一做法讓GPU直連到存儲,直接拿到原始數據,意味著GPU也可以對文件進行解壓縮和解碼操作,解放CPU。目前,GPUDirect Storage支持各種常見的文件格式進行操作。

GPUDirect Storage方案用到了兩項高端技術,一個是RDMA,一個是NVMe(NVMe-oF),其中,RDMA被封裝在GPUDirect的協議中,依靠各種網絡適配器工作(比如Mellanox的NIC),既可以訪問遠程的存儲也可以訪問本地的存儲設備。

目前,GPUDirect Storage只面向少數合作伙伴提供,預計今年十月份將推出beta版本。

在譯者看來,這是英偉達跟英特爾競爭的又一大舉措,可以看做是對英特爾再度進軍GPU市場的一個回應。

繞開CPU,開辟一片新的生態,這在理論上是可行的,也確實有明顯的需求場景,最后能否在市場上推行開來,還得看方案構建的水平,包括方案的易用性,穩定性,場景的優化水平,當然,最重要的還是不要對現有軟件架構帶來太多變化,控制用戶的使用成本和購置成本。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/372930.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/372930.shtml
英文地址,請注明出處:http://en.pswp.cn/news/372930.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

37、EnumSet詳解

EnumSet類也是有順序的,EnumSet按照枚舉值在Enum類內定義的順序決定集合元素的順序 EnumSet在內部已位向量的形式存儲,這種存儲方式非常緊湊、搞笑,因此EnumSet占用內存很小,而且運行效率很好。 EnumSet集合不允許加入null元素 En…

嘲弄和存根–了解Mockito的測試雙打

介紹 我遇到的一件事是使用模擬框架的團隊假設他們在模擬。 他們并不知道Mocks只是Gerard Meszaros在xunitpatterns.com上歸類的“測試雙打”之一。 重要的是要意識到每種類型的測試雙精度在測試中都扮演著不同的角色。 用與您需要學習不同模式或重構的方式相同,您…

numpy 辨異(三)—— hstack/column_stack,linalg.eig/linalg.eigh

1. np.hstack np.column_stack >>> np.hstack([np.array([1, 2, 3]), np.array([4, 5, 6])]) array([1, 2, 3, 4, 5, 6])>>> np.column_stack([np.array([1, 2, 3]), np.array([4, 5, 6])]) array([[1, 4],[2, 5],[3, 6]]) 當然對等地,也存在&…

【代碼筆記】iOS-首頁3張圖片變化

一&#xff0c;效果圖。 二&#xff0c;工程圖。 三&#xff0c;代碼。 RootViewController.h #import <UIKit/UIKit.h>interface RootViewController : UIViewController {NSTimer *timer;UIImageView *imageView1;UIImageView *imageView2;UIImageView *imageView3;UIV…

acwing算法提高之動態規劃--數位DP

目錄 1 基礎知識2 模板3 訓練 1 基礎知識 暫無。。。 2 模板 暫無。。。 3 訓練 題目1&#xff1a;度的數量。 解題思路&#xff1a;分類討論。 C代碼如下&#xff0c; #include <iostream> #include <vector>using namespace std;const int N 35; int K,…

python 輸入數字變成密碼_如何在python中檢查數字的“密碼”

我建議使用sets和stdlib中的string包作為可接受字符的列表。在我還建議進行一點重構&#xff0c;以刪除大量帶有if / else分支的嵌套。在import stringupper set(list(string.uppercase))lower set(list(string.lowercase))numbers set(list(string.digits))while True:npw …

使用Eclipse在Amazon Ec2中部署Java Web應用程序的完整指南

嗨&#xff0c;讀者們&#xff0c; 今天&#xff0c;我將向您展示如何使用Eclipse IDE在Amazon EC2中部署簡單的Java Web應用程序。 在我們開始之前&#xff0c;我們需要一些必需的東西&#xff0c; Eclipse Java EE IDE –您可以從http://www.eclipse.org/downloads/下載&…

jquery的load方法

load方法指定一個界面會顯示在目標的標簽內部 比如MVC的一個分部視圖頁面想要顯示在某個標簽里面&#xff0c;可以寫成 $(標簽ID).load&#xff08;分部視圖名稱,data&#xff09; 其中第二個參數可選&#xff0c;主要是一些需要傳遞到該頁面的數據JSON格式組成&#xff0c;發送…

android 錄音原始文件_音頻采集:Android基于AudioRecord的實現

前言這篇文章簡單介紹下移動端Android系統下利用AudioRecord進行音頻采集方法。按照慣例開始前先提供一份源碼 AudioRecordLib 。AudioRecord采集的核心實現在于 AudioRecordCore.java 這個文件。權限申請想要使用AudioRecord這個API&#xff0c;需要在AndroidManifest.xml的配…

Spring 3和Java EE 6 –不公平和不完整的比較

這篇小文章的初稿標題為“ Spring&#xff06;Java EE –比較蘋果和橙子”。 在撰寫本文時&#xff0c;我了解到可以比較Spring Framework和Java EE&#xff0c;但這始終是不公平且不完整的工作。 Java for Enterprise和Spring Framework的發展緊密地聯系在一起。 兩者相互依存…

xml配置文件推薦方式

1.XML幫助類 /// <summary>/// Xml幫助類/// </summary>public class XmlHelper{/// <summary>/// 保存xml/// </summary>/// <typeparam name"T"></typeparam>/// <param name"path"></param>/// <p…

AFNetWorking https SSL認證

一般來講如果app用了web service , 我們需要防止數據嗅探來保證數據安全.通常的做法是用ssl來連接以防止數據抓包和嗅探 其實這么做的話還是不夠的 。 我們還需要防止中間人攻擊&#xff08;不明白的自己去百度&#xff09;。攻擊者通過偽造的ssl證書使app連接到了偽裝的假冒的…

查看環境列表_Xfce 4.14桌面環境正式發布,想要圖形界面又想節省內存?就它了...

1. Xfce 4.14桌面環境正式發布&#xff0c;它有什么新特性&#xff1f;本文主要講解Xfce 4.14桌面環境正式發布&#xff0c;它有什么新特性。Xfce已經開發了4年多&#xff0c;但是這個周末終于看到了期待已久的Xfce 4.14的發布。Xfce 4.14是這個輕量級桌面環境的最新穩定版本&a…

使用Log4jdbc記錄JDBC操作

當我們開發任何應用程序&#xff0c;完成它或結束其任何模塊時&#xff0c;我們都會開始優化過程。 大多數應用程序都包含數據庫訪問權限&#xff0c;并且如果您使用的是ORM &#xff0c;則可能會使用hibernate 。 優化休眠持久層&#xff0c;要求準備閱讀&#xff0c;理解和評…

android BluetoothAdapter藍牙BLE掃描總結

做室內定位的程序員應該都知道&#xff0c;在Android 5.0之后&#xff0c;google推出了藍牙掃描新接口&#xff0c;我們在實測中發現出一些問題&#xff0c;現在給大家列出&#xff0c;以供參考&#xff1a; 1.android 4.3.1(Build.VERSION_CODES.JELLY_BEAN_MR2)增加的startLe…

卷積神經網絡語音識別_用于物體識別的3D卷積神經網絡

本文提出了一種基于CNN的3D物體識別方法&#xff0c;能夠從3D圖像表示中識別3D物體&#xff0c;并在比較了不同的體素時的準確性。已有文獻中&#xff0c;3D CNN使用3D點云數據集或者RGBD圖像來構建3D CNNs&#xff0c;但是CNN也可以用于直接識別物體體積表示的體素。本文中&am…

段落排版--對齊(text-aliagn)

想為塊狀元素中的文本、圖片設置居中樣式嗎&#xff1f;可以使用text-align樣式代碼&#xff0c;如下代碼可實現文本居中顯示。(那么什么是塊狀元素呢&#xff1f;后面會講到呢~) h1{text-align:center; } <h1>了不起的蓋茨比</h1> 同樣可以設置居左&#xff1a; h…

Java 7:在不丟失數據的情況下關閉NIO.2文件通道

關閉異步文件通道可能非常困難。 如果您將I / O任務提交到異步通道&#xff0c;則需要確保正確執行了任務。 實際上&#xff0c;出于多種原因&#xff0c;這對于異步通道可能是一個棘手的要求。 默認的通道組使用守護進程線程作為工作線程&#xff0c;這不是一個好選擇&#xf…

JavaScript封裝方法,兼容參數類型為Number和String

/*** 依據Kind確定跳轉到目標列表頁面。* param kind*/function gobackByKind(kind) {var kindStr String(kind);switch(kindStr){case "1"://跳轉到客戶列表頁面window.location.href/biz/customer/list;break;case "2"://跳轉到代理機構列表頁面window.…

#獲得請求來源ip_以太網數據包TCP、IP、ICMP、UDP、ARP協議頭結構詳解

以太網首部目地MAC地址(8字節)源MAC地址(8字節)類型(2字節)1、IP頭的結構版本(4位)頭長度(4位)服務類型(8位)封包總長度(16位)封包標識(16位)標志(3位)片斷偏移地址(13位)存活時間(8位)協議(8位)校驗和(16位)來源IP地址(32位)目的IP地址(32位)選項(可選)填充(可選)數據(1)字節和…