軟考 系統架構設計師系列知識點之雜項集萃(93)

接前一篇文章:軟考 系統架構設計師系列知識點之雜項集萃(92)

第169題

人工智能技術已成為當前國際科技競爭的核心技術之一,AI芯片是占據人工智能市場的法寶。AI芯片有別于通常處理器芯片,它應具備四種關鍵特征。()是AI芯片的關鍵特點。

A. 新型的計算范式、信號處理能力、低精度設計、專用開發工具

B. 新型的計算范式、訓練和推斷、大數據處理能力、可重構的能力

C. 訓練和推斷、大數據處理能力、可定制性、專用開發工具

D. 訓練和推斷、低精度設計、新型的計算范式、圖像處理能力

正確答案:B。

解析:

新興的計算范式、訓練和推斷、大數據處理能力、可重構的能力。

清華大學《人工智能芯片技術白皮書(2018)》詳細講述了相關內容。

2.2 新型計算范式

AI 計算既不脫離傳統計算,也具有新的計算特質,包括:

1. 處理的內容往往是非結構化數據,例如視頻、圖像及語音等,這類數據很難通過預編程的方法得到滿意的結果。因此,需要通過樣本訓練、擬合及環境交互等方式,利用大量數據來訓練模型,再用訓練好的模型處理數據。

2. 處理的過程通常需要很大的計算量,基本的計算主要是線性代數運算,典型的如張量處理,而控制流程則相對簡單。對于這類運算,大規模并行計算硬件較傳統通用處理器更為適合。

3. 處理的過程參數量大,需要巨大的存儲容量,高帶寬、低延時的訪存能力,以及計算單元和存儲器件間豐富且靈活的連接。數據本地化特征較強,適合數據復用和近內存計算。

2.3 訓練和推斷

AI 系統通常涉及訓練(Training)和推斷(Inference)過程。簡單來說,訓練過程是指在已有數據中學習, 獲得某些能力的過程;而推斷過程則是指對新的數據,使用這些能力完成特定任務(比如分類、識別等)。 對神經網絡而言,訓練過程就是通過不斷更新網絡參數,使推斷(或者預測)誤差最小化的過程;推斷過程則是直接將數據輸入神經網絡并評估結果的正向計算過程。雖然訓練和推斷有很多類似的基本運算,都需要具有大量的并行處理,高內存帶寬和低延遲操作,但是兩者在計算和存儲資源方面的需求方面存在顯 著的差異。

訓練:首先,對于訓練來說,計算精度非常重要,因為它直接影響推斷的準確度。支持訓練的硬件必須支持具有較長字長的浮點數或定點數。其次,訓練中通常同時包括正向和反向的計算過程,需要多次迭代, 計算量要求非常高。這就需要支持訓練的芯片不僅要具有強大的單芯片計算能力,還要具備很好的擴展性, 可以通過多芯片系統提供更強大的計算能力。再次,訓練過程,特別是離線訓練,必須處理大量的數據(高達1015到1018 字節),因此,它對內存數量、訪問內存的帶寬和內存管理方法的要求都非常高。第四,由于訓練需要更新(寫入)和使用(讀取)神經網絡中的參數(權重),因而需要更復雜的數據同步技術。最后, 重要參數的頻繁寫入也要求存儲器能支持更快速的寫入(特別是對于在線訓練),這對于一些存儲器技術來 說是很大的挑戰。

推斷:對推斷來說,運算和存儲的需求都遠遠低于訓練。但由于推斷的應用場景多種多樣,部署在從云到端的各種設備,如數據中心、自動駕駛汽車、智慧家庭和IoT設備等,其需求和約束呈現出多樣化的特點。 對于多數應用來說,速度、能效、安全和硬件成本等是最重要的考慮因素,而模型的準確度和數據精度則 可以依具體情況適當降低。 雖然目前大部分機器學習方法都可以比較清晰地劃分為訓練和推斷的過程,但還有一些領域,比如增強學習(Reinforcement Learning)和在線學習(On-line Learning)則處于持續學習和改進模型的進程中。因此,在未來的AI應用當中,訓練(學習)和推斷在更多場景下會是交織在一起的。

2.4 大數據處理能力

人工智能的發展高度依賴海量的數據。滿足高效能機器學習的數據處理要求是AI芯片需要考慮的最重 要因素。一個無法回避的現實是,運算單元與內存之間的性能差距越來越大,內存子系統成為芯片整體處理能力提高的障礙,也就是通常所說的“內存墻”。人工智能工作負載多是數據密集型,需要大量的存儲和各層次存儲器間的數據搬移,導致“內存墻”問題更加突出。為了彌補計算單元和存儲器之間的差距,學術界 和工業界正在兩個方向上進行探索:(1)富內存的處理單元。增加片上存儲器的容量并使其更靠近計算單元, 使得數據計算單元和內存之間的數據移動成本(時間和功耗)大大減少。(2)具備計算能力的新型存儲器。 直接在存儲器內部(或更近)實現計算。這種方法也被稱為存內計算(Process-in-Memory PIM)或近數據計算(Near Data Computing NDC)。

2.5 數據精度

低精度設計是AI芯片的一個趨勢,在針對推斷的芯片中更加明顯。對一些應用來說,降低精度的設計不僅加速了機器學習算法的推斷(也可能是訓練),甚至可能更符合神經形態計算的特征。近期已經證明, 對于學習算法和神經網絡的某些部分,使用盡可能低的精度(例如二進制數據)就足以達到預期效果,同時可以節省大量內存和降低能量消耗。通過對數據上下文數據精度的分析和對精度的舍入誤差敏感性,來動態地進行精度的設置和調整,將是AI芯片設計優化的必要策略。

2.6 可重構能力

人工智能各領域的算法和應用還處在高速發展和快速迭代的階段,考慮到芯片的研發成本和周期,針對特定應用、算法或場景的定制化設計很難適應變化。針對特定領域(包括具有類似需求的多種應用)而不針對特定應用的設計,將是AI芯片設計的一個指導原則,具有可重構能力的AI芯片可以在更多應用中大顯身手,并且可以通過重新配置,適應新的AI算法、架構和任務。

2.7 軟件工具

就像傳統的CPU需要編譯工具的支持, AI芯片也需要軟件工具鏈的支持,才能將不同的機器學習任務和神經網絡轉換為可以在AI芯片上高效執行的指令代碼,如NVIDA GPU通過CUDA工具獲得成功。 基本處理、內存訪問及任務的正確分配和調度將是工具鏈中需要重點考慮的因素。當工具鏈將神經網絡或其它模型映射到AI芯片上時,也有很多優化代碼的機會,比如神經網絡剪枝、權重壓縮和動態量化等。目前,AI算法開發框架如TensorFlow、Caffe和PyTorch等,在AI應用研發中已經起到了至關重要的作用。對AI芯片來說,構建一個集成化的流程,將AI模型的開發和訓練,硬件無關和硬件相關的代碼優化, 自動化指令翻譯等功能無縫的結合在一起,將是成功部署的關鍵要求。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/85400.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/85400.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/85400.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Kotlin實現文件下載斷點續傳(RandomAccessFile全解析)

本文將深入探討如何使用Kotlin和RandomAccessFile實現高效的斷點續傳功能,涵蓋原理分析、完整代碼實現、性能優化及工程實踐要點。 一、斷點續傳核心原理 1.1 HTTP斷點續傳協議 #mermaid-svg-EfmgPUx3SFkso8Fc {font-family:"trebuchet ms",verdana,aria…

linux-headers-$(uname -r)和kmod是什么?

2025年6月16日,周一清晨 Linux-headers-$(uname -r)與kmod包詳解 一、linux-headers-$(uname -r)包 linux-headers-(uname -r)是Linux系統中與當前運行內核版本匹配的內核頭文件包,其中(uname -r)會自動替換為當前內核版本號(如5.13.0-19-g…

使用axios及和spirng boot 交互

Axios Axios是一個基于Promise的HTTP庫,可以發送get、post等請求,它作用于瀏覽器和Node.js中。當運行在瀏覽器時,使用XMLHttpRequest接口發送請求;當運行在Node.js時,使用HTTP對象發送請求。 使用步驟: 第…

布局文件的逐行詳細解讀

總覽 源碼 <?xml version="1.0" encoding="utf-8"?> <androidx.constraintlayout.widget.ConstraintLayout xmlns:android="http://schemas.android.com/apk/res/android"xmlns:app="http://schemas.android.com/apk/res-auto&…

VTK 顯示大量點云數據及交互(點云拾取、著色、測量等)功能

VTK (Visualization Toolkit) 是一個強大的開源可視化庫&#xff0c;非常適合處理點云數據。下面將介紹如何使用 VTK 顯示大量點云數據&#xff0c;并實現點云拾取、著色、測量等功能。 基本點云顯示 創建一個基本的點云顯示程序&#xff1a; cpp #include <vtkSmartPoi…

性能優化 - 高級進階: 性能優化全方位總結

文章目錄 Pre1. 概述&#xff1a;性能優化提綱與使用場景2. 準備階段2.1 明確優化范圍與目標2.2 環境與工具準備 3. 數據收集與指標確認3.1 關鍵資源維度與指標項3.2 監控體系搭建與初始采集3.3 日志與追蹤配置 4. 問題定位思路4.1 從整體到局部的分析流程4.2 常見瓶頸維度檢查…

Mybatis之Integer類型字段為0,入庫為null

背景&#xff1a; 由于項目某個功能用到優先級字段來判斷&#xff0c;需要在mysql表中定義一個字段XX&#xff0c;類型為int&#xff0c;默認為0&#xff0c;具體值由后臺配置&#xff0c;正常入庫即可 問題&#xff1a; 由于后臺配置存量其他類型的數據無需該字段&#xff0c…

上海市計算機學會競賽平臺2022年3月月賽丙組洗牌

題目描述 給定一個整數 nn&#xff0c;表示 nn 張牌&#xff0c;牌的編號為 11 到 nn。 再給定一個洗牌置換 f1,f2,…,fnf1?,f2?,…,fn?&#xff0c;進行一次洗牌操作時&#xff0c;應將第一號位置的牌交換到第 f1f1? 號位置&#xff0c;將第 ii 號位置的牌交換到第 fifi…

DINO-R1:激勵推理能力的視覺基礎模型

摘要 近期&#xff0c;人們對大型語言模型&#xff08;如DeepSeek-R1&#xff09;推理能力的關注呈爆炸式增長&#xff0c;通過基于強化學習的微調框架&#xff08;如組相對策略優化&#xff08;Group Relative Policy Optimization&#xff0c;GRPO&#xff09;方法&#xff…

Linux--LVM邏輯卷擴容

Linux–LVM邏輯卷擴容 文章目錄 Linux--LVM邏輯卷擴容?? LVM 常用命令分類及基本格式? 1. 物理卷(PV)相關命令? 2. 卷組(VG)相關命令? 3. 邏輯卷(LV)相關命令?? 三、查看類命令簡寫說明使用命令及基本格式:lvm邏輯卷擴容步驟:1.添加硬盤設備2.檢測新增硬盤 添加…

C#基礎語法與控制臺操作

1. 控制臺操作基礎 控制臺程序是學習C#的起點。以下是一些常用的控制臺操作方法&#xff1a; 1.1. 清除控制臺 Console.Clear(); // 清除控制臺內容1.2. 輸出字符串 Console.WriteLine("Hello World!"); // 在屏幕的當前位置換行輸出字符串 Console.Write("…

100.Complex[]同時儲存實數和虛數兩組double的數組 C#例子

在信號處理中&#xff0c;IQ 數據&#xff08;In-phase and Quadrature&#xff09;通常表示復數形式的信號&#xff0c;其中實部表示同相分量&#xff0c;虛部表示正交分量。Complex[] data 是一個包含 IQ 數據的數組&#xff0c;每個元素是一個復數&#xff0c;表示一個信號樣…

停止追逐 React 重渲染

大多數開發者都在浪費時間對抗多余的重渲染。真正的 React 架構師根本讓問題無從產生——下面就來揭開他們的思路&#xff0c;以及為何大多數所謂的性能優化技巧反而拖慢了你的應用。 重渲染的無盡輪回 先來直擊痛點&#xff1a;如果還在項目里到處撒 useMemo、useCallback&…

流水線的安全與合規 - 構建可信的交付鏈

流水線的安全與合規 - 構建可信的交付鏈 “安全左移 (Shift-Left Security)”的理念 “安全左移”是 DevSecOps 的核心理念,指的是將安全測試和考量,從軟件開發生命周期 (SDLC) 的末端(發布前),盡可能地向左移動到更早的階段(如編碼、構建、測試階段)。 為何對 SRE 至…

???????神經網絡基礎講解 一

??一.神經網絡 ? ??1. 全連接神經網絡&#xff08;Fully Connected Network, FCN&#xff09;?? ??核心概念&#xff1a;?? ??輸入層??&#xff1a;接收原始數據&#xff08;如數字、圖片像素等&#xff09; 數字矩陣 。??隱藏層??&#xff1a;對數據…

MySQL 8.0 OCP 英文題庫解析(二十二)

Oracle 為慶祝 MySQL 30 周年&#xff0c;截止到 2025.07.31 之前。所有人均可以免費考取原價245美元的MySQL OCP 認證。 從今天開始&#xff0c;將英文題庫免費公布出來&#xff0c;并進行解析&#xff0c;幫助大家在一個月之內輕松通過OCP認證。 本期公布試題201~210 試題2…

【大模型推理】PD分離場景下decoder負載均衡,如何選取decoder

https://mp.weixin.qq.com/s?__bizMzg4NTczNzg2OA&mid2247507420&idx1&sn4b32726abd205c7f94144bcb9105330f&chksmce64b9fc7f1d8de04a40b0153302dee52262c6f104c67195e2586e75c8093b8be493f252c8a3#rd 在非 Local 場景下&#xff0c;Prefill 定時獲取 Decode …

【IP地址】IP應用場景的使用方向

網絡安全領域 通過IP地址查詢&#xff0c;安全系統能夠實時監控網絡流量&#xff0c;識別異常訪問行為。例如&#xff0c;當某個IP地址在短時間內頻繁發起大量請求&#xff0c;且訪問模式與正常用戶存在明顯差異時&#xff0c;系統可將其標記為可疑IP&#xff0c;觸發風險預警…

3-18 WPS JS宏 顏色設置實例應用(按條件設置單元格顏色)學習筆記

前面講解了關于單元格的一些格式的設置&#xff0c;本節課再講解一下各種清除方法。 1.函數解析與用法 Range().clear()//清除全部 Range().Value2null //清除內容 Range().ClearContents()//清除內容 Range().ClearFormats()//清除格式 Range().EntireRow.Range()//以Ra…

從零開始的云計算生活——第二十天,腳踏實地,SSH與Rsync服務

目錄 一.故事背景 二.SSH帶外管理 1.概述 2. 配置文件 3.命令解析 4.登錄方式配置 a.用戶名密碼登錄 b.公鑰驗證登錄 5.實操生成密鑰對 三.Rsyncsersync實現數據實時同步 1.rsync概述 2.rsync運行原理 3.rsync部署 4.備份測試 配置備份目錄 5.rsyncsersync 實現…