數字后端——低功耗設計物理實施

一、低功耗設計方案綜述

????????為了實現集成電路的低功耗設計目標,我們需要在系統設計階段就采用低功耗設計方案,因為隨著設計流程的逐步推進,到了芯片設計實現階段,降低芯片功耗的方法將越來越少,可節省功耗的百分比將不斷下降,這時,設計的主要目標將會側重于如何將設計方案變成物理實現。??

1、方案的選擇

????????集成電路設計流程中設計數據是有統一的格式的,系統設計到邏輯綜合由RT L網表傳遞,邏輯綜合到物理實現則由門級網表傳遞,布局布線后,邏輯驗證和形式驗證由門級網表傳遞。顯然,對于低功耗設計我們也需要一種統一的功耗約束文件,即通用功耗格式CPF(common power format)文件,在整個流程中傳遞低功耗指標和參數。

設計階段

解決方案設計工具或方法

系統級

算法級

系統分割

內存組織管理

電源管理

電壓與頻率降低

算法評估

算法轉換

C

systemC

systemVerilog

仿真驗證

可測試性

形式驗證

邏輯驗證

DFT

systemVerilog

Verilog

VHDL

CPF文檔

RTL編碼

邏輯綜合

狀態編碼

數據與地址線編碼

信號隔離

DFT

面積優化

門控時鐘

多閾值CMOS

多電源多電壓(MSMV)

電源關斷與電源保持時鐘門控

動態電壓與頻率調節技術(DVFS)

Verilog

VHDL

CPF文檔

設計約束文檔

門級網表

多電壓庫

多閾值CMOS庫

布局布線

物理實施

DFT?
面積優化
門控時鐘(clock gating)?

多閾值CMOS?
多電源多電壓(MSMV)
電源關斷(PSO)與狀態保持電源門控
(SRPG)
動態電壓與頻率調節技術(DVFS)
低功耗時鐘樹綜合(LPCTS)

CPF文檔

設計約束文檔

門級網表

多電壓庫

多閾值CMOS庫

????????CMOS工藝的電路功耗可分為動態功耗靜態功耗兩大部分。

????????其中,動態功耗包括器件本征電容和線負載電容充放電產生的功耗(也稱為開關功耗)和由于輸人信號跳變導致NMOS、PMOS同時導通從而形成電源到地的通路所產生的功耗(也稱為短路功耗)。對于動態功耗而言,它除了與供電電壓值有關外,還與負載電容、電路頻率和跳變因子有關。隨著器件尺寸的縮小,器件電容也在不斷減小,與此相反,電路工作頻率和信號跳變頻率卻在不斷地提高,因此要減小動態功耗還需在電路工作頻率和信號跳變頻率上尋求解決方案。由于電路頻率的降低意味著電路工作性能的下降,從而在保證性能的前提下,減小不必要的信號跳變頻率就成了減小動態功耗的切入點。這種要求產生了動態電壓與頻率調節(DVFS)技術。

????????當邏輯門處于靜態時,由PN結反偏電流、亞閾值電流、柵泄漏電流等效應引起的功耗稱為泄漏功耗。雖然單個邏輯門的泄漏功耗相當小,但對于千萬個邏輯門來說,泄漏功耗變得不能忽略,到90nm工藝節點后泄漏功耗已逐漸趕上并超越動態功耗成為功耗的主要部分。這種要求產生了多閾值電壓(MTCMOS,MT為multi-threshold)的方法。

????????功耗與電壓有著密切的關系,因此降低功耗最有效的方法是降低電路的供電電壓,這種要求產生了電源關斷(PSO)和多電源多電壓(MSMV)?的方法。

2、基本方法

????????低功耗設計的基本方法包括:①面積優化,它也是最經典的一種方法;②納米技術中開始引入使用的多閾值電壓技術;③時鐘門控電路。

1)面積優化

????????RTL邏輯綜合的主要目標包括優化時序、功耗和面積。在物理實施階段,同樣需要優化芯片的總面積和芯核面積,這樣可以進一步減小功耗。在時鐘樹綜合時,一方面通過約束文件,加速時鐘信號的傳輸,減小時鐘樹的總功耗,另一方面,優先選用反向器,而非緩沖器,減小時鐘樹上邏輯門的面積。但是,芯片的面積往往受到封裝的約束,和其他低功耗方法相比,通過減小面積降低功耗的效果比較有限。

2)多閾值電壓技術

????????在低功耗設計中通過減小泄漏功耗,例如采用多閾值器件MTCMOS(muhi-threshold CMOS)技術,也是個較好的低功耗設計辦法。
????????多閾值器件技術減小泄漏功耗的思想是,在電路中的關鍵路徑使用低閾值電壓的邏輯器件非關鍵路徑使用高閾值電壓的邏輯器件。閾值電壓 較高的邏輯單元漏電流較小,但速度也較低,適合用于非關鍵時序路徑收斂。閾值電壓較低的單元漏電流較大,但工作頻率較高,速度快,用于關鍵時序路徑。通過綜合工具獲得最優化的高閾值電壓 和低閾值電壓 單元的組合,由此產生的網表能夠在滿足設計目標的同時盡可能地降低漏電流。這一技術的實現需要有多閾值電壓單元庫的支持,即能提供具有不同閾值電壓的邏輯單元,在綜合時,設定泄漏功耗的目標值,綜合工具能夠根據時序路徑自動選擇或替換合適閾值的邏輯單元。

3)門控時鐘

????????時鐘信號貫穿于整個芯片,芯片工作時,時鐘信號在存儲單元的時鐘輸入端周期性跳變,所驅動負載電容非常大,產生較大的動態功耗,所以借助門控時鐘插入技術可以減小由于不必要的時鐘跳變而產生的功耗。

????????門控時鐘技術是目前應用較為廣泛和成熟的低功耗設計技術。門控時鐘的邏輯綜合非常容易實現,首先打開門控時鐘綜合這個選項,再指定門控單元所選擇的類型,以及門控單元的扇出,最后指定動態功耗的目標,EDA工具便可以自動地綜合生成。現在很多庫廠家都提供了集成的門控時鐘。門控時鐘的插入需要考慮測試的問題,在時鐘樹綜合階段也需要特殊地處理。

? ? ? ? 為了進一步的達到低功耗的目的,可以采用低功耗的時鐘樹綜合技術(LP-CTS),這種技術利用最優化的時鐘門布局及克隆與反克隆等方法在確保了時鐘功率優化的同時可以滿足時序和物理目標的雙重需求,達到了更好的負載分配并將時鐘信號傳輸時間降到最小。

二、低功耗設計先進方法與物理實施

????????在低功耗設計的基本方法中,采用面積優化以降低功耗的方法已經成熟,多閾值電壓方法和門控時鐘方法節省功耗的效果比較有限。目前,節點效果更加顯著的、先進的低功耗設計方法包括:

  1. 多電源多電壓技術;
  2. 電源關斷與狀態保持電源門控技術;
  3. 動態電扭與頻率調節技術

????????從系統架構設計、功能驗證到物理實施過程,用傳統的分段設計方案會比較復雜,但如果運用CPF,整個設計流程將變得非常順暢并容易實現。

1、多電源多電壓技術

????????多電源多電壓(MSMV)是一種可以有效降低動態功耗的技術,不少文獻簡稱這種方法為多電壓。所謂多電源,是指不同的邏輯模塊處于不同的電源域中,由不同供電電源供電,包括邏輯和物理多電源供電和多電壓情況
????????物理布圖階段,在核心區創建相應的電壓域,每個電壓域中只包含屬于該電壓域的模塊或單元。此外,不同的電壓域中的邏輯要與相應的時序庫對應,在時序分析、功耗分析和優化過程中正確選擇相應電壓域的單元庫。如下圖所示:

????????MSMV的布線與單一電壓布線不同,由于存在多個電壓域,應當保證同一電壓域內單元之間的互連線保持在當前的同一電壓域內,并保證不同電壓域之間的互連線不要跨越第三方電壓域,避免不同電壓域之間的影響。如下圖所示

????????多電壓技術的采用使得電路中的某些模塊工作于較低電壓,它們更容易受到電壓降的影響,從而引起時序違例。?對于靜態電壓降效應的解決方法是改進優化電源網絡。對于動態電壓降效應的解決方法是在電源和地線之間插入去耦電容(decoupling capacitance)。當某一瞬態電路中局
部地區大量單元同時發生信號翻轉,極短的時間內引起充放電流增大,導致電源軌道電壓下降,這時去耦電容將為附近的單元提供額外的電流,以減小電源軌道上的電壓降,從而減輕動態電壓降效應對時序的影響。

????????MSMV 設計方法和電源關斷PSO 的物理實現需要使用兩種特別邏輯單元,它們分別是電平轉換單元(level shifter)隔離單元(isolation cell)?。

????????電平轉換單元不具有邏輯功能,它用于不同電壓值的電壓域PD(power domain)之間信號電平的轉換,通常有兩個供電電壓端口分別連接兩個不同電壓域的供電電壓。

????????隔離單元起不同電壓域之間的電位鉗制與隔離作用。

2、電源關斷(PSO)技術

????????電源關斷技術是降低泄漏功耗的最有效方法,其思想就是通過關斷芯片中暫時不需要的某個區域或者某個子模塊的供電電壓,從而達到減小功耗的目的,它的實現同樣需要引入電壓域的概念。

????????電源關斷思想聽起來較簡單,但實現起來并不那么容易,設計者必須考慮在何處加入門控電壓單元以及如何加入開關來實現關斷。實現對電路的開啟和關斷需要仔細規劃轉換周期電路,以防止電流過沖,避免電路損壞。要統一模擬電路在關斷電路時功耗節省,以及開啟電路時消耗的開關功耗。

????????首先讓我們來考慮可關斷電壓域與常開電壓域。當可關斷電壓域關斷后,應當在其輸出端口插入隔離單元(isolation cell)。隔離單元與電平轉換單元一樣一般都放置在電壓域的邊界處。

????????有些電路設計會同時采用PSO與MSMV技術,這時兩個不同電壓值的電壓域之間不僅需要電平轉換單元而且需要隔離單元,因此有些標準單元庫會提供將這兩種功能組合在一起的單元。?由于不同電路模塊工作在多個電壓域中,在綜合時,MSMV技術的實現需要有相應庫單元的支持,它們通常都可以由標準單元庫供應商提供。進行邏輯綜合時,首先用CPF文檔定義不同電壓域的模塊所使用的工藝庫名稱,在綜合時,分別添加隔離單元和電平轉換,EDA工具會自動選擇定義的單元庫中的標準單元來實現邏輯綜合產生門級網表。

????????保持邏輯模塊處于實現快速喚醒的狀態非常重要,它是指在關斷電源的周期中,將模塊的重要信息保存在存儲器中或使用狀態保持電源門控單元將寄存器數值予以保留。狀態保持電源門控是在原有主從寄存器的基礎上分別使所有主寄存器和從寄存器工作在不同電壓下來實現的。因此PSO的實現需要除了用隔離單元以防止電源關斷后輸出信號的不確定性影響正常工作的電路模塊,還需要有狀態保持電源門控單元。

3、狀態保持電源門控SRPG技術

????????時鐘門控技術電源關斷技術都是建立在門控制或電壓門的基本原理上。通常有兩種結構的電壓門,一種稱為精細(fine-grain)結構,另一種稱為粗制(coarse-grain)結構。

????????精細結構的思想是在每個標準單元的電源/地和構成邏輯的晶體管間插入多余的晶體管,以切斷電路的泄漏電流。當然更多情況是每個標準單元中由一個晶體管構成電壓門。此外,為了使之能夠承受很大的電流沖擊需要調整門控晶體管的體積,如果門控晶體管設計得太大,不但會增大面積,緊縮布線資源,還加大了延遲,影響電路性能;如果太小,則會影響系統的抗噪聲性能,降低系統可靠性,甚至會導致電路根本無法工作。

????????狀態保持電源門控是一種特殊的寄存器,它屬于精細結構的一種衍生結構,它在傳統的主從寄存器基礎上做了一些改進。通常主觸發器(master FF)的供電電壓由精細結構的電壓門控制,連接正常的電壓值。從觸發器(slave FF)連接一常通的低供電電壓。當電壓關斷后數據被從觸發器保存起來,待重新上電正常工作后再恢復保存值

????????粗制結構門也稱為全局電壓門,它利用開關單元”控制整行標準單元電路與電源/地線軌道的連接,從而減小了每個單元的面積和多余的單元端口,但由于“開關單元”控制著整行單元電源地線的連接,所以其晶體管尺寸的選擇比較關鍵,通常開關單元晶體管的寬/長比較大,而且每行單元會采用緩沖鏈依次將其關閉和幵啟,以避免過沖電流燒毀芯片。

4、動態電壓與頻率調節技術

????????隨著近年來輕便型或微型電子設備功能和性能的不斷增強和提高,例如,手提電腦、個人數字助理和手機等對音頻、視頻和圖像的高品質處理能力,電池功耗能力依舊是一項局限,這就使得電源管理功耗技術得到更快的發展。動態電壓與頻率調節(DVFS,dynamic voltage frequency scaling)技術已經在微處理器低功耗設計方面,如在實時處理系統中得到更多的關注。DVFS方法也可以看成是MSV方法的一種擴展。

????????一個典型的DVFS系統的工作流程包括:對系統信號負載采樣,通過相應的算法進行性能計算預測,根據預測結果對電路工作狀態進行DVFS調整,再由電源管理系統實現狀態調節維護。DVFS的調整包括動態電壓調整和時鐘頻率調整,當預測工作頻率將由高到低變化時,先降低頻率,再降低電壓;當預測工作頻率升高時,先升高電壓,再升高頻率

? ? ? ? 基于硬件的DVFS系統要求每個任務必須在規定的時限內完成,否則視為無效操作。硬件實現一方面增強了負載計算的準確性,另一方面減輕了CPU用于負載跟蹤與性能預測的負擔,但硬件的弊端是缺乏對預測算法選擇的靈活性,電路主要的活動信號與空閑信號被采集后,送到硬件模塊進行性能預測,得到的結果與預先設置的門限進行比較,如果預測的性能需求高于上限,則請求調高頻率;如果預測性能低于下限,則請求降低頻率。這種請求作為一種中斷信號發給控制模塊設置相應的頻率和電壓。

????????DVFS技術在保持系統正常工作的前提下允許動態地調節電路工作電壓和頻率,不僅能夠減小電路的功耗而且延長了電路的使用壽命,目前它是低功耗技術中效益較高又尚未得到完全實施的一項先進技術。DVFS設計方法實現起來比較復雜,它需要在系統級通過架構算法,結合軟件和硬件技術達到要求。

5、襯底偏置技術

????????進入納米設計,泄漏電流對功耗的影響會更加顯著。在MTCMOS技術中,我們討論了通過選擇不同的閾值電壓的方案去降低靜態功耗。由于工藝參數(包括溝道長、溝道寬、絕緣層的厚度)帶來的誤差,使得MTCMOS技術在晶體管的“缺陷”測試分析變得復雜困難。相比之下,在CMOS中采用正向有源區(襯底)偏置(FBB,forward body bias)不僅可以降低泄漏電流,同時對工藝參數的誤差分析也較為簡單。

????????這種改變P區和n 區襯底偏置電壓的方案也稱作襯底偏置(substrate biasing)技術。

????????襯底偏置通過版圖實現有兩種方案:

  1. 一種為有源阱區(well-tap, body bias)偏置方式,它通常只需要布放在每一排標準單元的兩端或按照一定的間隔布放,它適用于不含well-tap的標準單元庫。其優點是節省面積,但易受閂鎖(latch up)的破壞。
  2. 另一種為標準單元內置(in-cell tap)偏置方式,每一個標準單元內部均帶有連接偏置電源的端口,它的優點是不會產生閂鎖效應,其缺點是單元面積大,布線比較困難。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/253693.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/253693.shtml
英文地址,請注明出處:http://en.pswp.cn/news/253693.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Eclipse里修改SVN的用戶名和密碼

刪除Eclipse subclipse plugin中記住的SVN用戶名密碼: 1) 查看你的Eclipse中使用的是什么SVN Interface windows > preference > Team > SVN #SVN Interface 2.)如果是用的JavaHL, 找到以下目錄并刪除auth目錄. 刪除C:\Users\…

Omap3530 的GPIO中斷設置

Omap3530 的GPIO中斷設置&#xff1a; 1.配置成GPIO&#xff0c;申請GPIO中斷 omap_cfg_reg(OMAP3_KBD_GPIO);配置成gpio if (gpio_request(OMAP3_KBD_GPIO, "kbd7279 IRQ") < 0) printk(KERN_ERR "Failed to request GPIO%d for kbd IRQ/n");//申請GPI…

H5項目開發分享——用Canvas合成文字

以前曾用Canvas合成、裁剪、圖片等《用H5中的Canvas等技術制作海報》。這次用Canvas來畫文字。 下圖中“老王考到駕照后”這幾個字是畫在Canvas上的&#xff0c;與在PS中打入的字非常接近&#xff0c;毫無違和感。 前面一段時間也在研讀JavaScript設計模式相關的知識&#xff0…

SQLServer約束介紹

約束定義 對于數據庫來說&#xff0c;基本表的完整性約束分為列級約束條件和表級約束條件&#xff1a; 列級約束條件 列級約束條件是對某一個特定列的約束&#xff0c;包含在列定義中&#xff0c;可以直接跟在該列的其他定義之后&#xff0c;用空格分隔&#xff0c;不用指定列名…

CMOS圖像傳感器——SNR計算

圖像質量評價在計算機視覺,人工智能,高清視頻傳輸上面有很廣泛的應用。目前,圖像質量評價主要分為三個方向,有參考圖像的質量評價,半參考的圖像質量評價,以及無參考的圖像質量評價。許多時候,我們利用CIS采集的RAW DATA本身就是含噪信號,因為我們往往不知道感興趣的像素…

Java this 關鍵字的用法

this 關鍵字的用法 this 在類中就是代表當前對象&#xff0c;可以通過 this 關鍵字完成當前 對象的成員屬性、成員方法和構造方法的調用。 那么何時用 this? 當在定義類中的方法時&#xff0c;如果需要調用該類對象&#xff0c;就可以用 this 來表示這個對象。也就是說&#x…

TMDS——最小化傳輸差分信號及其協議

過渡調制差分信號&#xff0c;也被稱為最小化傳輸差分信號&#xff0c;是指通過異或及異或非等邏輯算法將原始信號數據轉換成10位&#xff0c;前8為數據由原始信號經運算后獲得&#xff0c;第9位指示運算的方式&#xff0c;第10位用來對應直流平衡&#xff08;DC-balanced&…

順大勢逆小勢策略之代碼實現及可行性分析

閱讀原文&#xff1a;quant.la/Article/Vie… 前言 資產配置多元化是投資的唯一免費午餐 —— 馬克維茨。 在市場中有兩種策略&#xff1a;趨勢策略和震蕩策略。趨勢追蹤策略的特點在大行情的波動段找到有效的交易信號。而震蕩策略則是一種反趨勢策略&#xff0c;一波大幅上漲后…

數字圖像處理——中值濾波及其改進算法

一、算法介紹 中值濾波器是非線性濾波器的一個例子&#xff0c;它在保留圖像特征方面非常有效。 但是&#xff0c;濾波器的窗口大小直接影響中值濾波器的性能。 較小的窗口保留了特征&#xff0c;但會導致噪聲抑制的減少。 在較大窗口的情況下&#xff0c;噪聲抑制很高&#xf…

Spring整合web開發

正常整合Servlet和Spring沒有問題的 public class UserServlet extends HttpServlet {public void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {ApplicationContext applicationContext new ClassPathXmlApplica…

環信快速集成,以及實際集成中遇到的坑

一.pod集成遇到的問題 1.直接pod 安裝 pod EaseUI, :git > https://github.com/easemob/easeui-ios-hyphenate-cocoapods.git 在這個過程中&#xff0c;如果你pod已經安裝了sdwebimage&#xff0c;mjrefresh等他自身包含的三方&#xff0c;就需要在你的podfile里面把這個給刪…

PAFF 和MBAFF

PAFF 和MBAFF&#xff1a;當對隔行掃描圖像進行編碼時&#xff0c;每幀包括兩個場&#xff0c;由于兩個場之間存在較大的掃描間隔&#xff0c;這樣&#xff0c;對運動圖像來說&#xff0c;幀中相鄰兩行之間的空間相關性相對于逐行掃描時就會減小&#xff0c;因此這時對兩個場分…

Test435678

2345魚57洋炮456789轉載于:https://www.cnblogs.com/rhxuza1993/p/9534938.html

用NPOI從DataBase到Excel '2

NPOI的C# Helper代碼2 1 public static MemoryStream ExportXls(DataTable dt)2 {3 HSSFWorkbook wk new HSSFWorkbook();4 ISheet sheet null;5 6 string sheetName "Sheet1";7 if (!string.Is…

CMOS圖像傳感器——噪聲模型

由于CMOS圖像傳感噪聲的復雜性和不可控性,學者們一直在尋求一種能對其比較精確表的噪聲模型。在圖像降噪領域,為了降低算法設計的復雜度,人們普遍采用基于信道相關噪聲的模型(即加性噪聲),但其缺點就是不能精確地表示傳感器的噪聲。于是Hirakawa提出了一 種精確CMOS傳感器…

????TCp傳輸粘包問題

解決TCP網絡傳輸“粘包”問題 當前在網絡傳輸應用中&#xff0c;廣泛采用的是TCP/IP通信協議及其標準的socket應用開發編程接口&#xff08;API&#xff09;。TCP/IP傳輸層有兩個并列的協 議&#xff1a;TCP和UDP。其中TCP&#xff08;transport control protocol&#xff0c;傳…

AtomicIntegerArray和AtomicIntegerFieldUpdater

2019獨角獸企業重金招聘Python工程師標準>>> AtomicIntegerArray 對int數組中元素的操作不是原子性的&#xff0c;所以存在并發操作時&#xff0c;我們應該使用AtomicIntegerArray類來代替int數組。 下面是驗證演示代碼&#xff1a; public class AtomicIntegerArra…

CMOS圖像傳感器——高動態范圍

動態范圍是CMOS 圖像傳感器中很重要的一項評價指標。動態范圍指示了CMOS 圖像傳感器能夠在同一幀圖像中同時探測到的最大光強信號和最小光強信號的范圍。動態范圍通常用dB 形式來表示,其計算公式如下 其中Pmax 和Pmin 分別是最大非飽和光強與最小可探測光強。對于線性…

鍵盤綁定

1.理論: 從擊鍵到內核,前后的執行情況,之間沒有必然關聯 按鍵->csrss.exe->win32!RawInputThread->win32k!OpenDevice->ZwCreateFile->NtCreateFile->ntIopParseDevice->nt!IoGetAttachedDevice ->IoAllocateIrp->nt!ObCreateObject->nt!IopfCal…

《Linux內核設計與實現》讀書筆記(七)- 中斷處理

中斷處理一般不是純軟件來實現的&#xff0c;需要硬件的支持。通過對中斷的學習有助于更深入的了解系統的一些底層原理&#xff0c;特別是驅動程序的開發。 主要內容&#xff1a; 什么是中斷中斷類型中斷相關函數中斷處理機制中斷控制方法總結1. 什么是中斷 為了提高CPU和外圍硬…