減少內存占用的兩種方法|torch.no_grad和disable_torch_init

方法區別

在 PyTorch 中,disable_torch_inittorch.no_grad() 是兩種完全不同的機制,它們的作用和目的不同,以下是它們的區別:

1. disable_torch_init

  • 作用disable_torch_init 通常用于某些特定的框架或庫中,目的是禁用 PyTorch 的默認初始化邏輯。例如,在某些情況下,框架可能希望自定義模型參數的初始化方式,而不是使用 PyTorch 默認的初始化方法。
  • 顯存優化原理:禁用默認初始化可以減少初始化過程中不必要的顯存分配。例如,某些框架可能會在初始化時創建額外的臨時張量或執行復雜的初始化邏輯,這些操作可能會占用顯存。通過禁用這些默認初始化,可以節省這部分顯存。
  • 使用場景:通常用于框架內部的優化,或者在某些特定的模型加載或訓練準備階段。

2. torch.no_grad()

  • 作用torch.no_grad() 上下文管理器或裝飾器,用于禁用梯度計算。在 torch.no_grad() 的上下文內,所有張量操作都不會記錄梯度信息,也不會構建計算圖。
  • 顯存優化原理:在默認情況下,PyTorch 會為每個需要梯度的張量(requires_grad=True)保存中間結果,以便在反向傳播時計算梯度。這些中間結果會占用顯存。通過禁用梯度計算,torch.no_grad() 可以避免這些中間結果的存儲,從而顯著減少顯存占用。
  • 使用場景:主要用于模型的推理(inference)階段,或者在不需要計算梯度的場景中。例如,在模型評估、數據預處理、特征提取等場景中,torch.no_grad() 是常用的優化手段。

3. 具體區別

特性disable_torch_inittorch.no_grad()
作用范圍禁用模型參數的初始化邏輯禁用梯度計算和計算圖構建
顯存優化原理減少初始化過程中不必要的顯存分配避免存儲中間梯度和計算圖,減少顯存占用
使用場景模型加載或訓練準備階段模型推理、評估、數據預處理等
是否影響模型結構可能影響模型參數的初始化方式不影響模型結構,僅影響梯度計算
是否需要手動啟用需要框架或用戶顯式調用可通過上下文管理器或裝飾器顯式啟用

4. 總結

  • disable_torch_init 是一種針對模型初始化過程的優化機制,主要用于減少初始化階段的顯存占用。
  • torch.no_grad() 是一種禁用梯度計算的工具,主要用于推理階段,通過避免計算圖的構建和梯度存儲來減少顯存占用。

兩者雖然都可以減少顯存占用,但作用機制和使用場景完全不同。在實際應用中,torch.no_grad() 是更常用且更通用的顯存優化手段,而 disable_torch_init 更多是框架內部的優化策略。

(常見)在評估前@torch.no_grad()

源代碼:

class no_grad(_DecoratorContextManager):r"""Context-manager that disabled gradient calculation.Disabling gradient calculation is useful for inference, when you are surethat you will not call :meth:`Tensor.backward()`. It will reduce memoryconsumption for computations that would otherwise have `requires_grad=True`.In this mode, the result of every computation will have`requires_grad=False`, even when the inputs have `requires_grad=True`.This context manager is thread local; it will not affect computationin other threads.Also functions as a decorator. (Make sure to instantiate with parenthesis.).. note::No-grad is one of several mechanisms that can enable ordisable gradients locally see :ref:`locally-disable-grad-doc` formore information on how they compare... note::This API does not apply to :ref:`forward-mode AD <forward-mode-ad>`.If you want to disable forward AD for a computation, you can unpackyour dual tensors.Example::>>> # xdoctest: +SKIP>>> x = torch.tensor([1.], requires_grad=True)>>> with torch.no_grad():...     y = x * 2>>> y.requires_gradFalse>>> @torch.no_grad()... def doubler(x):...     return x * 2>>> z = doubler(x)>>> z.requires_gradFalse"""def __init__(self) -> None:if not torch._jit_internal.is_scripting():super().__init__()self.prev = Falsedef __enter__(self) -> None:self.prev = torch.is_grad_enabled()torch.set_grad_enabled(False)def __exit__(self, exc_type: Any, exc_value: Any, traceback: Any) -> None:torch.set_grad_enabled(self.prev)

(放在評估函數里面)disable_torch_init()

源代碼:

def disable_torch_init():"""Disable the redundant torch default initialization to accelerate model creation."""import torchsetattr(torch.nn.Linear, "reset_parameters", lambda self: None)setattr(torch.nn.LayerNorm, "reset_parameters", lambda self: None)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/896442.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/896442.shtml
英文地址,請注明出處:http://en.pswp.cn/news/896442.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

數據挖掘工程師的技術圖譜和學習路徑

數據挖掘工程師的技術圖譜和學習路徑: 1.基礎知識 數據挖掘工程師是負責從大量數據中發現潛在模式、趨勢和規律的專業人士。以下是數據挖掘工程師需要掌握的基礎知識: 數據庫知識:熟悉關系數據庫和非關系數據庫的基本概念和操作,掌握SQL語言。 統計學基礎:了解統計學的基…

UE5 Computer Shader學習筆記

首先這里是綁定.usf文件的路徑&#xff0c;并聲明是用聲明著色器 上面就是對應的usf文件路徑&#xff0c;在第一張圖進行鏈接 Shader Frequency 的作用 Shader Frequency 是 Unreal Engine 中用于描述著色器類型和其執行階段的分類。常見的 Shader Frequency 包括&#xff1a…

提示學習(Prompting)

提示學習&#xff08;Prompting&#xff09;是一種利用預訓練語言模型&#xff08;Pre-trained Language Models, PLMs&#xff09;來完成特定任務的方法。它的核心思想是通過設計特定的提示&#xff08;Prompt&#xff09;&#xff0c;將任務轉化為預訓練模型能夠理解的形式&a…

解決單元測試 mock final類報錯

文章目錄 前言解決單元測試 mock final類報錯1. 報錯原因2. 解決方案3. 示例demo4. 擴展 前言 如果您覺得有用的話&#xff0c;記得給博主點個贊&#xff0c;評論&#xff0c;收藏一鍵三連啊&#xff0c;寫作不易啊^ _ ^。 ??而且聽說點贊的人每天的運氣都不會太差&#xff0…

2025系統架構師(一考就過):案例之三:架構風格總結

軟件架構風格是描述某一特定應用領域中系統組織方式的慣用模式&#xff0c;按照軟件架構風格&#xff0c;物聯網系統屬于&#xff08; &#xff09;軟件架構風格。 A:層次型 B:事件系統 C:數據線 D:C2 答案&#xff1a;A 解析&#xff1a; 物聯網分為多個層次&#xff0…

數據如何安全“過橋”?分類分級與風險評估,守護數據流通安全

信息化高速發展&#xff0c;數據已成為企業的核心資產&#xff0c;驅動著業務決策、創新與市場競爭力。隨著數據開發利用不斷深入&#xff0c;常態化的數據流通不僅促進了信息的快速傳遞與共享&#xff0c;還能幫助企業快速響應市場變化&#xff0c;把握商業機遇&#xff0c;實…

Docker數據卷操作實戰

什么是數據卷 數據卷 是一個可供一個或多個容器使用的特殊目錄&#xff0c;它繞過 UFS&#xff0c;可以提供很多有用的特性: 數據卷 可以在容器之間共享和享用對 數據卷 的修改立馬生效對 數據卷 的更新&#xff0c;不會影響鏡像數據卷 默認會一直存在&#xff0c;即時容器被…

kafka stream對比flink

Kafka Streams 和 Apache Flink 雖然都支持實時計算&#xff0c;但它們的定位、架構和適用場景存在顯著差異。選擇哪一個取決于具體的需求、場景和技術棧。以下是兩者的核心區別和適用場景分析&#xff1a; 1. 定位與架構差異 Kafka Streams 定位&#xff1a;輕量級庫&#x…

二叉樹的先序、中序和后序 【刷題反思】

1. 已知中序和后序&#xff0c;求前序 1.1 題目 題目描述&#xff1a;給一棵二叉樹的中序和后序排列&#xff0c;求它的先序排列。 輸入描述&#xff1a;共兩行&#xff0c;均為大寫字母組成的字符串&#xff0c;分別表示一棵二叉樹的中序和后序 輸入&#xff1a;BADC BDCA…

華宇TAS應用中間件與統信最新版本操作系統完成兼容互認證

近日&#xff0c;華宇TAS應用中間件與統信服務器操作系統經過技術迭代與優化&#xff0c;在原先UOS V20的基礎上完成了UOS V25的兼容互認證。此次認證涵蓋了眾多主流的國產CPU平臺&#xff0c;包括鯤鵬920、飛騰FT2000/64、飛騰騰云S2500等。 經過嚴格測試&#xff0c;雙方產品…

Docker 搭建 Redis 數據庫

Docker 搭建 Redis 數據庫 前言一、準備工作二、創建 Redis 容器的目錄結構三、啟動 Redis 容器1. 通過 redis.conf 配置文件設置密碼2. 通過 Docker 命令中的 requirepass 參數設置密碼 四、Host 網絡模式與 Port 映射模式五、檢查 Redis 容器狀態六、訪問 Redis 服務總結 前言…

35. Spring Boot 2.1.3.RELEASE 應用監控【監控信息可視化】

在 Spring Boot 2.1.3.RELEASE 中實現監控信息可視化可以通過多種方式&#xff0c;下面為你詳細介紹使用 Spring Boot Actuator 結合 Grafana 和 Prometheus 以及使用 Spring Boot Admin 這兩種常見方法。 方法一&#xff1a;Spring Boot Actuator Grafana Prometheus 1. 添…

服務器間遷移conda環境

注意&#xff1a;可使用遷移miniconda文件 or 遷移yaml文件兩種方式&#xff0c;推薦前者&#xff0c;基本無bug&#xff01; 一、遷移miniconda文件&#xff1a; 拷貝舊機器的miniconda文件文件到新機器: 內網拷貝&#xff1a;scp -r mazhf192.168.1.233:~/miniconda3 ~/ 外…

在VSCode中安裝jupyter跑.ipynb格式文件

個人用vs用的較多&#xff0c;不習慣在瀏覽器單獨打開jupyter&#xff0c;看著不舒服&#xff0c;直接上教程。 1、在你的環境中pip install ipykernel 2、在vscode的插件中安裝jupyter擴展 3、安裝擴展后&#xff0c;打開一個ipynb文件&#xff0c;并且在頁面右上角配置內核 …

20250223下載并制作RTX2080Ti顯卡的顯存的測試工具mats

20250223下載并制作RTX2080Ti顯卡的顯存的測試工具mats 2025/2/23 23:23 緣起&#xff1a;我使用X99的主板&#xff0c;使用二手的RTX2080Ti顯卡【顯存22GB版本&#xff0c;準備學習AI的】 但是半年后發現看大碼率的視頻容易花屏&#xff0c;最初以為是WIN10經常更換顯卡/來回更…

WordPress R+L Carrier Edition sql注入漏洞復現(CVE-2024-13481)(附腳本)

免責申明: 本文所描述的漏洞及其復現步驟僅供網絡安全研究與教育目的使用。任何人不得將本文提供的信息用于非法目的或未經授權的系統測試。作者不對任何由于使用本文信息而導致的直接或間接損害承擔責任。如涉及侵權,請及時與我們聯系,我們將盡快處理并刪除相關內容。 0x0…

深入了解 NAT 模式:網絡地址轉換的奧秘

深入了解 NAT 模式&#xff1a;網絡地址轉換的奧秘 在計算機網絡的世界里&#xff0c;NAT 模式&#xff08;Network Address Translation&#xff0c;網絡地址轉換&#xff09;扮演著至關重要的角色。它就像是網絡中的翻譯官&#xff0c;在不同網絡地址之間進行轉換&#xff0…

Git版本控制系統---本地操作(萬字詳解!)

目錄 git基本配置 認識工作區、暫存區、版本庫 添加文件--情況一&#xff1a; 添加文件-情況二: 修改文件: 版本回退&#xff1a; git基本配置 1.初始化本地倉庫&#xff0c;注意&#xff1a;一定要在一個目錄下進行&#xff0c;一般都是新建一個文件夾&#xff0c;在文件…

Jupyter Notebook切換虛擬環境(Kernel管理)

我們在使用Jupyter Notebook的時候&#xff0c;打開文件發現只有一個Python3(ipykernel)&#xff0c;我們自己在conda中創建的虛擬環境為什么沒有顯示出來&#xff0c;今天我就來和大家一起討論一下&#xff01; 在 Jupyter Notebook 中&#xff0c;kernel 是執行代碼的核心。管…

【網絡安全】常見的web攻擊

1、SQL注入攻擊 定義&#xff1a; 攻擊者在HTTP請求中注入惡意的SQL代碼&#xff0c;當服務器利用參數構建SQL語句的時候&#xff0c;惡意的SQL代碼被一起構建,并在數據庫中執行。 示例&#xff1a; 用戶登錄&#xff1a; 輸入用戶名xx&#xff0c; 密碼 or 1 …