深入理解model.eval()與torch.no_grad()

深入理解model.eval()與torch.no_grad()

web/2025/7/13 20:20:24/文章來源:https://blog.csdn.net/wtl1992/article/details/140331505

model.eval()

使用model.eval()切換到測試模式，不會更新模型的w（權重），b（偏置）參數
通知dropout層和batchnorm層在train和val中間進行切換：
- 在train模式，dropout層會按照設定的參數p設置保留激活單元的概率（保留概率=p，比如keep_prob=0.8），batchnorm層會繼續計算數據的mean和var并進行更新
- 在val模式下，dropout層會讓所有的激活單元都通過，而batchnorm層會停止計算和更新mean和var，直接使用在訓練階段已經學出的mean和var值
model.eval()不會影響各層的gradient計算行為，即gradient計算和存儲與training模式一樣，只是不進行反向傳播(backprobagation)

torch.no_grad()

用于停止autograd模塊的工作，起到加速和節省顯存的作用（具體行為就是停止gradient計算，從而節省了GPU算力和顯存）
不會影響dropout和batchnorm層的行為

model.eval()與torch.no_grad()可以同時用，更加節省GPU的算力

在val模式下，為什么讓dropout層所有的激活單元都通過，因為train階段的dropout層已經屏蔽掉了一些激活單元，在val模式下，讓所有的激活單元都通過還能預測數據嗎?
- 在val模式下，讓所有的激活單元都通過當然能預測數據了，相當于學習時限定你每次只能選擇一份資料學，考試時開卷所有資料你都帶著。val模式下，雖然讓所有的激活單元都通過，但是對于各個神經元的輸出，要乘上訓練時的刪除比例后再輸出。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/43599.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/43599.shtml
英文地址，請注明出處：http://en.pswp.cn/web/43599.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Idea 2023 使用GitLab提交代碼提示輸入Token

Idea 2023 使用GitLab提交代碼提示輸入Token

項目場景： 今天電腦換硬盤了，安裝了 IDEA2023 款的社區版開發工具，下載代碼后，提交并推送代碼到遠程服務器的時候，提示輸入Token，并不是用戶名和密碼。問題描述推送代碼到遠程GitLab本地倉庫的時候&…

閱讀更多...

單鏈表--續（C語言詳細版）

單鏈表--續（C語言詳細版）

2.6 在指定位置之前插入數據 // 在指定位置之前插入數據 void SLTInsert(SLTNode** pphead, SLTNode* pos, SLTDataType x); 分為兩種情況：1. 插入的數據在鏈表中間；2. 插入的數據在鏈表的前面。 // 在指定位置之前插入數據 void SLTInsert(SLTNode** …

閱讀更多...

AI繪畫何以突飛猛進? 從歷史到技術突破, 一文讀懂火爆的AI繪畫發展史

AI繪畫何以突飛猛進? 從歷史到技術突破, 一文讀懂火爆的AI繪畫發展史

前言自從前段時間偶然間被當下AI繪畫的水平震住之后（超越一切的AI作畫神器，和它創作的234個盔甲美女未來戰士） ，作者深感當今AI繪畫的飛速進展或許已遠超所有人的預期。而這里的前因后果，包括AI繪畫的歷史&#xff…

閱讀更多...

十九.升職加薪系列-JVM優化-解決JVM性能瓶頸的JIT即時編譯器

十九.升職加薪系列-JVM優化-解決JVM性能瓶頸的JIT即時編譯器

前言在很多年以前，做C或者C的程序員經常說Java語言的運行速度不如C或C，Java運行速度慢主要是因為它是解釋執行的，而C或C是編譯執行的，解釋執行需要通過JVM虛擬機將字節碼實時翻譯成機器碼（邊翻譯邊執行）&…

閱讀更多...

Rust 版本升級：rustup update stable 報錯

Rust 版本升級：rustup update stable 報錯

Rust 版本升級 rustup update stable 報錯一、報錯內容 error: could not download file from ‘https://static.rust-lang.org/dist/channel-rust-stable.toml.sha256’ to ‘/Users/xxx/.rustup/tmp/rv6vdfu3eupwo64m_file’: failed to make network request: error sendi…

閱讀更多...

【實戰場景】@Transactional中使用for update的注意點

【實戰場景】@Transactional中使用for update的注意點

【實戰場景】Transactional中使用for update的注意點開篇詞：干貨篇：知識回顧注意點1.鎖的范圍和粒度：2.事務的隔離級別：3.死鎖：4.性能影響：5.事務的邊界：6.異常處理：7. 數據庫和存儲…

閱讀更多...

【漏洞復現】網神 SecGate 3600 防火墻 sys_export_conf_local_save 任意文件讀取

【漏洞復現】網神 SecGate 3600 防火墻 sys_export_conf_local_save 任意文件讀取

免責聲明： 本文內容旨在提供有關特定漏洞或安全漏洞的信息，以幫助用戶更好地了解可能存在的風險。公布此類信息的目的在于促進網絡安全意識和技術進步，并非出于任何惡意目的。閱讀者應該明白，在利用本文提到的漏洞信息或進行相關測…

閱讀更多...

javaweb學習day5--《HTML篇》Springboot的模塊創建、HTML的相關知識點詳解

javaweb學習day5--《HTML篇》Springboot的模塊創建、HTML的相關知識點詳解

一、前言從今天開始，就要啟動后端的學習了，Springboot會貫穿到底，一定要跟著小編嚴謹的去搭建Springboot環境，依賴添加的過程可能需要2分鐘左右，讀者們要耐心等待一下，搭建好Springboot之后才算正式的開始…

閱讀更多...

算力革命：彈性租賃，解鎖無限可能

算力革命：彈性租賃，解鎖無限可能

華為創始人任正非曾在一場程序設計競賽中說道，我們即將進入第四次工業革命，基礎就是大算力。事實上，隨著5G、人工智能等信息技術的迅猛發展，算力需求持續增長，但高昂的成本和快速的技術迭代讓許多中小企業和個人開發者…

閱讀更多...

Covalent Network（CXT）通過社區投票將代幣遷移并更名為 CXT，以推動人工智能更深層次的創新

Covalent Network（CXT）通過社區投票將代幣遷移并更名為 CXT，以推動人工智能更深層次的創新

專注于人工智能和 Web3 的模塊化數據基礎設施 Covalent Network（CXT）宣布，其治理提案已通過社區投票并順利實施，即將原生代幣 CQT 遷移為新的 CXT 代幣，并部署至新的合約。這一關鍵性轉變標志著 Covalent Network&…

閱讀更多...

git刪除提交記錄，并使用idea將代碼重新提交到gitee倉庫

git刪除提交記錄，并使用idea將代碼重新提交到gitee倉庫

git 新建分支將之前的記錄刪除重新提交轉載鏈接 https://blog.csdn.net/qq_37142541/article/details/139860956

閱讀更多...

03-NoSQL之Redis配置與優化

03-NoSQL之Redis配置與優化

一、redis與memcache總體對比 1.性能 Redis：只使用單核，平均每一個核上Redis在存儲小數據時比Memcached性能更高。 Memcached：可以使用多核，而在100k以上的數據中，Memcached性能要高于Redis。 2.內存使用效率 MemC…

閱讀更多...

springboot文達辦公物資管理系統-計算機畢業設計源碼51191

springboot文達辦公物資管理系統-計算機畢業設計源碼51191

摘要本文介紹了一種名為"文達辦公物資管理系統"的基于JAVA語言、基于Springboot框架和MYSQL數據庫開發的管理系統。該系統主要分為管理員和員工用戶兩個角色，以滿足不同用戶的需求。對于管理員用戶，系統提供了儀器設備管理、設備借用管理、設…

閱讀更多...

【大數據技術】換新電腦了，如何快速遷移MySQL到新電腦上(含程序+數據)，這樣既快速又高效，省去了“各種安裝+各種配置+各種遷移數據”帶來的麻煩和時間

【大數據技術】換新電腦了，如何快速遷移MySQL到新電腦上(含程序+數據)，這樣既快速又高效，省去了“各種安裝+各種配置+各種遷移數據”帶來的麻煩和時間

【大數據技術】換新電腦了，如何快速遷移MySQL到新電腦上(含程序數據背景步驟總結背景很久沒有寫博文了哦，最近我換了新的筆記本,于是需要在新筆記本電腦上搭建MySQL環境，因為我原電腦上是安裝的MySQL解壓版，故我想偷偷懶&…

閱讀更多...

可理解性評估：使用Google Gemini優化語音識別的意義保留

可理解性評估：使用Google Gemini優化語音識別的意義保留

每周跟蹤AI熱點新聞動向和震撼發展想要探索生成式人工智能的前沿進展嗎？訂閱我們的簡報，深入解析最新的技術突破、實際應用案例和未來的趨勢。與全球數同行一同，從行業內部的深度分析和實用指南中受益。不要錯過這個機會，成為AI領…

閱讀更多...

nftables(5)表達式(3)PAYLOAD EXPRESSIONS

nftables(5)表達式(3)PAYLOAD EXPRESSIONS

PAYLOAD EXPRESSIONS Payload expressions在nftables中扮演著重要的角色，因為它們允許用戶定義復雜的規則，這些規則可以基于數據包的內容（即有效載荷）來過濾、修改或允許數據包通過。這些表達式可以執行諸如數據拷貝、比較、位操…

閱讀更多...

實驗1 —— 安全策略的練習

實驗1 —— 安全策略的練習

實驗拓撲圖實驗要求 1.DMZ區內的服務器，辦公區僅能在辦公時間內（9：00-18：00）可以訪問，生產區的設備全天可以訪問； 2.生產區不允許訪問互聯網，辦公區和游客區允許訪問互聯網 3.辦公區…

閱讀更多...

RabbitMQ保證消息被成功發送和消費

RabbitMQ保證消息被成功發送和消費

一 : 在使用 RabbitMQ 作為消息隊列時，保證消息被成功發送和消費是一個非常重要的問題。以下是一些關鍵點和最佳實踐，以確保消息的可靠傳輸和處理。* 配置方式: 保證消息被成功發送確認模式（Confirm Mode）：生產者可以…

閱讀更多...

在SpringBoot使用AOP防止接口重復提交

在SpringBoot使用AOP防止接口重復提交

前言防止接口重復提交有跟多種方法，可以在前端做處理。同樣在后端也能處理，而且后端的處理也有很多中方法。最先能想到的就是加鎖，也可以直接在該接口的實現過程中進行處理（可以參考防止數據重復提交的6種方法(超簡單)&#xff…

閱讀更多...

動手學Avalonia：基于硅基流動構建一個文生圖應用（一）

動手學Avalonia：基于硅基流動構建一個文生圖應用（一）

文生圖文生圖，全稱“文字生成圖像”（Text-to-Image），是一種AI技術，能夠根據給定的文本描述生成相應的圖像。這種技術利用深度學習模型，如生成對抗網絡（GANs）或變換器（T…

閱讀更多...

最新文章