Pytorch基礎(八)——正則化

一、概念

正則化在深度學習領域是為了防止訓練結果過擬合而采取的一種方法。

1.1 過擬合

過擬合表示模型的泛化能力較差,體現在實際訓練模型上就是在訓練集表現很好,但是在測試集的效果一般。
過擬合的原因:1,模型過于復雜。2,參數過多。
除了正則化可以降低過擬合現象,Dropout、early stopping和數據增強等方法也可以達到相似效果。
在這里插入圖片描述

1.2 正則化(regularization)

正則化可以分為L1正則化、L2正則化,就是在損失函數中加上正則化項,對模型添加懲罰項,會減小模型的參數數值。
L1正則化:
在這里插入圖片描述L2正則化:
在這里插入圖片描述

二、Pytorch示例

pytorch中L2正則化的使用在優化器中的weight_decay(權值衰減)參數設置,這里以SGD優化器為例。根據官網,weight_decay是對所有參數進行正則化。

# weight_decay
optim = torch.optim.SGD(wzh.parameters(), lr=0.01, weight_decay=0.01)for epoch in range(100):running_loss = 0.0for data in dataloader:imgs, targets = dataoutputs = wzh(imgs)result = loss(outputs, targets)optim.zero_grad()result.backward()optim.step()running_loss = running_loss + resultprint(running_loss)

L1正則化需要自己定義函數。

三、參考文章

總結-深度學習中的正則化方法(regularization)
權重衰減(weight decay)與學習率衰減(learning rate decay)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/256184.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/256184.shtml
英文地址,請注明出處:http://en.pswp.cn/news/256184.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

uva 11997 K Smallest Sums 優先隊列處理多路歸并問題

題意&#xff1a;K個數組每組K個值&#xff0c;每次從一組中選一個&#xff0c;共K^k種&#xff0c;問前K個小的。 思路&#xff1a;優先隊列處理多路歸并&#xff0c;每個狀態含有K個元素。詳見劉汝佳算法指南。 1 #include<iostream>2 #include<cstdio>3 #includ…

.net生成隨機字符串

生成隨機字符串的工具類&#xff1a; /// <summary>/// 隨機字符串工具類/// </summary>public class RandomTools{/// <summary>/// 隨機系數/// </summary>public static int _RandIndex 0;#region 獲取某個區間的一個隨機數/// <summary>///…

【圖像處理】——Python鼠標框選ROI(感興趣)區域并且保存(含鼠標事件)

鼠標交互切割矩形 接下來,就是本文重點了。先吐個槽,網上有資源,但搜到的都是C++的。本來有點氣餒的,還好,有官網在,文檔寫得很清楚,而且接口函數名字變化不大,稍微做下修改就行了。 import cv2global img global point1, point2 def on_mouse(event, x, y, flags, pa…

c++ 11 override final

C 11添加了兩個繼承控制關鍵字&#xff1a;override和final。 override確保在派生類中聲明的重載函數跟基類的虛函數有相同的簽名。final阻止類的進一步派生和虛函數的進一步重載 出處&#xff1a;http://www.cnblogs.com/zhangdongsheng/ 作者&#xff1a;張東升

泛型方法與橋方法

Java泛型中有存在一種方式叫做類型擦除&#xff0c;也就是說泛型在編譯期間進行類型檢驗上做到有效安全&#xff0c;但是在運行當中&#xff0c;會將該泛型類型用頂層父類&#xff08;若無繼承關系則用Object&#xff09;代替&#xff0c;然后再進行強轉換成目標類型&#xff0…

Pytorch基礎(九)——損失函數

一、概念 損失函數在深度學習領域是用來計算搭建模型預測的輸出值和真實值之間的誤差。 具體實現過程&#xff1a;在一個批次&#xff08;batch&#xff09;前向傳播完成后&#xff0c;得到預測值&#xff0c;然后損失函數計算出預測值和真實值之間的差值&#xff0c;反向傳播…

用程序猿思維、程序設計師思維兩種方式寫求斐波那契數列的方法。

//用Java實現斐波那契數列(Fibonacci) public class Test {public int f(int n)//n代表第幾個數字。程序返回它相應的值{return n>2?f(n-1)f(n-2):1;//看似如此優雅的一句程序}//程序設計師的思維&#xff1a;會重構上面的代碼。讓他們更易讀。推薦&#xff01;&#xff01…

【圖像處理】——圖像的差集、并集、補集、交集以及兩個圖像相減出現負數的處理方法

目錄 目錄 1、交集 2、差集 3、并集 4、補集 5、差為負值,和超過255的解決辦法

Pytorch基礎(十)——優化器(SGD,Adagrad,RMSprop,Adam,LBFGS等)

一、概念 Pytorch中優化器的目的&#xff1a;將損失函數計算出的差值Loss減小。 優化過程&#xff1a;優化器計算網絡參數的梯度&#xff0c;然后使用一定的算法策略來對參數進行計算&#xff0c;用新的參數來重新進行訓練&#xff0c;最終降低Loss。 其中官網提供了13種優化算…

【圖像處理】——改變圖像的大小(降采樣重采樣)下采樣和上采樣

轉載自:https://jingyan.baidu.com/article/a3a3f81139be1f8da2eb8ade.html 上采樣、下采樣和金字塔加速參考:https://blog.csdn.net/Eastmount/article/details/89341077 目錄 1、拉伸圖片——重采樣 2、縮小圖片 1)三次插值法cv2.INTER_CUBIC

一段代碼到可執行程序所有經歷

如果你寫的代碼是hello.c&#xff0c;你的程序將經歷下面的步驟到達硬盤或者內存成為可執行文件。 第一步&#xff1a;hello.c&#xff08;文本&#xff09;經過預編譯生成hello.i&#xff08;文本&#xff09; 第二步&#xff1a;hello.i&#xff08;文本&#xff09;經過編譯…

js獲取url參數值

今天碰到要在一個頁面獲取另外一個頁面url傳過來的參數&#xff0c;一開始很本能的想到了用 split("?")這樣一步步的分解出需要的參數。 后來想了一下&#xff0c;肯定會有更加簡單的方法的&#xff01;所以在網上找到了兩個很又簡單實用的方法&#xff0c;mark下 方…

[PyCharm]unindent does not match any outer indentation level解決方法

轉載&#xff1a;https://www.jianshu.com/p/b34f30717eb2 問題出現原因 1、代碼前后縮進量不一致 2、tab和space混用&#xff08;如果一段代碼既使用space又使用tab進行縮進&#xff0c;會發生錯誤&#xff0c;這個時候PyCharm會自動進行判斷&#xff0c;根據設置的預先縮進…

為什么要選擇Apache Pulsar(二)

這是介紹Apache Pulsar關鍵特性系列文章的第二篇。Pulsar是由Yahoo開發并開源的下一代發布訂閱消息系統。在第一篇文章里&#xff0c;我們介紹了Pulsar對消息模型的靈活支持、多租戶、多地域復制和持久性。在這一篇文章里&#xff0c;我們將繼續介紹Pulsar的IO隔離機制、伸縮性…

Yolov5目標檢測模型運行遇到的相關問題匯總

一、yolov5-5.0常見錯誤 1. pycocotools工具包無法安裝 具體報錯如下&#xff1a; requirements: pycocotools>2.0 not found and is required by YOLOv5 pkg_resources.DistributionNotFound: The pycocotools>2.0 distribution was not found and is required by th…

PHP反射之類的反射

最近在琢磨如何用PHP實現站點的插件功能&#xff0c;需要用到反射&#xff0c;于是現學了一下&#xff0c;筆記如下&#xff1a; class Person {public $name Lily;public $gender male;public $age 20;public function eat(){echo Lily is eating!;}public function run(){…

數據結構(復習)--------關于平衡二叉樹(轉載)

在上一個專題中&#xff0c;我們在談論二叉查找樹的效率的時候。不同結構的二叉查找樹&#xff0c;查找效率有很大的不同&#xff08;單支樹結構的查找效率退化成了順序查找&#xff09;。如何解決這個問題呢&#xff1f;關鍵在于如何最大限度的減小樹的深度。正是基于這個想法…

mysql外鍵

效果 a,b,c 如果c設置到a的外鍵&#xff0c;那么只能在刪除c的記錄后&#xff0c;才能刪除a的記錄。 https://stackoverflow.com/questions/1905470/cannot-delete-or-update-a-parent-row-a-foreign-key-constraint-fails CREATE TABLE IF NOT EXISTS advertisers ( adverti…

C++總結筆記(一)—— 基礎知識匯總

很長時間沒有再復習C的基礎知識&#xff0c;現在將一些容易遺忘的知識點做一個簡單的匯總。 1、注釋 ??分為單行注釋和多行注釋 //cout<<endl;/*int i1;cout<<i<<endl;*/2、常量 ??宏常量&#xff1a;#define &#xff0c;宏常量沒有類型&#xff0c;…