機器學習-面經(part3)

5. 正則化

5.0 手推L1,L2

5.1 什么是正則化,如何理解

        定義: 在損失函數后加上一個正則化項(懲罰項),其實就是常說的結構風險最小化策略,即損失函數 加上正則化。一般模型越復雜正則化值越大

        正則化項是用來對模型中某些參數進行約束,正則化的一般形式如下:

第一項是損失函數(經驗風險),第二項是正則化項

        公式可以看出,加上懲罰項后損失函數的值會增大,要想損失函數最小懲罰項的值要盡可能的小,模型參數就要盡可能的小,這樣就能減小模型參數,使得模型更加簡單。

5.3 L0 L1 L2正則化

        L0范數是指向量中非0的元素的個數。如果我們用L0范數來規則化一個參數矩陣W的話,就是希望W的大部分元素都是0。L0范數不連續,不可求導,很難優化求解(NP難問題)

        L1范數是指向量中各個元素絕對值之和。L1范數是L0范數的最優凸近似,而且它比L0范數要容易優化求解。

        L2范數是指向量各元素的平方和然后求平方根。我們讓L2范數的規則項 ||w||2 最小,可以使得W的每個元素都很小,都接近于0,但與L1范數不同,它不會讓它等于0,而是接近于0。

5.3 L1 L2正則化的區別

稀疏性:L1>L2。L1會趨向于產生少量的特征,而其他的特征都是0,而L2會選擇更多的特征,這些特征都會接近于0。Lasso在特征選擇時候非常有用,而Ridge就只是一種規則化而已。

魯棒性:L1>L2。魯棒性定義為對數據集中異常值的容忍力。L1 范數比L2范數更魯棒,原因相當明顯:從定義中可以看到,L2?范數取平方值,因此它以指數方式增加異常值的影響;L1范數只取絕對值,因此它會線性地考慮它們。

解的數量:L1多個,L2一個。

5.4 L1在0處不可導是怎么處理的

  •         坐標軸下降法是沿著坐標軸的方向,Eg: lasso回歸的損失函數是不可導的
  •         近端梯度下降(Proximal Algorithms)
  •         交替方向乘子法(ADMM)

5.5 L1正則化產生稀疏性的原因,以及稀疏矩陣

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/719086.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/719086.shtml
英文地址,請注明出處:http://en.pswp.cn/news/719086.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

固件和內核驅動

驅動折騰小記 很多人更新了內核,但是自己的外設依然沒有驅動,是因為僅僅更新內核是不夠的,還需要更新固件。 什么是固件? 在許多設備能夠與操作系統通信之前,它們必須首先使用設備制造商提供的“固件”進行初始化。…

實施工程師常遇技術問題

文章目錄 一、對與一個項目,你認為項目的里程碑有哪幾個?二、Tomcat服務器與Resin服務器的區別2.1、開發商和許可證:2.2、部署和配置:2.3、功能和擴展性:2.4、社區和生態系統: 三、版本控制工具SVN與Git的區…

升級openssl

openssl版本一鍵升級(需要修改tar包名稱和路徑) --- - name: Install OpenSSLhosts: openssltasks:- name: Copy OpenSSL tar.gz to /tmpcopy:src: /root/shl/soft/openssl-1.1.1v.tar.gzdest: /tmp # remote_src: yes # 如果源文件在控制主機上…

吳恩達《機器學習》學習筆記

本筆記資料來源于 http://www.ai-start.com/ml2014/,該筆記來自于https://blog.csdn.net/dadapongi6/article/details/105668394,看了忘,忘了看,再看一遍。 時間統計:2024.2.29 5個番茄鐘,從week1開始&…

【PyTorch][chapter 19][李宏毅深度學習]【無監督學習][ GAN]【理論】

前言: 生成對抗網絡(Generative Adversarial Nets,GAN)是一種基于對抗學習的深度生成模型。 2014年,蒙特利爾博士 lan Goodfellow 發表了論文《Generative Adaversarial Networks》, 一經提出便成為了學術…

Python CGI編程

文章目錄 什么是CGICGI架構Web服務器支持及配置CGI程序示例CGI環境變量GET和POST方法GET方法POST方法區別注意事項 使用POST方法傳遞數據1. 創建HTML表單2. 編寫CGI腳本3. 配置服務器4. 提交表單5. 服務器處理請求注意事項 通過CGI程序傳遞checkbox數據創建HTML表單編寫CGI腳本…

二維碼門樓牌管理系統技術服務:門牌編設規則詳解

文章目錄 前言一、門牌編設規則解讀二、區間編號與分段編號策略三、多出入口建筑物的門牌編設 前言 隨著城市化的快速推進,門樓牌管理成為城市管理中不可或缺的一環。二維碼門樓牌管理系統的引入,不僅提升了管理的效率,也為市民提供了更為便…

波奇學Liunx:信號的產生,保存,處理

信號的產生,信號的保存,信號的處理 在操作系統中進程接受到信號會保存,產生 進程必須識別和能夠處理信號,處理信號是進程的內置功能 進程收到信號時不一定會立即執行,所以進程必然有一套識別,保存&#xff…

Leetcode 3066. Minimum Operations to Exceed Threshold Value II

Leetcode 3066. Minimum Operations to Exceed Threshold Value II 1. 解題思路2. 代碼實現 題目鏈接:Leetcode 3066. Minimum Operations to Exceed Threshold Value II 1. 解題思路 這一題的話只需要排序之后按照題目條件逐一進行執行直至滿足條件即可。 唯一…

Pytorch中,dim形象化的確切意義是什么?

在Pytorch中涉及張量的操作都會涉及“dim”的設置,雖然也理解個大差不差,但是偶爾還是有點犯迷糊,究其原因還是沒有形象化的理解。 首先,張量的維度排序是有固定順序的,0,1,2,.....…

(1)預處理

我們需要的文件結構如上 main.cpp add.h add.cpp add.h 這里使用riscv的工具鏈編譯為.i文件,需要使用-E,就是只進行預處理,我們可以得到兩個.i文件即main.i和add.i main.i 這里看到main.i里頭文件全部替換,然后多了三萬多行 所以…

Leetcode 3068. Find the Maximum Sum of Node Values

Leetcode 3068. Find the Maximum Sum of Node Values 1. 解題思路2. 代碼實現 題目鏈接:3068. Find the Maximum Sum of Node Values 1. 解題思路 這一題雖然標記為一道hard的題目,但其實就是一個腦筋急轉彎的題目。 我們只需要想明白一點即可&…

4G/5G執法記錄儀、智能安全帽走國標GB28181接入海康、宇視等大平臺,也可走平臺與平臺對接,以下級平臺級聯到上級大平臺

AIoT萬物智聯,智能安全帽生產廠家,執法記錄儀生產廠家,智能安全帽、智能頭盔、頭盔記錄儀、執法記錄儀、智能視頻分析/邊緣計算AI盒子、車載DVR/NVR、布控球、智能眼鏡、智能手電、無人機4G補傳系統等統一接入大型融合通信可視指揮調度平臺VM…

Vue3和ElementPlus封裝table組件

最近學習vue3.2并自己在寫一個項目,然后發現好幾個頁面都是列表頁,重復寫table和column也是覺得累,學習的項目列表頁不算多,要是公司項目就不一樣了,所以就想著自己封裝一個table組件,免去大量重復工作和co…

滑動窗口

題目 思路 對于一個數組區間的最值,可以開辟一個隊列記錄(當然這里不能叫隊列只是和隊列相似,習慣性叫法)。 每個區間的最值等于隊首元素。掃描數組時,如果該元素大于隊尾元素(取最大值時)將該隊尾元素出隊…

Effective C++ 學習筆記 條款07 為多態基類聲明virtual析構函數

有許多種做法可以記錄時間,因此,設計一個TimeKeeper base class和一些derived classes作為不同的計時方法很合理: class TimeKeeper { public:TimeKeeper();~TimeKeeper();// ... };class AtomicClock : public TimeKeeper { /* ... */ }; …

DM數據庫學習之路(二十)DM8基于主備集群技術的兩地三中心集群部署及測試(全網最詳細)

DM兩地三中心介紹 摘要 金融行業對數據的可靠性和連續性有著極其嚴格的要求,任何數據丟失或服務中斷都可能導致嚴重的經濟損失。針對這一問題,基于達夢主備集群技術的兩地三中心解決方案能夠切實有效解決業務數據的可靠性和連續性需求。該方案通過構建兩個數據中心和一個災備…

MyBatis標簽獲取數組或者集合長度的方法

1、判斷列表長度&#xff1a; <if test"list ! null and list.size() > 0">... </if> 可結合in條件使用&#xff1a;SELECT * FROM users<where><if test"idList ! null and idList.size() > 0">id IN<foreach item"…

leetcode熱題100學習計劃-鏈表-相交鏈表

思路 兩條鏈表長短不一&#xff0c;找公共交點必須先對齊。記錄兩個鏈表各自長度&#xff0c;長的向短的看齊&#xff0c;長的先走多出來的那么一截&#xff0c;之后兩者一起走&#xff0c;直到相遇或抵達末尾 代碼 /*** Definition for singly-linked list.* public class …

解密Lawnchair:打造個性化極致的Android桌面體驗

解密Lawnchair&#xff1a;打造個性化極致的Android桌面體驗 1. 簡介 Lawnchair是一款知名的Android桌面定制工具&#xff0c;旨在為用戶提供個性化極致的桌面體驗。作為一個開源項目&#xff0c;Lawnchair融合了簡潔、靈活和強大的特點&#xff0c;讓用戶能夠自由定制其Andro…