機器學習中目標函數、損失函數以及正則項的通俗解釋

  • 目錄:
    • 前言:
    • 1、什么是目標函數?
    • 2、損失函數
    • 3、正則化
    • 總結:

目錄:

前言:

今天看到一篇很精簡的文章來說明目標函數、損失函數以及正則項是什么。以下是文章正文。
轉自:https://xiaozhuanlan.com/topic/7504682391

1、什么是目標函數?

定義是:指所關心的目標與相關的因素的函數關系。舉個例子,假如我們想要預測公司樓下手抓餅店明天能賣多少張手抓餅,已知過去10天每天賣多少,以及每天的天氣情況,是否有節假日,和手抓餅店老板和老板娘的感情狀況,這幾項數據都統計好了。對應到目標函數的解釋就是:

  1. 關心的目標是明天能賣多少手抓餅,未知量。
  2. 相關因素是每天數量,天氣情況,節假日,老板老板娘感情狀況,已知量。
  3. 目標函數:按照一定的思路把這些已知條件利用起來,去求解未知量的函數關系式。

2、損失函數

也叫代價函數,是同一個東西是用來評估模型的預測值f(x)與真實值Y的差距,它是一個非負實值函數。稍等一下,為什么是非負的呢?舉個例子:比如上面說的手抓餅,模型預測第一天是30,真實值是29,差距30-29是1;預測第二天是35,真實值是36,差距35-36是-1;如果把它們直接加起來就是1-1 = 0,難到沒有差距?非常明顯是錯誤的,差距是0人家還以為都預測對了呢,其實都預測錯了,所以不能有負值,可以用絕對值,平方或者一些其它的數學運算。
常用的損失函數有:

  1. LR邏輯回歸:log對數損失函數 參考:
    https://xiaozhuanlan.com/topic/7491865230
  2. 最小二乘法:平方損失函數 參考:
    https://xiaozhuanlan.com/topic/3129560874
  3. Adaboost:指數損失函數

好的,現在我們再來看一下目標函數通常的定義形式:

  • Obj(Θ)=L(Θ)+Ω(Θ)

中文翻譯一下是 :

  • 目標函數 = 損失函數 + 正則項

目標函數和損失函數我們都理解了,那么正則項是干什么的呢?

3、正則化

回到我們前面舉的那個例子,如果第五天有個人中彩票了然后興奮的來買了1百張手抓餅,比幾天的量都多,很明顯這個情況會影響我們的模型訓練,這個情況就是過擬合。而加入正則項的目的就是使模型避免過擬合。
常用的有L1,L2正則化,很熟悉對不對,前面講過的線性代數中的L1,L2范數有些類似。其實本質是一樣的,在機器學習里叫正則化,線性代數叫范數,統計學里叫懲罰項。
機器學習里:L1使用的是絕對值距離,也叫曼哈頓距離,L2使用的是平方距離,也叫做歐式(Euclidean)距離
線性代數:L1 范數計算的是向量所有元素絕對值的和,L2 范數計算的是通常意義上的向量長度 參考:https://xiaozhuanlan.com/topic/4961780352

總結:

介紹了目標函數,損失函數和正則項的作用,優化損失函數使模型避免欠擬合使損失函數最小化,優化正則項使模型避免過擬合。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/456555.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/456555.shtml
英文地址,請注明出處:http://en.pswp.cn/news/456555.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Linux中的 硬鏈接ln和軟連接ln -s

文件都有文件名與數據,這在 Linux 上被分成兩個部分:用戶數據 (user data) 與元數據 (metadata)。用戶數據,即文件數據塊 (data block),數據塊是記錄文件真實內容的地方;而元數據則是文件的附加屬性,如文件…

干貨分享!DevExpressv16.2最新版演示示例等你來收!(上)

2019獨角獸企業重金招聘Python工程師標準>>> 為解決大家找資源難的問題,EVGET聯合DevExpress控件中文網盤點熱門的DevExpress資訊、Demo示例、版本升級及下載,以及各種教程推薦等。更多下載及資訊也可以在DevExpress控件中文網中找到&#xf…

一文看懂哈夫曼樹與哈夫曼編碼

轉自:http://www.cnblogs.com/Jezze/archive/2011/12/23/2299884.html 在一般的數據結構的書中,樹的那章后面,著者一般都會介紹一下哈夫曼(HUFFMAN)樹和哈夫曼編碼。哈夫曼編碼是哈夫曼樹的一個應用。哈夫曼編碼應用廣泛,如JPEG中…

解決:未能將管道連接到虛擬機: 所有的管道范例都在使用中。

虛擬機無端出現: VMware Workstation 無法連接到虛擬機。請確保您有權限運行該程序、訪問改程序使用的所有目錄以及訪問所有臨時文件目錄。未能將管道連接到虛擬機: 所有的管道范例都在使用中。 原因:Ubuntu開機慢到開不開,我就在任務管理器強制結束了…

tcpdf開發文檔(中文翻譯版)

2017年5月3日15:06:15 這個是英文翻譯版,我看過作者的文檔其實不太友善或者不方便閱讀,不如wiki方便 后面補充一些,結構性文檔翻譯 這是一部官方網站文檔,剩余大部分都是開發的時候和網絡總結來的 項目官網:https://t…

CCF推薦各種國際學術會議和期刊目錄

這是中國計算機學會推薦國際學術會議和期刊目錄2015年版本的內容, 主要羅列了國際上計算機相關的各個方向的頂級學術會議和期刊目錄(包含A、B、C三個等級)。 包含的方向有: 計算機體系結構/并行與分布計算/存儲系統計算機網絡網絡…

Linux基本操作【作業】

1.如何使用命令立即重啟linux操作系統? sudo reboot 2.如何查看/etc下的所有文件,并以列表格式顯示,并且顯示隱藏文件 cd /etc | ls -la 3.一次性創建 text/1/2/3/4 cd tmp mkdir -p text/1/2/3/4 (1&#xff…

開發日志_Jan.8.2017

這兩天繼續著手開發碰撞部分。 主要工作是寫碰撞類和運動線程類。碰撞主要在于算法,運動線程只要管理好就行了。 之前碰撞測試中(即還未添加完整碰撞算法時)遇到各種bug,疑似機器人和小球的定位點不明所造成的。昨天研究了下QT下的…

Nginx【學習筆記】

Nginx 1. nginx可以做什么? 可針對靜態資源高速高并發訪問及緩存。 可使用反向代理加速,并且可進行數據緩存。 具有簡單負載均衡、節點健康檢查和容錯功能。 支持遠程FastCGI服務的緩存加速。 支持FastCGI、Uwsgi、SCGI、Memcached Servers的加速和…

第四次作業類測試代碼+036+吳心怡

一、類圖 二、代碼 package application; public class Commission { /* * hp:耳機 80元 mpc:手機殼 10元 cpsp:手機貼膜 8元 */ public float calculate(String line) { int hp 0, mpc 0, cpsp 0; String[] input null; float money 0;…

LSI/LSA算法原理與實踐Demo

目錄:1、使用場景2、優缺點3、算法原理3.1、傳統向量空間模型的缺陷3.2、Latent Semantic Analysis (Latent Semantic Indexing)3.3、算法實例 4、文檔相似度的計算5、對應的實踐Demo 目錄: 1、使用場景 文本挖掘中,主題模型。聚類算法關注…

解決: ubuntu18.04沒有網絡直連

初次安裝ubuntu 18.04, 發現沒有網絡. 直接上我遇到的這個問題的解決方法 sudo service NetworkManager stop sudo rm /var/lib/NetworkManager/NetworkManager.state sudo service NetworkManager start 未能解決問題的方法有 修改/etc/netplan/*.yaml 修改/etc/NetworkMana…

Linux學習134 Unit 8

Unit8 ldap網絡帳號1.ldap是什么ldap目錄服務認證,和windows活動目錄類似,就是記錄數據的一種方式2.ldap客戶端所須軟件yum sssd krb5-workstation -y3.如何開啟ldap用戶認證authconfig-tui┌────────────────┤ Authentication Configu…

FastText原理總結

目錄:1、應用場景2、優缺點3、FastText的原理4、FastText詞向量與word2vec對比 目錄: 1、應用場景 fastText是一種Facebook AI Research在16年開源的一個文本分類器。 其特點就是fast。相對于其它文本分類模型,如SVM,Logistic …

解決 :sudo:/etc/sudoers 可被任何人寫

問題: sudo:sudo /etc/sudoers is world writable sudo:no valid sudoers sources found ,quitting sudo:unable to initialize policy plugin 解決方案: 方法一: 1.開機按shift或esc進入ubantu高級模式 再進行recovery模式 2.選擇root命令行模式 3.…

sqlserver數據庫類型對應Java中的數據類型

SQL Server 類型JDBC 類型 (java.sql.Types)Java 語言類型 bigint BIGINT long timestamp binary BINARY byte[] bit BIT boolean char CHAR String decimal money smallmoney DECIMAL java.math.BigDecimal float DOUBLE double int INTEGER int image v…

Doc2Bow簡介與實踐Demo

Doc2Bow是Gensim中封裝的一個方法,主要用于實現Bow模型,下面主要介紹下Bow模型。 1、BoW模型原理 Bag-of-words model (BoW model) 最早出現在自然語言處理(Natural Language Processing)和信息檢索(Information Ret…

linux nginx完全卸載

比較靠譜的解決辦法是: root權限下載命令行敲入如下命令: sudo rm -rf /etc/nginx/ sudo rm -rf /usr/sbin/nginx sudo rm /usr/share/man/man1/nginx.1.gz sudo apt-get remove nginx* 原理就是刪除關聯文件以及文件夾。

[LeetCode]Basic Calculator

題目:Basic Calculator 給定一個合法的運算表達式,該表達式中只包含數字、、-、 、(、)。 思路: 簡單思考不用看成加減兩種運算,直接看成加法,只不過由正負; 如何處理括號呢?因為只看成加法&…

SPOJ 694/705 后綴數組

思路&#xff1a; 論文題*n Σn-i-ht[i]1 就是結果 O(n)搞定~ //By SiriusRen #include <cstdio> #include <cstring> #include <algorithm> using namespace std; #define N 55555 int cases,n,cntA[N],cntB[N],A[N],B[N],rk[N],sa[N],tsa[N],ht[N]; char…