【深度學習】——激活函數(sigmoid、tanh、relu、softmax)

目錄

激活函數

1、作用

2、常用激活函數

3、衡量激活函數好壞的標準:

4、不同的激活函數

1)sigmoid

2)tanh函數

?3)RULE函數和leak-relu函數

4)softmax函數


激活函數

1、作用

如果只是線性卷積的話,會導致無法形成復雜的表達空間,因此需要激活函數來進行非線性映射,這樣可以得到更高語義的信息,提升整個神經網絡的表達能力。

2、常用激活函數

sigmoid、tanh、relu、softmax

3、衡量激活函數好壞的標準:

1)是否0-均值輸出:即是否關于零點中心對稱,這樣可以使得收斂加速(不太理解)

2)是否會出現梯度消失現象:梯度消失現象主要是因為在反向傳播時,由于鏈式求導原則,使得梯度從后一層傳到前一層會出現減小的情況,如果網絡深的話,傳播到前面時,梯度變成了0

以BP后向傳播為例,在求w11的導數時,若W1求值為[0,1],激活函數φ的導數小于1時會出現梯度消失

3)激活函數表達式是否會很復雜:若計算表達式出現冪運算、指數運算等,一般計算量都很大

4、不同的激活函數

1)sigmoid

sigmoid函數可以作為0-1二分類的分類器,也可以作為層數較少的神經網絡的激活函數

優缺點如下:

2)tanh函數

tanh函數適用于激活函數,相較于sigmoid函數做到了零均值輸出以及緩解了梯度消失

優缺點如下:

?3)RULE函數和leak-relu函數

RELU函數因為其在正空間為線性的緣故,因此適用于深度很深的神經網絡中,比如VGG16的實現。但是因為其在負空間直接將值置為0,導致導數為0,使得會出現參數不更新的情況,稱之為Dead ReLU Problem,基于此,出現了leak-rule函數,它是給了一個非常小的系數,使得在負空間的導數接近于零而不等于零,優缺點如下:

注意(個人理解):在大量的實驗種,發現relu函數會優于后者,原因可以是relu起到了一定的dropout的作用,可以有效地避免過擬合。因為relU在小于0的時候,梯度是0的,也就是有一部分神經元的參數是不會發生改變,所以這也相當于這部分神經元在訓練的時候被丟棄了,只有一部分神經元參與到了訓練當中。每次迭代都有不一樣的神經元的參數不發生改變,這樣的話就導致了多次訓練得到了不一樣的神經網絡結構,相當于dropout的作用。

區別在于:dropout方法隨即丟棄神經元,隨機性更強,而relu的話因為導數為0這部分主要是集中在負半區,使得每次迭代“丟棄”的神經元種有大部分其實是相同的,因此效果沒有直接用dropout來的好。

4)softmax函數

適用于多分類情景,是一個離散函數,輸入是每一類的得分,輸出是每一類的概率

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/255837.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/255837.shtml
英文地址,請注明出處:http://en.pswp.cn/news/255837.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

SDUT 3377 數據結構實驗之查找五:平方之哈希表

數據結構實驗之查找五:平方之哈希表 Time Limit: 400MS Memory Limit: 65536KBSubmit StatisticProblem Description 給定的一組無重復數據的正整數,根據給定的哈希函數建立其對應hash表,哈希函數是H(Key)Key%P,P是哈希表表長&…

我的2017年前端之路總結

原文首發于我的博客 年末了,趕著剛考完兩門考試,在最后4門考試來臨之前抽空寫一下今年的小結。 今年格外忙。忙完本科畢設,又馬上投入了研究生實驗室的搬磚生涯。跟去年一樣,列個今年的學習成果清單: 過去的一年 技術成…

對軟件工程的疑問

在大學時光中學習了算法編程后,我發現我對于源程序理解很差,我只會很低程度的寫代碼,但是基本描述不出來。所以我的編程很差,而且由于我很少打代碼,所以我的編程能力基本沒有多少提高,我也沒有發現該學什么…

【深度學習】——分類損失函數、回歸損失函數、交叉熵損失函數、均方差損失函數、損失函數曲線、

目錄 代碼 回歸問題的損失函數 分類問題的損失函數 1、 0-1損失 (zero-one loss) 2、Logistic loss 3、Hinge loss 4、指數損失(Exponential loss) 機器學習的損失函數 Cross Entropy Loss Function(交叉熵損失函數) 交叉熵優點 Mean Squared E…

伺服電機慣量問題

在伺服系統選型及調試中,常會碰到慣量問題。 其具體表現為:在伺服系統選型時,除考慮電機的扭矩和額定速度等等因素外,我們還需要先計算得知機械系統換算到電機軸的慣量,再根據機械的實際動作要求及加工件質量要求來…

【轉】應用架構一團糟?如何將單體應用改造為微服務

概述 將單體應用改造為微服務實際上是應用現代化的過程,這是開發者們在過去十年來一直在做的事情,所以已經有一些可以復用的經驗。 全部重寫是絕對不能用的策略,除非你要集中精力從頭構建一個基于微服務的應用。雖然聽起來很有吸引力&#xf…

Linux 解決ssh連接慢的問題

備份文件 cp /etc/ssh/sshd_config /etc/ssh/sshd_config.bak 編輯文件 vi /etc/ssh/sshd_config 輸入/ 查找GSSAPIAuthentication 設置如下 GSSAPIAuthentication no # 是否允許使用基于 GSSAPI 的用戶認證。默認值為"no"。僅用于SSH-2 詳細解釋 輸入/ 查找UseDNS …

ABB機器人與PC計算機控制口連接 超級終端 命令清單

條件: 9 針串口通信 RS232。 PC 啟動超級終端軟件。Windows -> Start -> Accessories -> Terminal 通信設置: 1. 波特率 9600 8 位2. 1 個停止位 沒有奇偶校驗3. 沒有 Modern 采用直接串口連接4. 使用 Xon/Xoff 通信形式當故障發生時&#xff0…

【Hibernate】Hibernate系列6之HQL查詢

HQL查詢 6.1、概述 6.2、分頁查詢 6.3、命名查詢 6.4、投影查詢-部分字段查詢 6.5、報表查詢 6.6、迫切左外連接、左外連接 6.7、迫切內連接、內連接 6.8、QBC查詢、本地查詢 轉載于:https://www.cnblogs.com/junneyang/p/5254641.html

【深度學習】——梯度下降優化算法(批量梯度下降、隨機梯度下降、小批量梯度下降、Momentum、Adam)

目錄 梯度 梯度下降 常用的梯度下降算法(BGD,SGD,MBGD) 梯度下降的詳細算法 算法過程 批量梯度下降法(Batch Gradient Descent) 隨機梯度下降法(Stochastic Gradient Descent&#xff09…

Javascript隱式轉換

亂想 javascript為什么需要隱式轉換?如果沒有會出現什么情況? 找了一圈沒有看到關于這個的討論,只好自己研究了,可能不一定正確,自行辨知。 郁悶就是郁悶在好好的,為什么要搞個隱式轉換,一般來講…

雙工位機器人 焊接夾具注意事項 o(╯□╰)o

焊接夾具設計注意事項 一套完美的夾具,需要機械設計人員正確的設計思想,良好的配件質量,鉗工負責認真的裝配質量,卡具在使用中不斷的修磨和改進,才會達到好的效果。 本人非機械設計,只是在使用焊接卡具過程中遇到了很多卡具設計上…

【公共類庫】加密解密

public static class MyEncryption{#region Md5加密/// <summary>/// 使用MD5加密/// </summary>/// <param name"str">需要加密的數據。</param>/// <param name"kind">加密類型&#xff1a;1-普通加密&#xff1b;2-密碼加…

使用JOTM實現分布式事務管理(多數據源)

使用spring和hibernate可以很方便的實現一個數據源的事務管理,但是如果需要同時對多個數據源進行事務控制,并且不想使用重量級容器提供的機制的話,可以使用JOTM達到目的. JOTM的配置十分簡單,spring已經內置了對JOTM的支持,一.<bean id"jotm" class"org.spri…

【機器學習】——《機器學習實戰》面試復習

目錄 一、機器學習概念 二、機器學習步驟 三、有監督學習 1、k-近鄰算法 核心思想 實例&#xff1a;手寫數字的識別 優缺點&#xff1a; 2、決策樹 相關概念 核心思想 一些小技巧 優缺點 3、神經網絡 4、SVM——支持向量機 核心思想 SVM和SVR的區別 ? 優缺點…

一鍵分享代碼

文章出處&#xff1a;http://share.baidu.com/code/advance 一、概述 百度分享代碼已升級到2.0&#xff0c;本頁將介紹新版百度分享的安裝配置方法&#xff0c;請點擊左側列表查看相關章節。 二、代碼結構 分享代碼可以分為三個部分&#xff1a;HTML、設置和js加載&#xff0c;…

ubuntu安裝LDAP

參考文獻&#xff1a; https://help.ubuntu.com/12.04/serverguide/openldap-server.html&#xff08;最主要的&#xff09; http://www.linuxidc.com/Linux/2011-08/40020.htm http://blog.chinaunix.net/uid-24276740-id-3360306.html 前言 在網上搜索ldap的安裝配置&#xf…

58.貪心算法練習:??最小新整數

總時間限制: 1000ms 內存限制: 65536kB 描述 給定一個十進制正整數n(0 < n < 1000000000)&#xff0c;每個數位上數字均不為0。n的位數為m。現在從m位中刪除k位(0< m)&#xff0c;求生成的新整數最小為多少&#xff1f;例如: n 9128456, k 2, 則生成的新整數最小…

ABB機器人之LOADDATA

ABB機器人之LOADDATA loaddata是用來描述連接到機器人機械接口的負載&#xff08;機器人的安裝法蘭&#xff09;。loaddata數據通常定義有效載荷或負荷&#xff08;通過指令gripload設置機器人抓手負載 或mechunitload指令設置變位機負載。loaddata通常也作為tooldata的一部分&…

【深度學習】——性能指標(ROC、MAP、AUC等)

目錄 一、分類任務性能指標 1、混淆矩陣 2、精確度ACCURACY 正確數/總數 3、查全率&#xff08;RECALL&#xff09;——真正正樣本中預測正確的比例 4、查準率&#xff08;precision&#xff09;——預測為正樣本中的預測正確的比例 5、F-score——對查準率和查全率進行結…