激活函數總結(九):Softmax系列激活函數補充(Softmin、Softmax2d、Logsoftmax)

激活函數總結(九):Softmax系列激活函數補充

  • 1 引言
  • 2 激活函數
    • 2.1 Softmin激活函數
    • 2.2 Softmax2d激活函數
    • 2.3 Logsoftmax激活函數
  • 3. 總結

1 引言

在前面的文章中已經介紹了介紹了一系列激活函數 (SigmoidTanhReLULeaky ReLUPReLUSwishELUSELUGELUSoftmaxSoftplusMishMaxoutHardSigmoidHardTanhHardswishHardShrinkSoftShrinkTanhShrinkRReLUCELUReLU6GLUSwiGLUGTUBilinearReGLUGEGLU)。在這篇文章中,會接著上文提到的眾多激活函數繼續進行介紹,給大家帶來更多不常見的激活函數的介紹。這里放一張激活函數的機理圖:
在這里插入圖片描述

最后,對于文章中沒有提及到的激活函數,大家可以通過評論指出,作者會在后續的文章中進行添加補充。

2 激活函數

2.1 Softmin激活函數

Softmin(軟化最小值)是一種激活函數,類似于Soft在這里插入代碼片max 激活函數。它被用于多類別分類問題,通常作為神經網絡的輸出層的激活函數。與Softmax激活函數不同,Softmin激活函數將原始分數轉化為一個概率分布,但它的邏輯是選擇具有最小值的類別獲得較高的概率。Softmin 的計算公式如下:
S o f t m i n ( x i ) = e ? x i ∑ j = 1 N e ? x j Softmin(x_i) = \frac{e^{-x_i}}{\sum_{j=1}^{N} e^{-x_j}} Softmin(xi?)=j=1N?e?xj?e?xi??
在 Softmax 中,分數越高的類別獲得更高的概率,而在 Softmin 中,分數越低的類別獲得更高的概率。

特點:

  • 強調最小值:與Softmax激活函數不同,Softmin激活函數強調具有最小值的類別。在Softmax中,分數較高的類別獲得更高的概率,而在Softmin中,分數較低的類別獲得更高的概率。

Softmin可以在某些強調低分數類別的問題中有用,一般情況下均用Softmax。

2.2 Softmax2d激活函數

Softmax2D 激活函數是對二維矩陣(或張量)的操作,類似于一維數據中的 Softmax 激活函數,但是應用在矩陣的每一行上。這種操作常用于多類別分類任務,其中每一行代表一個樣本的原始分數或 logits,而每個列代表一個類別。Softmax2D 激活函數通過對每一行的原始分數進行 Softmax 運算,將其轉化為概率分布

在數學上,給定一個二維矩陣 X X X,其每一行包含原始分數(logits) x i j x_{ij} xij?,其中 i i i 是樣本索引, j j j 是類別索引,Softmax2D 激活函數可以表示為:
Softmax2D ( x i j ) = e x i j ∑ k = 1 C e x i k \text{Softmax2D}(x_{ij}) = \frac{e^{x_{ij}}}{\sum_{k=1}^{C} e^{x_{ik}}} Softmax2D(xij?)=k=1C?exik?exij??

其中, C C C 是總類別數, k k k 表示對每一行的求和。

Softmax2D 激活函數的應用場景類似于多類別分類問題,但其中每個樣本都有一個關聯的原始分數矩陣,需要將每行的原始分數轉化為概率分布以進行分類。這樣說有點抽象,下面給出具體的例子:

  • 圖像分類: 在圖像分類任務中,每個圖像可能屬于多個類別,例如圖像中可能包含多個物體。通過應用 Softmax2D
    激活函數,可以將每個圖像的原始分數轉化為關于每個類別的概率分布,從而實現多類別分類。
  • 目標檢測: 在目標檢測任務中,每個目標可能屬于不同的類別,并且每個圖像中可能存在多個目標。Softmax2D
    可以用于將每個檢測框(bounding box)的原始分數轉化為各個類別的概率,幫助判斷檢測框中所包含的物體。
  • 語音識別: 在語音識別任務中,每個語音片段可能對應多個語音標簽,如多個說話者的聲音。通過應用 Softmax2D
    激活函數,可以將語音片段的原始分數轉化為與每個說話者相關的概率分布。
  • 多標簽分類: 一些問題中,一個輸入可能對應于多個標簽,而不僅僅是單個類別。Softmax2D
    可以用于將輸入的原始分數映射到每個標簽的概率分布,以實現多標簽分類。
  • 文本分類: 在文本分類中,一篇文章可能屬于多個主題或類別。通過將文章的原始分數應用 Softmax2D
    激活函數,可以將其轉化為關于每個主題的概率分布,實現多類別文本分類。

2.3 Logsoftmax激活函數

LogSoftmax(對數軟最大值)是一種常用的激活函數,通常用于多類別分類問題中神經網絡的輸出層。它將輸入的原始分數(logits)轉化為對數概率分布,以便更好地處理數值穩定性和訓練的問題。LogSoftmax 激活函數的計算方式如下:
LogSoftmax ( x i ) = log ? ( e x i ∑ j = 1 N e x j ) \text{LogSoftmax}(x_i) = \log\left(\frac{e^{x_i}}{\sum_{j=1}^{N} e^{x_j}}\right) LogSoftmax(xi?)=log(j=1N?exj?exi??)
其中, x i x_i xi? 是第 i i i 個類別的原始分數, N N N 是總類別數。

優點:

  • 數值穩定性: LogSoftmax能夠穩定處理輸入的數值范圍,避免了指數函數可能導致的數值溢出問題,尤其在輸入的原始分數較大的情況下。
  • 計算效率: 由于LogSoftmax在計算中包含對數操作,而對數計算通常比指數計算更為高效,尤其在計算機中。
  • 數學性質: LogSoftmax的輸出也是對數概率,有時可以在數學分析和處理中更加方便

缺點:

  • 不直接表示概率: LogSoftmax輸出的是對數概率,如果需要獲得實際的概率分布,還需要進一步計算指數操作,這可能增加計算復雜性
  • 不適用于所有情況:盡管LogSoftmax在訓練中能夠穩定計算,但它在一些情況下可能并不是最優選擇,特別是在需要實際概率分布或對輸出進行進一步處理時。

當前,Logsoftmax函數計算速度快優化效率高,確實取得了一定的優勢!!!但是大多數情況下,還是Softmax激活函數占據一定的趨勢!!!但是,Logsoftmax算是一個常用的激活函數,如果效果不好的時候可以嘗試一下!!!

3. 總結

到此,使用 激活函數總結(九) 已經介紹完畢了!!! 如果有什么疑問歡迎在評論區提出,對于共性問題可能會后續添加到文章介紹中。如果存在沒有提及的激活函數也可以在評論區提出,后續會對其進行添加!!!!

如果覺得這篇文章對你有用,記得點贊、收藏并分享給你的小伙伴們哦😄。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/37607.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/37607.shtml
英文地址,請注明出處:http://en.pswp.cn/news/37607.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

React+Typescript清理項目環境

上文 創建一個 ReactTypescript 項目 我們創建出了一個 React配合Ts開發的項目環境 那么 本文 我們先將環境清理感覺 方便后續開發 我們先來聊一下React的一個目錄結構 跟我們之前開發的React項目還是有一些區別 public 主要是存放一些靜態資源文件 例如 html 圖片 icon之類的 …

響應式設計是什么?怎么學習? - 易智編譯EaseEditing

響應式設計是一種用于創建能夠適應不同設備和屏幕尺寸的網站和應用程序的設計方法。它的目標是確保網站在各種設備上都能提供良好的用戶體驗,無論是在大屏幕的桌面電腦上還是在小屏幕的移動設備上。 在響應式設計中,頁面的布局、字體、圖像和其他元素會…

【yml文件的解釋】

目錄 一、yml的簡介二、手寫yml文件進行配置三、使用yaml格式導出生成模板四、deployment.yaml文件詳解五、Pod yaml文件詳解六、Service yaml文件詳解 一、yml的簡介 Kubernetes 支持 YAML 和 JSON 格式管理資源對象 JSON 格式:主要用于 api 接口之間消息的傳遞 Y…

路由器和交換機的區別

交換機和路由器的區別 交換機實現局域網內點對點通信,路由器實現收集發散,相當于一個獵頭實現的中介的功能 路由器屬于網絡層,可以處理TCP/IP協議,通過IP地址尋址;交換機屬于中繼層,通過MAC地址尋址(列表)…

護眼燈值不值得買?什么護眼燈對眼睛好

想要選好護眼臺燈首先我們要知道什么是護眼臺燈,大的方向來看,護眼臺燈就是可以保護視力的臺燈,深入些講就是具備讓燈發出接近自然光特性的光線,同時光線不會傷害人眼而出現造成眼部不適甚至是視力降低的照明設備。 從細節上看就…

【數據結構】二叉樹篇|『構造二叉樹』刷題

博主簡介:努力學習的22級計算機科學與技術本科生一枚🌸博主主頁: 是瑤瑤子啦每日一言🌼: 所謂自由,不是隨心所欲,而是自我主宰。——康德 目錄 一、前言二、刷題1、最大二叉樹2、從前序與中序遍歷序列構造二…

怎么使用手機遠程控制Win10電腦?

可以使用手機遠程控制電腦嗎? “近期,我將出差一段時間。問題是,我希望能夠從很遠的地方瀏覽家里電腦上的一些東西,但我不會一直隨身攜帶笨重的筆記本電腦。我可以手機遠程訪問Windows電腦嗎? ” 當然&am…

SpringBoot請求響應

簡單參數 1. 原始方式獲取請求參數 Controller方法形參中聲明httpServletRequest對象 調用對象的getParameter參數名 RestController public class RequestController {RequestMapping("/simpleParam")public String simpleParam(HttpServletRequest request){Strin…

Pytorch源碼搜索與分析

PyTorch的的代碼主要由C10、ATen、torch三大部分組成的。其中: C10 C10,來自于Caffe Tensor Library的縮寫。這里存放的都是最基礎的Tensor庫的代碼,可以運行在服務端和移動端。PyTorch目前正在將代碼從ATen/core目錄下遷移到C10中。C10的代…

12-數據結構-數組、矩陣、廣義表

數組、矩陣、廣義表 目錄 數組、矩陣、廣義表 一、數組 二.矩陣 三、廣義表 一、數組 這一章節理解基本概念即可。數組要看清其實下標是多少,并且二維數組,存取數據,要先看清楚是按照行存還是按列存,按行則是正常一行一行的去讀…

學習Vue:slot使用

在Vue.js中,組件高級特性之一是插槽(Slots)。插槽允許您在父組件中插入內容到子組件的特定位置,從而實現更靈活的組件復用和布局控制。本文將詳細介紹插槽的使用方法和優勢。 什么是插槽? 插槽是一種讓父組件可以向子…

AIF360入門教學

1、AIF360簡介 AI Fairness 360 工具包(AIF360)是一個開源軟件工具包,可以幫助檢測和緩解整個AI應用程序生命周期中機器學習模型中的偏見。在整個機器學習的過程中,偏見可能存在于初始訓練數據、創建分類器的算法或分類器所做的預測中。AI Fairness 360…

OPENCV C++(十一)

鼠標響應函數 //鼠標響應函數 void on_mouse(int EVENT, int x, int y, int flags, void* userdata) {Mat hh;hh *(Mat*)userdata;switch (EVENT){case EVENT_LBUTTONDOWN:{vP.x x;vP.y y;drawMarker(hh, vP, Scalar(255, 255, 255));//circle(hh, vP, 4, cvScalar(255, 255…

人工智能在監控系統中的預測與優化:提升效率和響應能力

引言:人工智能的發展給監控系統帶來了新的可能性,通過分析歷史監控數據和其他相關數據,人工智能可以預測未來可能發生的事件,如交通擁堵、安全隱患等,并幫助優化監控系統的配置和資源分配。這種預測和優化的能力可以提…

2023年國賽數學建模思路 - 復盤:校園消費行為分析

文章目錄 0 賽題思路1 賽題背景2 分析目標3 數據說明4 數據預處理5 數據分析5.1 食堂就餐行為分析5.2 學生消費行為分析 建模資料 0 賽題思路 (賽題出來以后第一時間在CSDN分享) https://blog.csdn.net/dc_sinor?typeblog 1 賽題背景 校園一卡通是集…

vue3表格,編輯案例

index.vue <script setup> import { onMounted, ref } from "vue"; import Edit from "./components/Edit.vue"; import axios from "axios";// TODO: 列表渲染 const list ref([]); const getList async () > {const res await ax…

6.2.0在線編輯:GrapeCity Documents for Word (GcWord) Crack

GrapeCity Word 文檔 (GcWord) 支持 Office Math 函數以及轉換為 MathML GcWord 現在支持在 Word 文檔中創建和編輯 Office Math 內容。GcWord 中的 OMath 支持包括完整的 API&#xff0c;可處理科學、數學和通用 Word 文檔中廣泛使用的數學符號、公式和方程。以下是通過 OMa…

無法在 macOS Ventura 上啟動 Multipass

異常信息 ? ~ sudo multipass authenticate Please enter passphrase: authenticate failed: Passphrase is not set. Please multipass set local.passphrase with a trusted client. ? ~ multipass set local.passphrase Please enter passphrase: Please re-enter…

大語言模型LLM的一些點

LLM發展史 GPT模型是一種自然語言處理模型,使用Transformer來預測下一個單詞的概率分布,通過訓練在大型文本語料庫上學習到的語言模式來生成自然語言文本。 GPT-1(117億參數),GPT-1有一定的泛化能力。能夠用于和監督任務無關的任務中。GPT-2(15億參數),在生成方面表現出很…

vue自定義指令--動態參數綁定

在企業微信側邊欄應用中&#xff0c;給dialog添加了拖拽功能&#xff0c;但是因為dialog高度超過了頁面高度&#xff0c;所以高度100%時拖拽有個bug--自動貼到窗口頂部而且企業側邊欄寬高都有限制&#xff0c;拖拽效果并不理想&#xff0c;所以就想縮小dialog再進行拖拽。 拖拽…