激活函數-sigmoid、tanh、relu、softmax對比

激活函數是神經網絡的核心組件,用于引入非線性特性,使網絡能夠學習復雜模式。以下從定義、作用、分類及應用場景進行詳細解析:


🔍 ??一、定義??

激活函數(Activation Function)是作用于神經元輸出的??非線性函數??,其數學形式為:
輸出=f(加權輸入)
其中加權輸入通常為?w?x+b(w?為權重,x?為輸入,b?為偏置。
??核心目的??:若無激活函數,多層網絡等價于單層線性變換(如?y=W3?(W2?(W1?x+b1?)+b2?)+b3??仍是線性),無法處理圖像、語言等非線性任務。


?? ??二、作用??

  1. ??引入非線性??
    使神經網絡能夠逼近任意復雜函數,解決線性模型無法處理的模式(如分類邊界、特征交互)。
  2. ??控制輸出范圍??
    • Sigmoid 將輸出壓縮至?(0,1),適合概率輸出;
    • Tanh 輸出?(?1,1),零中心化利于梯度優化;
    • ReLU 過濾負值為?0,增強稀疏性和計算效率。
  3. ??優化訓練動態??
    • 緩解梯度消失(如 ReLU 的正區間梯度恒為?1);
    • 避免梯度爆炸(通過輸出范圍約束)。

📊 ??三、分類與常見類型??

根據梯度和輸出特性,激活函數可分為兩類:

??類型????特點????代表函數????典型應用場景??
??飽和函數??梯度隨輸入增大趨近于?0Sigmoid, Tanh二分類輸出層、RNN
??非飽和函數??梯度在部分區間恒定非零ReLU, Leaky ReLUCNN隱藏層、深層網絡
??1. 飽和激活函數??
  • ??Sigmoid??
    • 公式:
    • 優點:輸出?(0,1),適合概率建模;
    • 缺點:梯度消失、非零中心化導致收斂慢。
  • ??Tanh??
    • 公式:
    • 優點:輸出?(?1,1),零中心化加速收斂;
    • 缺點:梯度消失問題仍存在。
??2. 非飽和激活函數??
  • ??ReLU??
    • 公式:
    • 優點:計算高效,緩解梯度消失;
    • 缺點:負輸入導致“神經元死亡”。
  • ??Leaky ReLU??
    • 公式:
    • 優點:解決神經元死亡,保留負梯度信息。
  • ??Softmax??
    • 公式:
    • 特點:輸出概率分布,適用于多分類輸出層。

🎯 ??四、選型建議??

不同場景下的激活函數選擇:

??任務類型????推薦激活函數????原因??
二分類輸出層Sigmoid輸出概率符合?(0,1)?范圍
多分類輸出層Softmax輸出歸一化為概率分布
隱藏層(CNN/深度模型)ReLU/Leaky ReLU計算高效,緩解梯度消失
RNN/自編碼器Tanh零中心化平衡正負信號
GAN生成器輸出層Tanh輸出?(?1,1)?匹配像素范圍

??深層網絡優化??:優先使用 ReLU 變體(如 Leaky ReLU、Swish)避免梯度消失;

? ?資源受限場景??:選擇計算簡單的 ReLU,避免復雜函數如 GELU。

💎 ??總結??

激活函數通過非線性映射擴展了神經網絡的表達能力。??飽和函數(如 Sigmoid、Tanh)?? 適用于概率輸出和特定結構(如 RNN),但需警惕梯度消失;??非飽和函數(如 ReLU 及其變體)?? 憑借高效計算和梯度穩定性,成為深層網絡隱藏層的首選。選型時需結合任務需求、數據特性和網絡深度,實踐時可進行實驗驗證以確定最優方案。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/87340.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/87340.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/87340.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

三步走實現嵌入式硬件與軟件開發

目錄 ? 一、嵌入式硬件與軟件的邊界(為你后面每階段安排任務打基礎) ? 二、三階段開發策略規劃(以你的三步走為主線) ??階段1:確定能做 → 外包技術顧問協助選型 + 需求拆解 + 采購建議 適用角色 關鍵目標 如何管理? 工具推薦 ??階段2:會做一些 → 小范圍…

ubuntu運行cursor

一.CURSOR官網下載AppImage文件 https://www.cursor.com/en/download 二、解壓 AppImage 繞過掛載機制 解決:默認使用Cursor.AppImage 會自動掛載臨時目錄在/tmp目錄下,出現沒有權限掛載的報錯問題 若掛載點仍不可寫,直接解壓 AppImage 運…

PTA天梯賽L1 071-080題目解析

目錄 1.L1-071 前世檔案 2.L1-072 刮刮彩票 3.L1-073 人與神 4.L1-074 兩小時學完C語言 5.L1-075 強迫癥 6.L1-076 降價提醒機器人 7.L1-077 大笨鐘的心情 8.L1-078 吉老師的回歸 9.L1-079 天梯賽的善良 10.L1-080 乘法口訣數列 1.L1-071 前世檔案 解析:…

git常用操作 --- idea編譯器 --- 公司實戰版

前言 雖然git的命令方式很靈活,但是還是不夠人性化,不夠方便。 如果對git操作不熟練特別容易犯迷,可能敲一會命令就不知道當前在干什么了,下一步要干什么。 下面,我將演示在Java開發中使用最常用最經典的idea編譯器來進行git操作,非常人性化和方便。 如果沒有安裝git和初始…

window顯示驅動開發—流輸出階段

流輸出 (SO) 階段可以在這些頂點到達光柵器之前將頂點流式傳輸到內存。 流輸出的運行方式類似于管道中的點擊。 即使數據繼續向下流向光柵器,也可以打開此點擊。 通過流輸出發送的數據連接到緩沖區。 這些緩沖區可以在后續傳遞上作為管道輸入進行循環。 流輸出的一…

備份docker desktop中的opengauss數據庫

文章目錄 備份docker desktop中的opengauss數據庫一、前提條件二、備份步驟三、注意事項四、自動化備份(可選)五、驗證備份 備份docker desktop中的opengauss數據庫 ? 以下是在 Docker Desktop 中備份 OpenGauss 數據庫(以你的環境為例&…

實時中值濾波 + 低通濾波 示例程序(STM32環境)

一、功能概述 本示例實現兩個濾波器: 中值濾波器(Median Filter):對短期異常值(如尖峰噪聲)有良好的抑制能力;低通濾波器(Low-Pass Filter):對數據進行平滑…

AtCoder Beginner Contest 409 題解

本文為AtCoder Beginner Contest 409 的詳細題解 目錄 題目A: 題目大意: 解題思路: 代碼(C): 題目B: 題目大意: 解題思路: 代碼(C): 題目C: 題目大意: 解題思路: 代碼(C): 題目D: 題目大意: 解題思路: 代碼(C): 題目E: 題目大意: 解題思路: 代碼(C): 題目A…

Spring @Environment 典型用法

簡單說:Spring 里沒有直接叫 Environment 的注解,更準確說常用的是 Autowired 注入 Environment 對象,或者結合 Value 配合 Environment 讀取配置 。 支持從以下來源讀取: 1、application.properties / .yaml 2、JVM 參數&#xf…

【集合與結構體】5.2(課本題)總結代碼

ds老師產物&#xff0c;純為期末復習&#xff0c;自用。 題目1 編寫程序&#xff0c;將一個整型變量右移 4 位&#xff0c;并以二進制數形式輸出該整數在移位前和移位后的數值。 //觀察系統填補空缺的數位情況 代碼解答 #include <iostream>//編寫程序&#xff0c;將一個…

16.max/min最大最小值函數

1.基本使用 max/min函數返回滿足where條件的一列的最大/最小值。 select max(column_name)|min(column_name) from table_namewhere where_definition 示例&#xff1a; ①求班級總分的最高分 #求班級總分的最高分 SELECT MAX(math_scorechinese_scoreenglish_score)AS 總分…

需要做一款小程序,用來發券,后端如何進行設計能夠保證足夠安全?

溫馨提示&#xff1a;本文由ai生成&#xff0c;請辨別閱讀&#xff0c;本文僅提供一種思考的方式和設計思路 設計一個安全的后端系統&#xff0c;用于發放優惠券的小程序&#xff0c;需要考慮多個安全層面&#xff0c;包括身份驗證、數據安全、API 安全、以及防止常見攻擊&…

ACM設計平臺-核心模塊解析-趙家康

負責模塊解析-趙家康 一、Login.vue 功能邏輯、數據綁定、表單驗證、與后端交互 Vue 登錄頁面的代碼設計 代碼功能概覽 代碼實現了一個典型的登錄頁功能&#xff0c;核心包括&#xff1a; 表單輸入&#xff08;學號、用戶名、密碼、驗證碼&#xff09; 驗證碼生成與校驗 勾…

在 VMware (WM) 虛擬機上安裝的 Ubuntu 22.04 分配了 20GB 磁盤,但僅使用 10GB 就顯示 “空間已滿“

可能原因及解決方案 虛擬機磁盤未實際擴容&#xff08;僅調整了虛擬大小&#xff09; 現象&#xff1a;在 VMware 里調整了磁盤大小&#xff08;如 20GB → 50GB&#xff09;&#xff0c;但 Ubuntu 內部仍只識別 10GB。 原因&#xff1a;VMware 調整的是虛擬磁盤上限&#xf…

初學STM32全功能按鍵非阻塞式實現和強化

其實筆者以前學51的時候按鍵功能就包含非阻塞式的&#xff0c;而且還包括矩陣按鍵的非組塞式按鍵實現。開關的長短鍵功能筆者在之前的51博文中筆者自己嘗試寫過&#xff0c;功能是有了但寫的其實很混亂&#xff0c;幾乎沒有移植的價值。這次江科大剛好出了新的教程&#xff0c;…

【網絡原理】網絡原理簡單認識 —— 內含網絡通信基礎、五元組、網絡協議(OSI 七層協議、TCP/IP 五層(或四層)協議)、封裝和分用

目錄 1. 網絡互連 1.1 局域網LAN 1.2 廣域網WAN 2 網絡通信基礎 2.1 IP地址 2.2 端口號 2.3 網絡協議 3. 五元組 4. 協議分層 4.1 OSI 七層網絡模型 4.2 TCP/IP 五層&#xff08;或四層&#xff09;網絡模型 4.3 網絡設備所在分層(經典筆試題) 5. 網絡數據傳輸的基…

嵌入式之硬件學習(三)通信方式、串口通信

目錄 一、通信種類 1、并行通信 2、串行通信 3、單工模式(Simplex Communication) 4、半雙工通信(Half-Duplex Communication) 5、全雙工通信(Full-Duplex Communication) 6、串行的異步通信與同步通信 &#xff08;1&#xff09;異步通信 &#xff08;2&#xff09;同…

【微信小程序】3、SpringBoot整合WxJava發送訂閱消息

1、創建消息模板 在公共模板庫里面選擇符合自己業務場景的消息模板&#xff0c;例如&#xff1a; 每個消息模板最多選擇5項&#xff0c;可根據自己業務需求自行選擇&#xff0c;順序也可以自己決定。提交后&#xff0c;我們就得到了屬于自己的消息模板ID 2、文檔閱讀 官方文…

Flask 快速精通:從入門到實戰的輕量級 Web 框架指南

Flask 作為 Python 生態中最受歡迎的輕量級 Web 框架&#xff0c;以其簡潔靈活的設計理念贏得了開發者的青睞。本文將系統梳理 Flask 的核心概念與實戰技巧&#xff0c;幫助你快速掌握這一強大框架。 一、Flask 框架概述 1.1 輕量級框架的核心特性 Flask 誕生于 2010 年&…

Python爬取豆瓣短評并生成詞云分析

一、項目概述 本項目的目標是爬取豆瓣上某部電影的短評數據&#xff0c;并生成詞云進行情感分析。我們將使用Python編程語言&#xff0c;借助爬蟲技術獲取數據&#xff0c;并利用自然語言處理和數據可視化工具進行分析。具體步驟包括&#xff1a; 爬取豆瓣短評數據。數據清洗…