CNN的激活函數

CNN的激活函數

web/2025/9/6 15:49:58/文章來源:https://blog.csdn.net/2402_86344613/article/details/146207790

我們來對比 Sigmoid、Softmax 和 ReLU 這三種激活函數的相同點和不同點，并分別說明它們相較于其他兩種激活函數的優點。

相同點

都是非線性激活函數：
這三種激活函數都能為神經網絡引入非線性特性，使網絡能夠學習復雜的模式。
廣泛應用于深度學習：
它們都是深度學習中常用的激活函數，適用于不同的任務場景。
輸出值有范圍限制：
Sigmoid 和 Softmax 的輸出值被限制在特定范圍內（Sigmoid 是 [0, 1]，Softmax 的輸出和為 1），ReLU 的輸出是非負的（[0, +∞)）。

不同點

特性/函數	Sigmoid	Softmax	ReLU
輸出范圍	[0, 1]	每個輸出值在 [0, 1]，總和為 1	[0, +∞)
應用場景	二分類問題	多分類問題	多種任務，尤其是隱藏層
是否容易飽和	是（梯度消失）	是（梯度消失）	否（梯度不消失）
計算復雜度	中等（指數運算）	高（指數運算和歸一化）	低（線性運算）
是否引入稀疏性	否	否	是（輸出為0或正值）

各自的優點

1. Sigmoid 的優點

輸出為概率：輸出值在 [0, 1] 之間，可以解釋為概率，非常適合二分類問題。
簡單易實現：計算公式簡單，容易理解和實現。
相比 ReLU 的優點：Sigmoid 輸出是連續的，不會像 ReLU 那樣在負區間完全為零，因此在某些需要平滑輸出的場景中表現更好。
相比 Softmax 的優點：Sigmoid 可以用于二分類問題，而 Softmax 主要用于多分類問題。

2. Softmax 的優點

輸出為概率分布：輸出值在 [0, 1] 之間，且總和為 1，非常適合多分類問題。
多分類任務的自然選擇：能夠將模型的輸出解釋為每個類別的概率，便于理解和解釋。
相比 Sigmoid 的優點：Softmax 是多分類問題的自然選擇，而 Sigmoid 不能直接用于多分類。
相比 ReLU 的優點：Softmax 輸出是歸一化的概率分布，適用于分類任務，而 ReLU 更適合隱藏層的激活。

3. ReLU 的優點

計算效率高：ReLU 的計算簡單（線性函數），比 Sigmoid 和 Softmax 的指數運算更快。
緩解梯度消失問題：ReLU 在正區間梯度恒為 1，不會像 Sigmoid 和 Softmax 那樣出現梯度消失問題，適合深層網絡。
引入稀疏性：ReLU 的輸出要么為 0，要么為正值，能夠使網絡的激活更加稀疏，減少計算量。
相比 Sigmoid 的優點：ReLU 不容易飽和，梯度不會消失，適合深層網絡；計算效率更高。
相比 Softmax 的優點：ReLU 更適合隱藏層的激活，而 Softmax 主要用于輸出層的多分類任務。

總結

Sigmoid 和 Softmax 都輸出概率，但 Sigmoid 用于二分類，Softmax 用于多分類。
ReLU 是隱藏層的首選激活函數，因為它計算效率高且不容易飽和。
Sigmoid 和 Softmax 適合輸出層，而 ReLU 更適合隱藏層。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/72037.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/72037.shtml
英文地址，請注明出處：http://en.pswp.cn/web/72037.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Oracle數據恢復：閃回查詢

Oracle數據恢復：閃回查詢

Oracle數據恢復：閃回查詢 SQL語法閃回查詢：AS OF閃回版本查詢：VERSIONS BETWEEN數據恢復示例閃回查詢最佳實踐應用場景使用限制注意事項最佳實踐在誤刪除業務數據時，Oracle數據庫通常支持以下幾種數據恢復途徑。閃回查詢（Flashback Query）：閃回查詢通過查詢系統的UNDO數…

閱讀更多...

【MySQL篇】MySQL內置函數

【MySQL篇】MySQL內置函數

目錄 1，日期函數 2，字符串函數 3，數學函數 4，其他函數實戰OJ 1，日期函數日期類型在之前文章【數據類型】中有描述傳送門：【MySQL篇】數據類型_mysql 數據類型-CSDN博客函數名稱描述current_dat…

閱讀更多...

蘋果iOS 18.4將強制升級HomeKit架構，舊版設備或無法使用

蘋果iOS 18.4將強制升級HomeKit架構，舊版設備或無法使用

在科技飛速發展的當下，智能家居領域也在不斷革新。而蘋果公司作為科技行業的巨頭，其每一次動作都備受關注。近日，有消息稱蘋果計劃在iOS 18.4版本中停止對舊版HomeKit架構的支持，這一舉措意味著用戶將被迫升級，也可能對眾多使用Apple Home應用的智能家居設備用戶產生深遠影…

閱讀更多...

故障診斷——neo4j入門

故障診斷——neo4j入門

文章目錄 neo4jQuickStartDemo neo4j QuickStart 詳情可見博客：https://www.cnblogs.com/nhdlb/p/18703804，使用docker拉取最近的一個版本進行創建 docker run -it -d -p 7474:7474 -p 7687:7687 \ -v /disk5/neo4j_docker/data:/data \ -v /disk5/ne…

閱讀更多...

《蒼穹外賣》SpringBoot后端開發項目核心知識點與常見問題整理（DAY1 to DAY3）

《蒼穹外賣》SpringBoot后端開發項目核心知識點與常見問題整理（DAY1 to DAY3）

目錄一、在本地部署并啟動Nginx服務1. 解壓Nginx壓縮包2. 啟動Nginx服務3. 驗證Nginx是否啟動成功： 二、導入接口文檔1. 黑馬程序員提供的YApi平臺2. YApi Pro平臺3. 推薦工具：Apifox 三、Swagger1. 常用注解1.1 Api與ApiModel1.2 ApiModelProperty與Ap…

閱讀更多...

大模型安全新范式：DeepSeek一體機內容安全衛士發布

大模型安全新范式：DeepSeek一體機內容安全衛士發布

2月以來，DeepSeek一體機幾乎成為了政企市場AI消費的最強熱點。通過一體機的方式能夠縮短大模型部署周期，深度結合業務場景，降低中小企業對于大模型的使用門檻。據不完全統計，已約有超過60家企業基于DeepSeek推出一體機產品。但…

閱讀更多...

OpenHarmony-SELinux配置

OpenHarmony-SELinux配置

前言： OpenHarmony 上某個進程向samgr注冊SA服務，其他進程在與該進程進行IPC通信之前，需要獲取該SA服務，SA提供方需要為該SA配置SELinux標簽，否則該SA會被SELinux配置為u:object_r:default_service:s0標簽&#xff0c…

閱讀更多...

SQL開發中改善查詢性能的N種寫法

SQL開發中改善查詢性能的N種寫法

文章目錄 1. 使用 SELECT *2. 在 WHERE 子句中使用函數或計算3. 使用隱式類型轉換4. 不使用索引的列進行連接（JOIN）或過濾5. 使用 OR 代替 IN6. 在子查詢中使用 SELECT *7. 忽略索引統計信息8. 嵌套子查詢過多9. 過度使用 DISTINCT10. 使用不當的 JOIN 類…

閱讀更多...

第十八：go 并發 goroutine

第十八：go 并發 goroutine

channel 可以讓多個goroutine 之間實現通信 Add方法調用時機：必須在goroutine 啟動之前調用Add方法來增加計數器的值。如果在goroutine已經啟動之后再調用Add，可能會導致Wait方法提前返回，因為計數器沒有正確反映正在運行的goroutine的數量…

閱讀更多...

數字IC后端項目典型問題（2025.03.10數字后端項目問題記錄）

數字IC后端項目典型問題（2025.03.10數字后端項目問題記錄）

小編發現今天廣大學員發過來的問題都比較好，立即一頓輸出分享給大家（每天都有好多種類的數字后端問題）。后續可能會經常通過這種方式來做分享。其實很多問題都是實際后端項目中經常遇到的典型問題。希望通過這種方式的分享能夠幫助到更多需要…

閱讀更多...

課程《Deep Learning Specialization》

課程《Deep Learning Specialization》

在coursera上，Deep Learning Specialization 課程內容如下圖所示： Week2 assignment, Logistic Regression.

閱讀更多...

LLM推理和優化（1）：基本概念介紹

LLM推理和優化（1）：基本概念介紹

一、LLM推理的核心過程：自回歸生成 LLM（如DeepSeek、ChatGPT、LLaMA系列等）的推理本質是自回歸生成：從初始輸入（如[CLS]或用戶prompt）開始，逐token預測下一個詞，直到生成結束符&…

閱讀更多...

【從零開始學習計算機科學】編譯原理（一）編譯過程概述

【從零開始學習計算機科學】編譯原理（一）編譯過程概述

【從零開始學習計算機科學】編譯原理（一）編譯過程概述緒論編譯過程概述詞法分析語法分析代碼優化代碼生成其他功能編譯器的前端和后端緒論什么叫編譯程序？為什么我們需要編譯程序？編譯程序就是一個程序，將便于人編寫、閱讀、維護的高級計算機語言所寫作的源代碼程序，翻…

閱讀更多...

3-001：MySQL 中的回表是什么？

3-001：MySQL 中的回表是什么？

1. 什么是回表？ 回表（Back to Table） 指的是在使用非聚簇索引（輔助索引）查詢時，MySQL 需要先通過索引找到主鍵 ID，然后再回到主鍵索引（聚簇索引）查詢完整數據&#xf…

閱讀更多...

【AIGC】計算機視覺-YOLO系列家族

【AIGC】計算機視覺-YOLO系列家族

YOLO系列家族 （1）YOLO發展史（2） YOLOX（3） YOLOv6（4） YOLOv7（5） YOLOv8（6） YOLOv9（7）YOLOv10（8&…

閱讀更多...

基于Python懂車帝汽車數據分析平臺(源碼+lw+部署文檔+講解)，源碼可白嫖!

基于Python懂車帝汽車數據分析平臺(源碼+lw+部署文檔+講解)，源碼可白嫖!

摘要時代在飛速進步，每個行業都在努力發展現在先進技術，通過這些先進的技術來提高自己的水平和優勢，汽車數據分析平臺當然不能排除在外。本次我所開發的懂車帝汽車數據分析平臺是在實際應用和軟件工程的開發原理之上，運用Python…

閱讀更多...

Prompt 工程

Prompt 工程

一、提示原則 import openai import os import openai from dotenv import load_dotenv, find_dotenv from openai import OpenAI def get_openai_key():_ load_dotenv(find_dotenv())return os.environ[OPENAI_API_KEY]client OpenAI(api_keyget_openai_key(), # This is …

閱讀更多...

MySQL -- 數據庫基礎

MySQL -- 數據庫基礎

1、基礎登錄操作 mysql 指定選項選項： <1> -h 指定ip地址，即連接的主機，不帶時，默認連本機 <2> -P 指定的端口號，指定默認端口號（配置文件中進行配置） <3>-u 指定的用戶 &l…

閱讀更多...

02C#基本結構篇（D3_內部類-代碼塊-數據類型-變量-常量-字面量-運算符-流程控制語句）

02C#基本結構篇（D3_內部類-代碼塊-數據類型-變量-常量-字面量-運算符-流程控制語句）

目錄一、內部類 1. 定義內部類 2. 創建內部類的實例 3. 訪問外部類的私有成員 4. 內部靜態類 5. 使用場景和優點 6. 注意事項 ------------------------------------------- 二、代碼塊 1. 控制流語句 1.1. 條件語句 1> if 語句 2> switch 語句 1.2. 循環語…

閱讀更多...

15 | 定義簡潔架構 Store 層的數據類型

15 | 定義簡潔架構 Store 層的數據類型

提示： 所有體系課見專欄：Go 項目開發極速入門實戰課；歡迎加入云原生 AI 實戰星球，12 高質量體系課、20 高質量實戰項目助你在 AI 時代建立技術競爭力（聚焦于 Go、云原生、AI Infra）；本節課最終…

閱讀更多...

最新文章