深度學習--激活函數

深度學習--激活函數

news/2025/8/5 1:25:44/文章來源:https://blog.csdn.net/fantasy_ARM9/article/details/147261581

激活函數通過計算加權和并加上偏置來確定神經元是否應該倍激活，它們將輸入信號轉換為輸出的可微運算。大多數激活函數都是非線性的，由于激活函數是深度學習的基礎，下面簡要介紹一些常見的激活函數。

1 RelU函數

最受歡迎的激活函數是修正線性單元，ReLU，因為它實現起來簡單，同時在各種高預測任務中表現良好。ReLU提供了一種非常簡單的非線性變化，給定元素x RelU函數倍定義為該元素與0中的最大值。

RelU(x) = max(x, 0);

通俗地說，RelU函數通過將相應的激活值設為0，僅僅保留正元素丟棄所有負元素。為了直觀感受一下，我們可以繪制出函數的曲線圖，正如從圖中所看到的，激活函數是分段呈線性的。

x = torch.arange(-8.0, 8.0, 0.1); requires_grad = true

y = torch.relu(x);

d2l.plot(x.detach(), y.detach(), 'x', 'relu(x)', figsize = (5, 2.5));

2 sigmoid激活函數

對于一個定義域在R上的輸入，sigmoid函數將輸入變換為區間(0,1) 上的輸出。因此，sigmoid 通常稱為擠壓函數，將范圍(-inf,inf)上的任意輸入壓縮到區間（0，1）上的某個值。

sigmoid(x) = 1/(1 + exp(-x))

sigmoid函數的導數是

d/dx sigmoid(x) = exp(-x) / (1 + exp(-x))^2 = sigmoid(x)(1 - sigmoid(x))

3 tanh函數

與sigmoid 函數類似，tanh(雙曲正切)函數也能將其輸入壓縮轉換到區間(-1,1)上，tanh函數如下

tanh(x) = 1 - exp(-2x) / 1 + exp(-2x)

下面我們繪制tanh函數的圖像，注意，當輸入在0附近時，tanh函數接近線性變換，函數的形狀類似于sigmoid函數，不同的是tanh函數關于坐標系原點中心對稱。

y = torch.tanh(x);

d2l.plot(x.detach(), t.detach(), 'x', 'tanh(x)', figsize = (5, 2.5));

tanh函數的導數是

d/dx tanh(x) = 1 - tanh^2(x)

tanh函數的導數的圖像如下所示，當輸入接近0時，tanh函數的導數接近最大值1，與我們在sigmoid函數的圖像中看到的類似，輸入在任一方向上越遠離0點，導數越接近0.

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/901519.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/901519.shtml
英文地址，請注明出處：http://en.pswp.cn/news/901519.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

深入解析 OrdinalEncoder 與 OneHotEncoder：核心區別與實戰應用

深入解析 OrdinalEncoder 與 OneHotEncoder：核心區別與實戰應用

標題：深入解析 OrdinalEncoder 與 OneHotEncoder：核心區別與實戰應用摘要： 本文詳細探討了機器學習中類別特征編碼的兩種核心方法——OrdinalEncoder 和 OneHotEncoder。通過對比兩者的功能、特點、適用場景及代碼實現，幫助讀者…

閱讀更多...

CTF web入門之命令執行完整版

CTF web入門之命令執行完整版

web29 文件名過濾由于flag被過濾，需要進行文件名繞過，有以下幾種方法： 1.通配符繞過 fla?.* 2.反斜杠繞過 fl\ag.php 3.雙引號繞過 fl’‘ag’.php 還有特殊變量$1、內聯執行等此外讀取文件利用cat函數，輸出利用system、passthru 、echo echo `nl flag.php`; ec…

閱讀更多...

【Linux實踐系列】：用c/c++制作一個簡易的進程池

【Linux實踐系列】：用c/c++制作一個簡易的進程池

🔥 本文專欄：Linux Linux實踐項目 🌸作者主頁：努力努力再努力wz 💪 今日博客勵志語錄： 人生沒有標準答案，你的錯題本也能寫成傳奇。 ★★★ 本文前置知識： 匿名管道 1.前置知識回顧…

閱讀更多...

2.2 函數返回值

2.2 函數返回值

1.回顧def def sum(x,y): return xy res sum(10,20) #調用函數 print(res) 2.函數的三個重要屬性 -函數的類型：function -函數的ID：16進制的整數數值 -函數的值：封裝在函數中的數據和代碼 # - 函數是一塊內存空間，通過…

閱讀更多...

【3GPP核心網】【5G】精講5G網絡語音業務系統架構

【3GPP核心網】【5G】精講5G網絡語音業務系統架構

1. 歡迎大家訂閱和關注，精講3GPP通信協議（2G/3G/4G/5G/IMS）知識點，專欄會持續更新中.....敬請期待！目錄 1. 音視頻業務 2. 消息類業務 SMS over IMS SMS over NAS 3. 互聯互通架構 3.1 音視頻業務互通場景 3.2 5G 用戶與 5G 用戶互通 3.3 5G 用戶與 4G 用戶的互通…

閱讀更多...

系統環境變量有什么實際作用，為什么要配置它

系統環境變量有什么實際作用，為什么要配置它

系統環境變量有什么實際作用，為什么要配置它系統環境變量具有以下重要實際作用：指定程序路徑：操作系統通過環境變量來知曉可執行文件、庫文件等的存儲位置例如，當你在命令提示符或終端中輸入一個命令時，系統會根據環境變量PATH中指定的路徑去查找對應的可執行文件。如果…

閱讀更多...

qt/C++面試題自用學習（更新中）

qt/C++面試題自用學習（更新中）

最近在找工作…面試中遇到了的問題總以為自己會但回答的時候磕磕巴巴，覺得還是要總結一下： vector和list的區別 vector list 底層數據結構基于動態數組實現，元素在內存中連續存儲基于雙向鏈表實現，元素在內存中非連續存儲&…

閱讀更多...

Day09【基于Tripletloss實現的簡單意圖識別對話系統】

Day09【基于Tripletloss實現的簡單意圖識別對話系統】

基于Tripletloss實現的表示型文本匹配目標數據準備參數配置數據處理Triplet Loss目標Triplet Loss計算公式公式說明模型構建網絡結構設計網絡訓練目標損失函數設計主程序推理預測類初始化加載問答知識庫文本向量化知識庫查詢主程序main測試測試效果參考博客目標在此之前…

閱讀更多...

說說什么是冪等性？

說說什么是冪等性？

大家好，我是鋒哥。今天分享關于【說說什么是冪等性？】面試題。希望對大家有幫助； 說說什么是冪等性？ 1000道互聯網大廠Java工程師精選面試題-Java資源分享網冪等性（Idempotence） 是指在某些操作或請求…

閱讀更多...

【自相關】全局 Moran’s I 指數

【自相關】全局 Moran’s I 指數

自相關（Autocorrelation），也稱為序列相關性，指的是同一變量在不同時間或空間點的值之間的關系。簡而言之，自相關就是一個變量與自身在不同位置或時間點的相關性自相關：針對同一屬性之間進行分析相關性本…

閱讀更多...

【高中數學/指數/對數】同構六君子之 x/e^x/lnx組合曲線

【高中數學/指數/對數】同構六君子之 x/e^x/lnx組合曲線

yx*e^x ye^x/x yx/e^x yx*lnx ylnx/x yx/lnx END

閱讀更多...

【C#】Html轉Pdf，Spire和iTextSharp結合，.net framework 4.8

【C#】Html轉Pdf，Spire和iTextSharp結合，.net framework 4.8

🌹歡迎來到《小5講堂》🌹 🌹這是《C#》系列文章，每篇文章將以博主理解的角度展開講解。🌹 🌹溫馨提示：博主能力有限，理解水平有限，若有不對之處望指正！&#…

閱讀更多...

KrillinAI：視頻跨語言傳播的一站式AI解決方案

KrillinAI：視頻跨語言傳播的一站式AI解決方案

引言在全球內容創作領域，跨語言傳播一直是內容創作者面臨的巨大挑戰。傳統的視頻本地化流程繁瑣，涉及多個環節和工具，不僅耗時耗力，還常常面臨質量不穩定的問題。隨著大語言模型(LLM)技術的迅猛發展，一款名為Krillin…

閱讀更多...

AllDup：高效管理重復文件

AllDup：高效管理重復文件

AllDup 是一款免費高效的重復文件管理工具，專為 Windows 系統設計，支持快速掃描并清理冗余文件，優化存儲空間。它通過智能算法識別重復內容，覆蓋文本、圖片、音頻、視頻等常見文件類型?。軟件提供便攜版與安裝版，無需…

閱讀更多...

C++進程間通信開發實戰：高效解決項目中的IPC問題

C++進程間通信開發實戰：高效解決項目中的IPC問題

C進程間通信開發實戰：高效解決項目中的IPC問題在復雜的軟件項目中，進程間通信（Inter-Process Communication, IPC）是實現模塊化、提高系統性能與可靠性的關鍵技術之一。C作為一門高性能的編程語言，廣泛應用于需要高效…

閱讀更多...

用 Depcheck 去除Vue項目沒有用到的依賴

用 Depcheck 去除Vue項目沒有用到的依賴

1. 安裝 Depcheck 插件 npm i -g depcheck 2. 運行命令，查看為用到的依賴 npx depcheck depcheck 3. 查詢到所有為用到的依賴 E:\Project>depcheck Unused dependencies * riophae/vue-treeselect * codemirror * connect * qs * sortablejs * vue-count-t…

閱讀更多...

猿輔導集團推首個教育AI范式小猿AI 聚焦家校應用場景發布3款新品

猿輔導集團推首個教育AI范式小猿AI 聚焦家校應用場景發布3款新品

近兩年，通用大模型呈爆發式發展，垂類AI遭遇“技術平替”危機。 4月15日，猿輔導集團在“小猿AI暨智能硬件戰略發布會”上，正式推出首個教育AI范式——“小猿AI”，并發布覆蓋家校兩端的“軟件應用智能終端通識課程”三位…

閱讀更多...

英語單詞 list 11

英語單詞 list 11

前言這一個 list 是一些簡單的單詞。感覺這個瀏覽單詞的方法比較低效，所以準備每天最多看一個 list ，真要提升英語水平，感覺還是得直接做閱讀理解題。就像我們接觸中文閱讀材料一樣，當然光知道這個表面意思還不夠，還…

閱讀更多...

BufferedReader 終極解析與記憶指南

BufferedReader 終極解析與記憶指南

BufferedReader 終極解析與記憶指南一、核心本質 BufferedReader 是 Java 提供的緩沖字符輸入流，繼承自 Reader，通過內存緩沖和行讀取功能極大提升文本讀取效率。核心特性速查表特性說明繼承鏈Reader → BufferedReader緩沖機制默認 8KB 字符緩沖…

閱讀更多...

樹莓派超全系列教程文檔--(26)在 Raspberry Pi 上配置熱點

樹莓派超全系列教程文檔--(26)在 Raspberry Pi 上配置熱點

在 Raspberry Pi 上配置熱點在 Raspberry Pi 上配置熱點啟用熱點禁用熱點使用 Raspberry Pi 作為網橋文章來源： http://raspberry.dns8844.cn/documentation 原文網址在 Raspberry Pi 上配置熱點 Raspberry Pi 可以使用無線模塊托管自己的無線網絡。如果您通過…

閱讀更多...

最新文章