關于神經網絡中的激活函數

這篇博客主要介紹一下神經網絡中的激活函數以及為什么要存在激活函數。

首先,我先做一個簡單的類比:激活函數的作用就像給神經網絡里的 “數字信號” 加了一個 “智能閥門”,讓機器能學會像人類一樣思考復雜問題。

沒有激活i函數的神經網絡

沒有激活i函數的神經網絡就像是一臺“傻機器”,假設你用純數學公式搭一個神經網絡(沒有激活函數),它的計算邏輯是這樣的:

輸入層?→?隱藏層:h=W1??x+b1?
隱藏層?→?輸出層:y^?=W2??h+b2?
把兩層合并后會發現:y^?=W2??(W1??x+b1?)+b2?=(W2?W1?)?x+(W2?b1?+b2?)

本質還是一個線性公式(形如?y=kx+b),只能擬合直線,連 “判斷圖片里有沒有貓” 這種曲線問題都解決不了(因為貓和非貓的邊界通常是復雜曲線)。

就像你讓一個只會做加減乘除的計算器去解微積分題 —— 它根本看不懂題目

激活函數

激活函數的核心作用是讓神經網絡學會 “非線性變換”,簡單說就是:

  • 對符合條件的信號 “放行通過”,
  • 對不符合條件的信號 “過濾或扭曲”,
  • 讓不同信號之間產生復雜的邏輯關系。

激活函數的類比

像 “安檢門” 一樣過濾無效信號(以 ReLU 函數為例)

ReLU 函數:f(z)=max(0,z)

  • 作用:如果輸入信號?z?是負數(比如?5),直接變成 0(相當于 “攔截”);如果是正數(比如 3),原樣輸出(相當于 “放行”)。
  • 類比
    • 你去機場過安檢,包里的水如果超過 100ml(信號為負),直接被扣下(輸出 0);
    • 小于 100ml 的水(信號為正),可以帶進去(輸出原值)。
  • 效果:讓神經網絡專注于 “有意義的信號”,過濾掉干擾項,比如識別圖片時只關注 “有像素的區域”,忽略全黑的背景。

像 “調光開關” 一樣壓縮信號范圍(以 Sigmoid 函數為例)

Sigmoid 函數:f(z)=1+e?z1?,輸出永遠在 0 到 1 之間。

  • 作用:把任意大小的信號(比如?100或+100)“擠壓” 到 0~1 的區間,類似把 “強光” 和 “弱光” 都轉化為 “手機屏幕能顯示的亮度”。
  • 類比
    • 你用手機拍夜景,光線太強(信號值大)會過曝,太弱(信號值小)會漆黑,手機算法會自動把光線壓縮到適合顯示的范圍(0~1),讓亮處不過曝、暗處能看清。
  • 效果:適合處理 “概率問題”,比如判斷 “這張圖是貓的概率是 90%”(輸出 0.9),不是貓的概率是 10%(輸出 0.1)。

像 “蹺蹺板” 一樣讓信號產生對立關系(以 Tanh 函數為例)

Tanh 函數:f(z)=ez+e?zez?e?z?,輸出在 - 1 到 1 之間。

  • 作用:把信號轉化為 “正” 和 “負” 兩種對立狀態,類似給信號裝了一個 “蹺蹺板”,一頭是正向激活,一頭是負向激活。
  • 類比
    • 你和朋友玩蹺蹺板,體重差異會讓一端升高(輸出 + 1),一端降低(輸出 - 1),體重相近時會平衡在中間(接近 0)。
  • 效果:適合處理 “情感分類” 問題,比如判斷一句話是 “積極情緒”(輸出 + 0.8)還是 “消極情緒”(輸出 - 0.6)。

為什么一定要有激活函數(非線性)--人類思維的本質是 “非線性”

for example

  • 你判斷 “今天要不要出門”,不是只看單一因素(比如 “溫度 > 20℃就出門”),而是綜合考慮:
    • 溫度是否合適(激活 1)、
    • 有沒有下雨(激活 2)、
    • 朋友是否約你(激活 3)、
    • 工作是否完成(激活 4)……
      這些因素通過 “非線性組合”(比如 “溫度合適??沒下雨??朋友強烈約我”)最終決定你的行為。

激活函數就是在模擬這種非線性邏輯

  • 每個隱藏層神經元用激活函數處理信號后,相當于學會了一個 “局部判斷規則”(比如 “溫度 > 20℃時激活”),
  • 多層神經元的激活函數疊加后,就能組合出無窮多復雜規則(比如 “溫度> 20℃??下雨概率 < 30%??朋友約我吃飯”),
  • 最終讓神經網絡能像人類一樣解決復雜問題(如圖像識別、語言翻譯等)。

總結

無激活函數的網絡只能做?線性運算(低級計算器)有激活函數的網絡能做?非線性變換(智能大腦)
一句話:激活函數讓數字信號學會 “思考”,讓機器從 “機械計算” 進化到 “智能決策”!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/83730.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/83730.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/83730.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

免費無限使用GPT Plus、Claude Pro、Grok Super、Deepseek滿血版

滲透智能-ShirtAI&#xff0c;可以免費無限使用GPT Plus、Claude Pro、Grok Super、Deepseek滿血版、除此之外還能免費使用AI搜索、Gemini AI、AI照片修復、AI橡皮擦、AI去背景、AI智能摳圖、AI證件照、OCR識別、在線思維導圖、在線繪圖工具、PDF工具箱、PDF翻譯。 傳送入口&a…

阿里云 Linux 搭建郵件系統全流程及常見問題解決

阿里云 Linux 搭建 [conkl.com]郵件系統全流程及常見問題解決 目錄 阿里云 Linux 搭建 [conkl.com]郵件系統全流程及常見問題解決一、前期準備&#xff08;關鍵配置需重點檢查&#xff09;1.1 服務器與域名準備1.2 系統初始化&#xff08;必做操作&#xff09; 二、核心組件安裝…

python版若依框架開發:項目結構解析

python版若依框架開發 從0起步&#xff0c;揚帆起航。 python版若依部署代碼生成指南&#xff0c;迅速落地CURD&#xff01;項目結構解析 文章目錄 python版若依框架開發前端后端 前端 后端

RabbitMQ 的異步化、解耦和流量削峰三大核心機制

RabbitMQ 的異步化、解耦和流量削峰三大核心機制 RabbitMQ 是解決數據庫高并發問題的利器&#xff0c;通過異步化、解耦和流量削峰三大核心機制保護數據庫。下面從設計思想到具體實現&#xff0c;深入剖析 RabbitMQ 應對高并發的完整方案&#xff1a; 一、數據庫高并發核心痛點…

前端沒有“秦始皇“,但可以做跨端的王[特殊字符]

前端各領域的 “百家爭鳴” 框架之爭&#xff1a;有 React、Vue、Angular 等多種框架。它們各有優缺點&#xff0c;開發者之間還存在鄙視鏈&#xff0c;比如 Vue 嫌 React 難用&#xff0c;React 嫌 Vue 不夠靈活。樣式處理&#xff1a; CSS 預處理器&#xff1a;像 Sass、Les…

Spring Boot-面試題(52)

摘要&#xff1a; 1、通俗易懂&#xff0c;適合小白 2、僅做面試復習用&#xff0c;部分來源網絡&#xff0c;博文免費&#xff0c;知識無價&#xff0c;侵權請聯系&#xff01; 1. 什么是 Spring Boot 框架&#xff1f; Spring Boot 是基于 Spring 框架的快速開發框架&#…

JVM——JVM中的字節碼:解碼Java跨平臺的核心引擎

引入 在Java的技術版圖中&#xff0c;字節碼&#xff08;Bytecode&#xff09;是連接源代碼與機器世界的黃金橋梁。當開發者寫下第一行public class HelloWorld時&#xff0c;編譯器便開始了一場精密的翻譯工程——將人類可讀的Java代碼轉化為JVM能夠理解的字節碼指令。這些由…

Java中的JSONObject詳解:從基礎到高級應用

Java中的JSONObject詳解&#xff1a;從基礎到高級應用 在當今前后端分離的架構中&#xff0c;JSONObject已成為Java開發者處理JSON數據的瑞士軍刀。本文將深入解析JSONObject的核心機制與實戰技巧。 一、JSONObject的本質與實現庫 1.1 核心定位 JSONObject是Java中表示JSON對…

在 SpringBoot+Tomcat 環境中 線程安全問題的根本原因以及哪些變量會存在線程安全的問題。

文章目錄 前言Tomcat SpringBoot單例加載結果分析多例加載&#xff1a;結果分析&#xff1a; 哪些變量存在線程安全的問題&#xff1f;線程不安全線程安全 總結 前言 本文帶你去深入理解為什么在web環境中(Tomcat SpringBoot)會存在多線程的問題以及哪些變量會存在線程安全的…

npm install 相關命令

npm install 相關命令 基本安裝命令 # 安裝 package.json 中列出的所有依賴 npm install npm i # 簡寫形式# 安裝特定包 npm install <package-name># 安裝特定版本 npm install <package-name><version>依賴類型選項 # 安裝為生產依賴&#xff08;默認&…

貪心算法應用:最小反饋頂點集問題詳解

貪心算法應用&#xff1a;最小反饋頂點集問題詳解 1. 問題定義與背景 1.1 反饋頂點集定義 反饋頂點集(Feedback Vertex Set, FVS)是指在一個有向圖中&#xff0c;刪除該集合中的所有頂點后&#xff0c;圖中將不再存在任何有向環。換句話說&#xff0c;反饋頂點集是破壞圖中所…

BiliNote部署實踐

? 開源地址&#xff1a; https://github.com/JefferyHcool/BiliNote &#x1f680; 快速開始 1. 克隆倉庫 git clone https://github.com/JefferyHcool/BiliNote.git cd BiliNote mv .env.example .env2. 啟動后端&#xff08;FastAPI&#xff09; cd backend pip insta…

用go從零構建寫一個RPC(4)--gonet網絡框架重構+聚集發包

在追求高性能的分布式系統中&#xff0c;RPC 框架的底層網絡能力和數據傳輸效率起著決定性作用。經過幾輪迭代優化&#xff0c;我完成了第四版本的 RPC 框架。相比以往版本&#xff0c;這一版本的最大亮點在于 重寫了底層網絡框架 和 實現了發送端的數據聚集機制&#xff0c;這…

MySQL 高可用基石 - 復制監控與常見 HA 方案

MySQL 高可用基石 - 復制監控與常見 HA 方案 MySQL 復制核心原理 MySQL 復制允許數據從一個 MySQL 數據庫服務器(稱為主庫 - Primary,舊稱 Master)復制到一個或多個其他的 MySQL 服務器(稱為從庫 - Replica,舊稱 Slave)。 復制的主要目的: 高可用性 (High Availability…

微信小程序(uniapp)自定義 TabBar

微信小程序&#xff08;uniapp&#xff09;自定義 TabBar 實現指南 在微信小程序開發中&#xff0c;TabBar 是底部導航欄的重要組件&#xff0c;但官方提供的 TabBar 樣式和功能較為基礎&#xff0c;無法滿足所有項目的需求。本文將詳細介紹如何在 uniapp 中實現自定義 TabBar…

MLP實戰二:MLP 實現圖像數字多分類

任務 實戰&#xff08;二&#xff09;&#xff1a;MLP 實現圖像多分類 基于 mnist 數據集&#xff0c;建立 mlp 模型&#xff0c;實現 0-9 數字的十分類 task: 1、實現 mnist 數據載入&#xff0c;可視化圖形數字&#xff1b; 2、完成數據預處理&#xff1a;圖像數據維度轉換與…

BUUCTF[HCTF 2018]WarmUp 1題解

BUUCTF[HCTF 2018]WarmUp 1題解 分析解題過程代碼審計主體函數CHECK函數&#xff1a; 構造payload 總結 分析 啟動靶機&#xff0c;進入網址&#xff0c;是一張滑稽的表情包&#xff1a; 程序化F12查看源碼&#xff1a; 發現注釋內容&#xff0c;訪問 url:/source.php得到…

大陸4D毫米波雷達ARS548調試

本文介紹了大陸ARS548毫米波雷達的調試與測試流程&#xff0c;主要包括以下內容&#xff1a; 設備參數&#xff1a;最大檢測距離301m&#xff08;可調93-1514m&#xff09;&#xff0c;支持gPTP時間同步。 接線調試&#xff1a; Windows需使用USB-RJ45轉換器 Linux可直接連接網…

TDengine 的 AI 應用實戰——運維異常檢測

作者&#xff1a; derekchen Demo數據集準備 我們使用公開的 NAB數據集 里亞馬遜 AWS 東海岸數據中心一次 API 網關故障中&#xff0c;某個服務器上的 CPU 使用率數據。數據的頻率為 5min&#xff0c;單位為占用率。由于 API 網關的故障&#xff0c;會導致服務器上的相關應用…

并發編程 - go版

1.并發編程基礎概念 進程和線程 A. 進程是程序在操作系統中的一次執行過程&#xff0c;系統進行資源分配和調度的一個獨立單位。B. 線程是進程的一個執行實體,是CPU調度和分派的基本單位,它是比進程更小的能獨立運行的基本單位。C.一個進程可以創建和撤銷多個線程;同一個進程中…