【漫話機器學習系列】233.激活閾(Threshold Activation)

深度學習入門:了解“閾值激活函數”(Threshold Activation Function)

激活函數是神經網絡中至關重要的一環。今天,我們通過一幅簡單直觀的手繪圖,一起理解最早期也最基礎的激活函數之一 —— 閾值激活函數(Threshold Activation Function)


1. 前言

在深度學習(Deep Learning)中,激活函數(Activation Function) 決定了神經網絡每個神經元的輸出形式。
沒有激活函數,神經網絡就只是一堆線性疊加,無法擬合復雜的非線性關系。

而在眾多激活函數中,閾值激活函數(Threshold Activation Function) 是最早被提出的一種,它簡單粗暴,卻也奠定了后續復雜模型的基礎。

今天,讓我們從這幅生動的手繪圖出發,深度理解閾值激活的本質。


2. 圖像解讀

這張圖直觀展示了閾值激活函數的特性:

  • 水平方向是輸入(Input),表示神經元接收到的信號。

  • 垂直方向是輸出(Output),表示神經元的激活結果。

可以看到:

  • 當輸入 > 0 時,輸出固定為 +1。

  • 當輸入 < 0 時,輸出固定為 -1。

  • 當輸入 = 0 時,通常根據具體定義,輸出可以是 1、-1 或 0,本圖示意以 1 為例。

這種“跳變式”的輸出特性,就是典型的硬閾值(Hard Threshold)行為


3. 數學表達式

閾值激活函數可以用簡單的公式表示為:

或者在某些變種中:

其中,θ 是一個自定義的閾值(通常為 0)。


4. 背景與起源

  • 感知機(Perceptron) —— 1958年,Frank Rosenblatt 提出了世界上第一個神經網絡模型:感知機。

  • 在感知機中,激活函數就是一個簡單的閾值函數:加權求和后,大于某個閾值就激活為1,否則激活為-1。

  • 這種方式使得神經網絡能夠完成最簡單的分類任務(如二分類問題)。

可以說,閾值激活函數是神經網絡史上的第一代激活函數


5. 特點與優缺點

優點

  • 實現簡單:僅需判斷大小關系。

  • 計算快速:適合硬件直接實現。

  • 清晰明了:特別適合線性可分問題(如簡單分類)。

缺點

  • 不可導:函數在 x=0 處不可導,無法直接用于反向傳播(Backpropagation)訓練。

  • 不連續:輸出突然跳變,不利于梯度更新。

  • 信息量少:只有兩個輸出(+1 或 -1),表達能力有限。

這些缺點直接促成了后續更復雜激活函數(如 Sigmoid、ReLU、Tanh 等)的發展。


6. 應用場景

雖然在現代深度學習中,硬閾值激活已經很少直接使用,但它仍然在一些場景下非常有用:

  • 早期神經網絡(如感知機)教學與演示

  • 硬件實現(如 FPGA、低功耗芯片),需要簡單快速的決策邏輯。

  • 二分類任務中,粗略建模或快速實驗

  • 神經形態計算(Neuromorphic Computing),模擬生物神經元開關行為。

此外,它作為一種概念模型,幫助人們直觀理解激活函數的意義 —— 將連續的輸入信號轉化為離散的決策輸出


7. 與現代激活函數的對比

特性閾值激活(Threshold)SigmoidReLU
是否可導部分可導
是否連續
輸出范圍{?1,1} 或 {0,1}(0,1)[0,+∞)
是否易于訓練
典型應用感知機、簡單分類早期神經網絡現代深度學習

可以看到,隨著神經網絡規模擴大和應用復雜化,更平滑、可導的激活函數成為主流。


8. 總結

雖然閾值激活函數簡單、粗糙,但它是神經網絡發展的起點。
它讓我們明白了一個基本概念:

神經網絡不僅要加權輸入,更需要通過非線性函數進行處理,才能模擬復雜的決策與認知過程。

了解它,就像了解一棵參天大樹的根 —— 簡單,卻無比重要。


9. 參考資料

  • Rosenblatt, F. (1958). The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain.

  • Ian Goodfellow, Yoshua Bengio, Aaron Courville. (2016). Deep Learning.

  • Chris Albon - Machine Learning Flashcards


尾聲

如果你喜歡今天這篇文章,歡迎點贊、收藏、評論支持!

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/79088.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/79088.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/79088.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

(4)python中jupyter lab使用python虛擬環境

1. 先了解IPython和IPyKernel簡介 IPython 是一個功能強大的交互式 Python 解釋器和開發環境。它提供了一種增強的 Python Shell,使得用戶能夠以交互的方式探索、分析和可視化數據。IPython 的名稱來源于 "Interactive Python",體現了其交互式的特性。 IPyKernel 是…

nginx 配置要領

你提出的問題非常好&#xff01;確實在配置 WebSocket 代理時&#xff0c;proxy_pass 的 URL 處理需要特別注意。以下是關鍵解釋和修正建議&#xff1a; 1. 原配置的問題分析 location /ws/ {proxy_pass http://fastapi-container:8000; # 會保留 /ws/ 前綴傳遞給后端 }這種配…

【AI】DeepSeek 流程圖 / 時序圖制作,Word 排版錯亂問題,文字轉直觀圖形

一&#xff1a;動態流程圖 / 時序圖制作&#xff08;DeepSeek Draw.IO&#xff09; 工具準備 DeepSeek&#xff08;AI 生成代碼&#xff09;&#xff1a;官網&#xff08;免費&#xff09;Draw.IO&#xff08;可視化渲染&#xff09;&#xff1a;官網&#xff08;免費&#…

4. python3基本數據類型

Python3 中有六個標準的數據類型&#xff1a; Number&#xff08;數字&#xff09; String&#xff08;字符串&#xff09; List&#xff08;列表&#xff09; Tuple&#xff08;元組&#xff09; Set&#xff08;集合&#xff09; Dictionary&#xff08;字典&#xff09; Pyt…

WPF之TextBox控件詳解

文章目錄 1. TextBox概述2. 基本屬性與功能3. 輸入控制詳解3.1 MaxLength3.2 AcceptsReturn3.3 AcceptsTab3.4 CharacterCasing3.5 IsUndoEnabled3.6 自定義輸入限制 4. 文本選擇與操作4.1 選擇屬性4.2 選擇方法4.3 文本操作4.4 選擇事件4.5 實現自定義文本處理功能 5. 滾動支持…

1.4 點云數據獲取方式——結構光相機

圖1-4-1結構光相機 結構光相機作為獲取三維點云數據的關鍵設備,其工作原理基于主動式測量技術。通過投射已知圖案,如條紋、點陣、格雷碼等,至物體表面,這些圖案會因物體表面的高度變化而發生變形。與此同時,利用相機從特定

【MATLAB第118期】基于MATLAB的雙通道CNN多輸入單輸出分類預測方法

【MATLAB第118期】基于MATLAB的雙通道CNN多輸入單輸出分類預測方法 一、雙通道CNN簡介 在深度學習領域&#xff0c;卷積神經網絡&#xff08;CNN&#xff09;憑借其強大的特征提取能力&#xff0c;已成為圖像識別、自然語言處理等任務的核心技術。傳統單通道CNN在處理單一模態…

2025上海車展 | 移遠通信推出自研NG-eCall QuecOpen方案,助力汽車安全新標準加速落地

4月29日&#xff0c;在2025上海國際汽車工業展覽會期間&#xff0c;全球領先的物聯網和車聯網整體解決方案供應商移遠通信宣布&#xff0c;正式發布自主研發的NG-eCall&#xff08;下一代緊急呼叫系統&#xff09;QuecOpen解決方案。 該方案憑借高度集成的軟硬件協同設計&…

leetcode76

目錄 803ms超時。。。。越改越超時。。。 一些糾纏 代碼分析&#xff1a; 代碼問題&#xff1a; 改進建議&#xff1a; 示例代碼&#xff1a; The error message you’re seeing indicates that there is a reference binding to a null pointer in your code. This typ…

大數據應用開發和項目實戰-Seaborn

一、Seaborn概述 Seaborn是基于Python數據可視化庫Matplotlib開發的擴展庫&#xff0c;專注于統計圖形的繪制&#xff0c;旨在通過簡潔的代碼實現復雜數據的可視化&#xff0c;幫助用戶更輕松地呈現和理解數據。其核心設計目標是簡化統計可視化流程&#xff0c;提供高級接口和美…

數據科學與計算

Seaborn的介紹 Seaborn 是一個建立在 Matplotlib 基礎之上的 Python 數據可視化庫&#xff0c;專注于繪制各種統計圖形&#xff0c;以便更輕松地呈現和理解數據。 Seaborn 的設計目標是簡化統計數據可視化的過程&#xff0c;提供高級接口和美觀的默認主題&#xff0c;使得用戶…

深入淺出循環神經網絡(RNN):原理、應用與實戰

1、引言 在深度學習領域&#xff0c;循環神經網絡&#xff08;Recurrent Neural Network, RNN&#xff09;是一種專門用于處理**序列數據**的神經網絡架構。與傳統的前饋神經網絡不同&#xff0c;RNN 具有**記憶能力**&#xff0c;能夠捕捉數據中的時間依賴性&#xff0c;廣泛應…

廣州創科——湖北房縣汪家河水庫除險加固信息化工程

汪家河水庫 汪家河水庫位于湖北省房縣&#xff0c;建于1971年&#xff0c;其地利可謂是天公之作&#xff0c;東西二山蜿蜒起伏&#xff0c;山峰相連&#xff0c;峰峰比高&#xff0c;無有盡頭&#xff0c;東邊陡峭&#xff0c;西邊相對平坦&#xff0c;半山腰有一條鄉村道路&am…

C++日更八股--day2

### C sort 的底層原理 這里其實原來問的是你如何優化快速排序&#xff0c;但是我最初只以為是隨機選擇基準&#xff0c;但是很顯然面試官對此并不滿意 閑暇之際&#xff0c;看到一篇介紹sort的原理的文章&#xff0c;才知道原來如是也 1.快速排序&#xff1a;作為主要算法&…

UniApp 的現狀與 WASM 支持的迫切性

UniApp 的現狀與 WASM 支持的迫切性 點擊進入免費1 UniApp 的現狀與 WASM 支持的迫切性 點擊進入免費版2 一、UniApp 的跨平臺優勢與性能瓶頸 UniApp 憑借“一次開發,多端發布”的核心理念,已成為跨平臺開發的主流框架之一。然而,隨著移動應用場景的復雜化(如 3D 渲染、音…

如何正確使用日程表

日程安排&#xff0c;是時間管理中非常重要的一項&#xff0c;也是不容易管好的一項。 日程安排&#xff0c;通常指放到日程表里的事情&#xff0c;一般來說&#xff0c;放到日程表的事情要符合以下幾個特點&#xff1a; 01.明確具體時間段&#xff0c;比如是下午2點到下午三…

【Token系列】14|Prompt不是文本,是token結構工程

文章目錄 14&#xff5c;Prompt不是文本&#xff0c;是token結構工程一、很多人寫的是“自然語言”&#xff0c;模型讀的是“token序列”二、Prompt寫法會直接影響token結構密度三、token分布影響Attention矩陣的聚焦方式四、token數 ≠ 有效信息量五、Prompt結構設計建議&…

研發效率破局之道閱讀總結(4)個人效率

研發效率破局之道閱讀總結(4)個人效率 Author: Once Day Date: 2025年4月30日 一位熱衷于Linux學習和開發的菜鳥&#xff0c;試圖譜寫一場冒險之旅&#xff0c;也許終點只是一場白日夢… 漫漫長路&#xff0c;有人對你微笑過嘛… 全系列文章可參考專欄: 程序的藝術_Once-Day…

CNN代碼詳細注釋

import torch from torch import nn#定義張量x&#xff0c;它的尺寸是5x1x28x28 #表示了5個單通道28x28大小的數據 xtorch.zeros([5,1,28,28])#定義一個輸入通道是1&#xff0c;輸出通道是6&#xff0c;卷積核大小是5x5的卷積層 convnn.Conv2d(in_channels1,out_channels6,ker…

機器指標監控技術方案

文章目錄 機器指標監控技術方案架構圖組件簡介Prometheus 簡介核心特性適用場景 Grafana 簡介核心特性適用場景 Alertmanager 簡介核心特性適用場景 數據采集機器Node ExporterMySQL ExporterRedis ExporterES ExporterRocketMQ ExporterSpringcloud ExporterNacos 數據存儲短期…