神經網絡—感知器、多層感知器

文章目錄

  • 前言
  • 一、生物神經元與感知器的類比
  • 二、感知器
    • 1、簡單感知器
    • 2、多層感知器
      • (1)多層感知機結構
    • 3、神經網絡結構
  • 總結
    • 1、感知器的局限性
      • 如何突破感知器的局限性?
    • 2、感知器的應用


前言

感知器(Perceptron)是神經網絡發展歷程中的基礎模型,由美國科學家 Frank Rosenblatt 在 1957 年提出。它模擬了生物神經元的工作方式,是構建更復雜神經網絡的基石。

一、生物神經元與感知器的類比

生物神經元是神經系統的基本單元,主要由樹突、細胞體和軸突組成。樹突接收來自其他神經元的信號,細胞體對這些信號進行整合,當信號強度超過一定閾值時,軸突會將處理后的信號傳遞給其他神經元。
感知器借鑒了生物神經元的工作機制,它接收多個輸入信號,對這些輸入進行加權求和,然后通過一個激活函數進行處理,當輸出超過一定閾值時,感知器輸出一個信號。

二、感知器

1、簡單感知器

由兩層神經元組成的神經網絡–“感知器”(Perceptron),感知器只能線性劃分數據。
=320x
公式是線性代數方程組,因此可以用矩陣乘法來表達這兩個公式
在這里插入圖片描述
輸出的結果與訓練集標簽進行損失函數計算,與邏輯回歸基本一致。

神經網絡的本質:通過參數與激活函數來擬合特征與目標之間的真實函數關系。但在一個神經網絡的程序中,不需要神經元和線,本質上是矩陣的運算,實現一個神經網絡最需要的是線性代數庫。

2、多層感知器

(1)多層感知機結構

增加了一個中間層。即隱含層
神經網絡可以做非線性分類的關鍵–隱藏層。
在這里插入圖片描述

假設我們的預測目標是一個向量,那么與前面類似,只需要在“輸出層”再增加節點即可。
=120x
(2)多層感知器偏置結點
在神經網絡中需要默認增加偏置神經元(節點),這些節點是默認存在的。它本質上是一個只含有存儲功能,且存儲值永遠為1的單元。在神經網絡的每個層次中,除了輸出層以外,都會含有這樣一個偏置單元。

=120x120在這里插入圖片描述
偏置節點沒有輸入(前一層中沒有箭頭指向它)。一般情況下,我們都不會明確畫出偏置節點。

3、神經網絡結構

輸入層的節點數:與特征的維度匹配
輸出層的節點數:與目標的維度匹配。
中間層的節點數:目前業界沒有完善的理論來指導這個決策。一般是根據經驗來設置。較好的方法就是預先設定幾個可選值,通過切換這幾個值來看整個模型的預測效果,選擇效果最好的值作為最終選擇。

1、設計一個神經網絡時,輸入層與輸出層的節點數往往是固定的,中間層則可以自由指定;
2、神經網絡結構圖中的拓撲與箭頭代表著預測過程時數據的流向,跟訓練時的數據流有一定的區別;
3、結構圖里的關鍵不是圓圈(代表“神經元”),而是連接線(代表“神經元”之間的連接)。每個連接線對應一個不同的權重(其值稱為權值),這是需要訓練得到的。

總結

1、感知器的局限性

感知器雖然是神經網絡的基礎,但它存在一定的局限性:
只能處理線性可分問題:感知器只能對線性可分的數據進行分類,對于線性不可分的數據(如異或問題),感知器無法收斂到一個正確的解。

缺乏隱藏層:簡單感知器沒有隱藏層,這限制了它的表達能力,無法處理復雜的非線性映射。

如何突破感知器的局限性?

(1) 多層感知器(MLP)與非線性激活函數
引入隱藏層:通過疊加多個感知器層(輸入層→隱藏層→輸出層),形成多層網絡,能夠學習非線性決策邊界。例如,XOR問題可以通過一個包含隱藏層的網絡解決。

激活函數升級:用Sigmoid、ReLU等非線性函數替代階躍函數,使網絡具備非線性表達能力。例如:

Sigmoid函數:
在這里插入圖片描述
?ReLU函數:
在這里插入圖片描述

(2) 反向傳播算法
通過鏈式法則計算梯度,逐層調整權重,使多層網絡的訓練成為可能。這是感知器無法實現的。

(3) 多分類擴展
使用Softmax激活函數和交叉熵損失函數,將輸出擴展到多類別概率分布。

2、感知器的應用

盡管存在局限性,感知器在一些簡單的分類問題中仍然有應用,例如:
二分類問題:可以用于區分兩個不同類別的數據,如判斷郵件是否為垃圾郵件、判斷圖像中是否包含特定物體等。

早期神經網絡的基礎:感知器為后續更復雜神經網絡的發展奠定了基礎,許多神經網絡的訓練算法和結構都是在感知器的基礎上發展而來的。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/79934.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/79934.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/79934.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

避免數據丟失:在存儲測試數據之前,要做好Redis持久化

Redis提供兩種持久化方法: 一、RDB(Redis DataBase): 1、周期性保存內存快照到磁盤(生成 dump.rdb 文件)。 2、配置save 相關參數。 我本地的配置如下: (1)配置文件re…

Oracle EBS FORM快捷鍵與觸發器的關系與使用

Oracle EBS FORM快捷鍵與觸發器的引用 1、快捷鍵作用,可以看文檔fmrweb.res 2、文件內容:標識了快捷鍵的作用 9 : 0 : “Tab” : 1 : “Next Field” 9 : 1 : “ShiftTab” : 2 : “Previous Field” 116 : 0 : “F5” : 3 : “Clear Field” 38 : 0 :…

Java 24:重構數字信任邊界 —— 后量子時代的智能安全防御體系構建

引言 在量子計算陰影與 AI 驅動攻擊交織的網絡安全新紀元,Java 平臺正經歷著自誕生以來最深刻的安全架構革新。作為企業級應用的核心基礎設施,Java 24 不僅延續了 “一次編寫,處處運行” 的跨平臺基因,更以后量子密碼學引擎、動態…

【故障定位系列】容器CPU問題引起的故障如何快速排查

原文地址:https://mp.weixin.qq.com/s/0VlIjbeEdPZUbLD389disA 當生產環境中的容器CPU出現異常時,可能會引發上層業務出現一系列問題,比如業務請求緩慢、網頁卡頓甚至崩潰等,如果沒有一個有效的故障定位方法,運維人員很…

DeepSeek 智能客服應用指南:構建、策略與成效升級

目錄 一、引言二、DeepSeek 與智能客服的相遇2.1 DeepSeek 的技術亮點2.2 智能客服:企業不可或缺的 “數字助手”2.3 DeepSeek 如何適配智能客服需求 三、基于 DeepSeek 搭建智能客服系統3.1 需求分析3.2 技術選型3.3 系統架構設計3.4 搭建步驟實操 四、基于 DeepSe…

JVM運行時數據區域(Run-Time Data Areas)的解析

# JVM運行時數據區域(Run-Time Data Areas)的解析 歡迎來到我的博客:TWind的博客 我的CSDN::Thanwind-CSDN博客 我的掘金:Thanwinde 的個人主頁 本文參考于:深入理解Java虛擬機:JVM高級特性與最佳實踐 本文的JVM均…

【特別版】Kubernetes集群安裝(1master,2node)

Kubernetes集群安裝 虛擬機準備 按照三臺虛擬機標準,一臺控制節點兩臺工作節點 主機名ip配置要求master-k8s192.168.242.102GB或更多RAM,2個CPU或更多CPU,硬盤30GB或更多node01-k8s192.168.242.112GB或更多RAM,2個CPU或更多CPU…

Excel點擊單元格內容消失

Excel點擊單元格內容消失 前言一、原因說明二、解決方案1.菜單欄中找到“審閱”,選擇“撤銷工作表保護”2.輸入密碼3.解除成功 前言 Excel想要編輯單元格內容時,無論是單擊還是雙擊單元格內容都莫名其妙的消失了 一、原因說明 單擊或者雙擊Excel中單元…

最優化方法Python計算:有約束優化應用——線性Lasso回歸預測器

實際應用中,特征維度 n n n通常遠大于樣本容量 m m m( n ? m n\ll m n?m),這種高維小樣本場景下特征數據可能含有對標簽數據 y i y_i yi?的取值不必要的成分,甚至是噪聲。此時,我們希望回歸模型中的優化…

如何為APP應用程序選擇合適的服務器

搭建一個成功的APP應用程序,服務器選擇是至關重要的決策之一。合適的服務器不僅能確保應用流暢運行,還能節省成本并保障安全性。本文將為您詳細解析如何為APP選擇最佳服務器方案。 一、了解您的APP需求 在選擇服務器前,首先需要明確您的應用…

k8s(11) — 探針和鉤子

鉤子和探針的區別: 在 Kubernetes(k8s)中,鉤子(Hooks)和探針(Probes)是保障應用穩定運行的重要機制,不過它們的用途和工作方式存在差異,以下為你詳細介紹&…

Kafka消息隊列之 【消費者分組】 詳解

消費者分組(Consumer Group)是 Kafka 提供的一種強大的消息消費機制,它允許多個消費者協同工作,共同消費一個或多個主題的消息,從而實現高吞吐量、可擴展性和容錯性。 基本概念 消費者分組:一組消費者實例的集合,這些消費者實例共同訂閱一個或多個主題,并通過分組來協調…

什么是Blender?怎么獲取下載Blender格式文件模型

glbxz.com glbxz.com 官方可以下載Blender格式文件模型 BlenderBlender 是一個免費的開源程序,用于建模和動畫,最初由一家名為 Neo Geo 的動畫工作室作為內部應用程序開發,后來作為自己的程序發布。這是一個稱職的程序,近年來由于…

IC ATE集成電路測試學習——PLL測試(一)

PLL測試 什么是PLL? PLL Phase-Locked Loop(鎖相環)它的作用就是:把低速、穩定的外部時鐘,轉換成芯片內部需要的高速時鐘。 PLL的作用 我們知道,芯片的內部不同的模塊,很可能用的不是一個頻…

ReaRAG:教 AI 思考、搜索和自我糾正以獲得事實準確答案(含git實現)

推理模型(LRMs)的發展取得了顯著進展,展現出強大的推理能力,能在復雜任務中表現出色。然而,這些模型在多跳問答(QA)任務中仍面臨挑戰,主要歸因于其對參數化知識的依賴,導…

第2章——springboot核心機制

一、為何以繼承方式引入SpringBoot 1.提出疑問 以前我們在開發項目時&#xff0c;需要什么&#xff0c;引入對應的依賴就行&#xff0c;比如我們需要連接mysql數據&#xff0c;則引入mysql驅動的依賴&#xff0c;如下&#xff1a; <dependency><groupId>com.mys…

網絡接入服務商查詢

要查詢網站的 網絡接入服務商&#xff08;即網站服務器托管或接入的ISP公司&#xff09;&#xff0c;可以通過以下方法進行查詢&#xff1a; 方法1&#xff1a;通過IP地址查詢 步驟1&#xff1a;獲取網站IP 使用 ping 命令&#xff1a; ping example.com 返回的IP地址即為服務…

超詳細!RxSwift 中的 BehaviorRelay 使用教程(含原理 + 示例 + 實戰)

目錄 前言 1.什么是 BehaviorRelay 2.基本使用方式 3.BehaviorRelay的常用API 4.BehaviorRelay 和其它類型的對比 5.BehaviorRelay的使用場景 1.綁定UITableView 2.MVVM 場景下使用 BehaviorRelay 6.使用注意事項以及建議 1.注意事項 2.使用建議總結 7.推薦閱讀 前…

vue-grid-layout實現拖拽修改工作臺布局

效果圖 vue-grid-layout 文檔地址&#xff1a;vue-grid-layout 官網介紹&#xff1a; 使用 // 安裝&#xff1a; npm install vue-grid-layout --save// 引用&#xff1a; import { GridLayout, GridItem } from vue-grid-layout// 注冊&#xff1a; components:{ GridLay…

windows使用bat腳本激活conda環境

本文不生產技術&#xff0c;只做技術的搬運工&#xff01;&#xff01;&#xff01; 前言 最近需要在windows上使用批處理腳本執行一些python任務&#xff0c;但是被自動激活conda環境給卡住了&#xff0c;研究了一下解決方案 解決方案 call your_conda_path\Scripts\activa…