神經網絡和深度學習介紹

目錄

1.深度學習的介紹

2.神經網絡的構造

①神經元結構

②神經網絡組成

③權重核心性

3.神經網絡的本質

4.感知器

單層感知器的局限性:

5.多層感知器

多層感知器的優勢:

6.偏置

7.神經網絡的設計

8.損失函數

常用的損失函數:

9.softmax交叉熵損失函數

10.正則化懲罰

11.梯度下降

12.反向傳播


1.深度學習的介紹

深度學習(DL, Deep Learning)是機器學習(ML, Machine Learning)領域中一個新的研究方向。

2.神經網絡的構造

①神經元結構

  • 單個神經元模擬邏輯回歸,輸入信號(如圖片數據)通過權重(ω)加權求和后,經激活函數(如Sigmoid)輸出結果(0或1)。
  • 輸入層(藍色)僅表示輸入數據,非神經元;輸出層(藍色末端)為最終結果。

②神經網絡組成

  • 由大量神經元(節點)及連接線構成,每個節點代表一種特定的輸出函數,每層神經元按列排列,信號僅傳遞至下一層(無跨層或同層連接)。
  • 激活函數(如Sigmoid)用于非線性映射,當前階段默認使用Sigmoid,后續會引入其他函數。

③權重核心性

  • 權重(ω)是神經網絡的關鍵記憶單元,模型訓練的核心是求解權重值而非神經元本身。

3.神經網絡的本質

通過參數與激活函數來擬合特征與目標之間的真實函數關系。但在一個神經網絡的程序中,不需要神經元和線,本質上是矩陣的運算,實現一個神經網絡最需要的是線性代數庫。

4.感知器

有一層神經元組成的神經網絡叫做感知器,只能劃分線性數據

單層感知器的局限性:

  • 單層感知器僅能處理線性分類問題(如用直線劃分數據),無法解決非線性分類(如圓形或復雜曲線分布的數據)。

5.多層感知器

增加了一個中間層,即隱含層(神經網絡可以做到非線性劃分的關鍵)????????

多層感知器的優勢:

  • 引入隱含層后,通過多次非線性激活函數(如?sigmoid)實現數據“彎曲”,從而處理非線性分類問題。
  • 示例:
    • 隱含層神經元數為1時,輸出為一條直線;
    • 神經元數增至2或3時,可生成彎曲的決策邊界(如近似三角形或弧形),提升分類能力。
  • 核心原理:前向傳播中,每層輸出經激活函數映射,疊加非線性特性

6.偏置

在神經網絡中需要默認添加偏置神經元(節點),它本質上是一個只含有存儲功能,且存儲值永遠為1的單元。 在神經網絡的每個層次中,除了輸出層以外,都會含有這樣一個偏置單元

7.神經網絡的設計

輸入層的節點數:與特征的維度匹配

輸出層的節點數:與目標的維度匹配。

中間層的節點數:目前業界沒有完善的理論來指導這個決策。一般是根據經驗來設置。較好的方法就是預先設定幾個可選值,通過切換這幾個值來看整個模型的預測效果,選擇效果最好的值作為最終選擇。

8.損失函數

首先我們需要知道我們訓練模型的目的是使得參數盡可能的與真實的模型逼近

具體做法:

1、首先給所有參數賦上隨機值。我們使用這些隨機生成的參數值,來預測訓練數據中的樣本。 2、計算預測值為yi,真實值為y。那么,定義一個損失值loss,損失值用于判斷預測的結果和真實值的誤差,誤差越小越好。

常用的損失函數:

0-1損失函數(二分類)

均方差損失

平均絕對差損失

交叉熵損失(分類)

合頁損失

9.softmax交叉熵損失函數

softmax交叉熵損失函數實現多分類,公式為:lossi=?log?(e^y_i/∑_ie^y_i)????????

  • 輸出層通過Softmax處理:
    • 對神經元輸出值進行指數級放大(如e^{0.5}),拉大概率差異。
    • 歸一化后得到各類別概率占比(總和為1)。
  • 損失計算:
    • 根據真實標簽選擇對應神經元的輸出概率。
    • 通過負對數運算(-log(p))計算損失值:概率越接近1,損失越小;概率越低,損失越大。
  • 多分類任務需對多張圖片的損失求平均值。

10.正則化懲罰

正則化懲罰的功能:主要用于懲罰權重參數w,一般有L1和L2正則化。

  • 為防止過擬合和選擇更均衡的ω,損失函數需加入正則化項(如L1、L2正則化)。
  • 正則化懲罰項的值隨ω的不均衡性增大而增大,促使模型選擇更均衡的參數

例如:

均方差損失函數:loss = 1/N∑_i=1^N(yp ? y)2+λR(W)

輸入為:x = [1,1,1,1]現有2種不同的權重值,

w1 = [1,0,0,0],w2 = [0.25,0.25,0.25,0.25]

w1和w2與輸入的乘積都為1,但w2 與每一個輸入數據進行計算后都有數據,使得w2會學習到每一個特征信息。而w1只和第1個輸入信息有關系,容易出現過擬合現象,因此w2的效果會比w1 好

11.梯度下降

梯度下降算法用于求解損失函數的極小值,通過計算損失函數對每個ω的偏導數確定下降方向

12.反向傳播

BP(Back-propagation,反向傳播)前向傳播得到誤差,反向傳播調整誤差,再前向傳播,再反向傳播一輪一輪得到最優解的。

  • 反向傳播通過損失函數計算梯度,反向更新ω值,分為以下步驟:
    1. 隨機初始化ω。
    2. 前向傳播計算預測值(YP)和損失。
    3. 對每個ω求偏導(鏈式法則),代入當前ω值得到梯度方向。
    4. 根據學習率更新ω,迭代至收斂。
  • 深層網絡中,偏導計算因隱函數嵌套變得復雜(如30層網絡需29次鏈式求導)。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/94234.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/94234.shtml
英文地址,請注明出處:http://en.pswp.cn/web/94234.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

云原生俱樂部-k8s知識點歸納(8)

這一部分主要講一講CRD客戶資源定義、Gateway API、Priority Class優先類、HPA自動擴縮這四部分內容。還剩下Argo CD的內容了整個k8s,至于operator的話單獨有一本書,都是實戰內容。CRD客戶資源定義先來講一講這節內容的幾個核心術語,Custom R…

【機器學習】7.隨機森林之數學原理

隨機森林(Random Forest)的數學原理核心是“決策樹基學習器 Bootstrap抽樣 特征隨機選擇” 的集成框架,通過降低單棵決策樹的方差、提升模型泛化能力來工作。以下分步驟解析其數學推導與核心邏輯: 一、 基學習器:決策…

大模型微調面試題全解析:從概念到實戰

大模型微調面試題全解析&#xff1a;從概念到實戰 微調基礎概念 本文較長&#xff0c;建議點贊收藏&#xff0c;以免遺失。更多AI大模型開發 學習視頻/籽料/面試題 都在這>>Github<< >>gitee<< &#xff08;一&#xff09;什么是微調 微調&#xf…

Linux: network: arp: arp_accept

文章目錄 接收 linux 代碼 arp協議的處理 接收 arp_accept - BOOLEAN Define behavior for gratuitous ARP frames who’s IP is not already present in the ARP table: 0 - don’t create new entries in the ARP table 1 - create new entries in the ARP table Both repli…

SpringBoot 整合 Langchain4j RAG 技術深度使用解析

目錄 一、前言 二、Langchain4j RAG介紹 2.1 什么是LangChain4j 2.2 LangChain4j RAG技術介紹 2.2.1 RAG技術原理 2.2.2 LangChain4j中的RAG實現 2.2.3 LangChain4j RAG技術優勢 2.2.4 LangChain4j RAG技術應用場景 三、LangChain4j RAG 技術深度使用 3.1 文檔加載與解…

百度深度學習面試:batch_size的選擇問題

題目在深度學習中&#xff0c;為什么batch_size設置為1不好&#xff1f;為什么batch_size設為整個數據集的大小也不好&#xff1f;&#xff08;假設服務器顯存足夠&#xff09;解答這是一個非常核心的深度學習超參數問題。即使顯存足夠&#xff0c;選擇極端的 batch_size 也通常…

AWS Fargate 完全指南:在無服務器容器中釋放應用潛能

容器化技術帶來了應用交付的革命,但管理運行容器的底層服務器集群卻帶來了新的復雜性。如何在不犧牲容器靈活性的前提下,擺脫服務器的運維重負? AWS Fargate 應運而生。它是一款為容器打造的無服務器計算引擎,讓您能夠專注于構建應用程序,而無需管理服務器。本文將帶您深…

WSL Ubuntu數據遷移

將 WSL 中的 Ubuntu 遷移到其他磁盤可有效釋放 C 盤空間并優化系統性能。以下是詳細步驟及注意事項&#xff1a;&#x1f4cd; ??遷移步驟????備份 WSL 數據&#xff08;防止意外丟失&#xff09;??以管理員身份打開 PowerShell 或命令提示符。導出 Ubuntu 實例為壓縮包…

基于STM32的病房監測系統/環境監測系統/人體健康監測系統

基于STM32的病房監測系統/環境監測系統/人體健康監測系統 持續更新&#xff0c;歡迎關注!!! 基于STM32的病房監測系統/環境監測系統/人體健康監測系統 隨著科技的進步與人們健康意識的提升&#xff0c;環境與人體健康監測的需求日益增長。在醫療、居住和工作環境中&#xff0c…

【適合中小企業應用的Flask網站部署指南】【小白指南系列】如何在Windows Server服務器上部署Flask網站和SSL證書開啟HTTPS

【適合中小企業應用的Flask網站部署指南】【小白指南系列】如何在Windows Server服務器上部署Flask網站和SSL證書開啟HTTPS 前言&#xff1a; 上一篇文章已經配置好Redis數據庫和網站雛形建立了。現在完善了一個比較重大的功能和進度之后&#xff0c;我們嘗試初步將Flask項目網…

std::exchange詳解

一、基本概念與函數原型 std::exchange 是 C++14 引入的標準庫函數,定義于 <utility> 頭文件。其核心功能是原子性地替換對象的值并返回舊值,適用于資源管理、狀態機更新等場景。 函數原型: template <class T, class U = T> T exchange(T& obj,

kubernetes-dashboard使用http不登錄

安裝了k8s v1.28&#xff0c;想要安裝kubernetes-dashboard以便可視化管理平臺&#xff0c;網上很多資料都是版本比較低的&#xff0c;自己摸索了很久&#xff0c;終于搞定了。直接上配置文件&#xff0c;拿去kubectl apply -f k8s-dashb.yml就行了。 # Copyright 2017 The Kub…

道路車道線分割數據集左車道右車道中線labelme格式3494張4類別

數據集格式&#xff1a;labelme格式(不包含mask文件&#xff0c;僅僅包含jpg圖片和對應的json文件)圖片數量(jpg文件個數)&#xff1a;3494標注數量(json文件個數)&#xff1a;3494標注類別數&#xff1a;4標注類別名稱:["center_lane","right_lane","…

12.Shell腳本修煉手冊--函數的基礎認知與實戰演練(fock炸彈!!)

Shell 函數的知識與實踐 文章目錄Shell 函數的知識與實踐Shell 函數介紹Shell 函數的語法Shell 函數的執行1. 不帶參數的函數執行2. 帶參數的函數執行Shell 函數的基礎實踐示例 1&#xff1a;簡單的 hello 函數&#xff08;驗證 “先定義后調用”&#xff09;示例 2&#xff1a…

微信小程序設計的請求封裝方案(request.js)

以下是為微信小程序設計的請求封裝方案&#xff0c;包含代碼示例和最佳實踐建議&#xff1a; 基礎請求封裝&#xff08;request.js&#xff09; // 基礎配置 const BASE_URL https://api.yourdomain.com; const TIMEOUT 10000;// 請求封裝函數 const request (options) >…

【Linux系統】進程信號:信號的處理

上一篇文章在介紹完信號的產生和保存后&#xff0c;我們現在對信號有了一個基本的認識&#xff0c;信號由鍵盤、系統調用、硬件異常、軟件條件等方式產生&#xff0c;然后被保存在三張表中&#xff0c;再將信號遞達&#xff0c;操作系統有三種處理方式&#xff1a;默認處理、忽…

權限管理模塊

登錄相關權限管理模塊(基礎版)模塊設計與實現優化點&#xff1a;前后端用戶驗證實現方式常見的攻擊手段及防御手段權限管理模塊(基礎版) RBAC(Role-Base Access Control&#xff0c;基于角色的訪問控制)&#xff1a;是權限管理的常用方案。 核心&#xff1a;通過用戶 - 角色 -…

征服與守護:從拉里·埃里森看八號人格的職場王者之道

真正的強者&#xff0c;從不遵守別人的規則2010年&#xff0c;加利福尼亞州的圣何塞機場迎來了一架不速之客——一架意大利產的馬基戰斗機以一種極其霸道的姿態降落在跑道上。艙蓋打開&#xff0c;走下來的不是空軍飛行員&#xff0c;而是一位身穿飛行員服、戴著墨鏡的企業家&a…

【Linux系統】命名管道與共享內存

前言&#xff1a; 上文我們講到了匿名管道【Linux系統】匿名管道以及進程池的簡單實現-CSDN博客 本文我們來講一講命名管道與共享內存 命名管道 上面我們講到&#xff0c;匿名管道只能用于有血緣關系&#xff08;尤其父子&#xff09;的進程進行通信&#xff01;但如果…

搜索體驗優化:ABP vNext 的查詢改寫(Query Rewrite)與同義詞治理

&#x1f50e; 搜索體驗優化&#xff1a;ABP vNext 的查詢改寫&#xff08;Query Rewrite&#xff09;與同義詞治理 &#x1f4da; 目錄&#x1f50e; 搜索體驗優化&#xff1a;ABP vNext 的查詢改寫&#xff08;Query Rewrite&#xff09;與同義詞治理1. 背景與問題界定 &…