【深度學習神經網絡學習筆記(二)】神經網絡基礎

神經網絡基礎

    • 神經網絡基礎
    • 前言
    • 1、Logistic 回歸
    • 2、邏輯回歸損失函數
    • 3、梯度下降算法
    • 4、導數
    • 5、導數計算圖
    • 6、鏈式法則
    • 7、邏輯回歸的梯度下降

神經網絡基礎

前言

Logistic 回歸是一種廣泛應用于統計學和機器學習領域的廣義線性回歸模型,主要用于解決二分類問題。盡管名字中包含“回歸”二字,但它實際上是一種分類方法。Logistic 回歸通過使用logistic函數(或者稱為sigmoid函數)來預測一個事件發生的概率。

備注:本系列文章基于B站課程: 122集付費!CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度學習神經網絡一口氣全部學完!學習整理得到。

1、Logistic 回歸

邏輯回歸是一個主要用于解決二分類問題的算法。那么邏輯回歸是給定一個 x,輸出一個該樣本屬于 1 對應類別的預測概率 ?=P(y=1|x)

Logistic 回歸中使用的參數如下:

在這里插入圖片描述

在這里插入圖片描述
在這里插入圖片描述
例如:
在這里插入圖片描述

2、邏輯回歸損失函數

損失函數(loss function)用于衡量預測結果與真實值之間的誤差。最簡單的損失函數定義方式為平方差損失:
在這里插入圖片描述

3、梯度下降算法

目的:使損失函數的值找到最小值
方式:梯度下降
函數的梯度(gradient)指出了函數的最陡增長方向。梯度的方向走,函數增長得就越快。那么按照梯度的負方向走,函數值自然就降低得最快了。模型的訓練目標即是尋找合適的 w 與 b 以最小化代價函數值。假設 w 與 b 都是一維實數,那么可以得到如下的 J 關于 w 與 b 的圖:
在這里插入圖片描述
可以看到,成本函數 J 是一個凸函數,與非凸函數的區別在于其不含有多個局部最低。
參數 w 與 b 的更新公式為:
在這里插入圖片描述
注:其中 α 表示學習速率,即每次更新的 w 的步伐長度。當 w 大于最優解 w’ 時,導數大于0,那就是向更小的方向更新。反之當 w 小于最優解 w’ 時,導數小于0,那么 w 就會向更大的方向更新迭代直到收斂。

通過平面來理解梯度下降過程:在這里插入圖片描述

4、導數

理解梯度下降的過程之后,通過例子來說明梯度下降在計算導數意義或者說這個導數的意義。
導數也可以理解成某一點處的斜率。

  • 各點處的導數值一樣

    在這里插入圖片描述
    我們看到這里有一條直線,這條直線的斜率為4,我們來計算一個例子:
    取一點為 a=2,那么 y 的值為8,我們稍微增加 a =2.001,那么 y 的值為 8.004,也就是當 a 增加了 0.001,隨后 y 增加了 0.004,即4倍

那么我們這個斜率可以理解為當一個點偏移一個不可估量的小的值,所增加的為 4 倍,可以記作:
在這里插入圖片描述

  • 各點處的導數值不全一致
    在這里插入圖片描述
    例:
    取一點為 a=2,那么 y 的值為4,我們稍微增加 a 的值為 a=2.001,那么 y 的值約等于 4.004(4.004001)就是當 a 增加了 0.001,隨后 y 增加了 4 倍;
    取一點為 a=5,那么 y 的值為25,我們稍微增加 a 的值為 a=5.001,那么 y 的值約等于 25.01(25.010001)就是當 a 增加了 0.001,隨后 y 增加了 10 倍;
    可以得出該函數的導數為 2a

5、導數計算圖

那么接下來我們來看看含有多個變量的到導數流程圖,假設 J(a,b,c) = 3(a+bc)
我們以下面的流程圖代替:
在這里插入圖片描述
這樣就相當于從左到右計算出結果,然后從后往前計算出導數

導數計算:
在這里插入圖片描述
這里涉及到鏈式法則

6、鏈式法則

鏈式法則(Chain Rule)是微積分中用于計算復合函數導數的一個基本法則。當你有一個復合函數,即一個函數的輸出是另一個函數的輸入時,鏈式法則允許你通過計算各個函數的導數并將它們相乘來找到復合函數的導數。

假設有兩個函數 f 和 g,其中 g 的定義域和 f 的值域相同,我們可以構成一個復合函數 f(g(x))。鏈式法則表明復合函數 f(g(x)) 對 x 的導數可以通過以下方式計算:
在這里插入圖片描述
這里:

  • f′(g(x)) 是外函數 f 在 g(x) 處的導數;
  • g′(x) 是內函數 g 在 x 處的導數

例如:
假設我們有以下復合函數:
h(x)=f(g(x))=(3x 2+2) 4
在這里插入圖片描述

7、邏輯回歸的梯度下降

邏輯回歸的梯度下降過程計算圖,首先從前往后的計算圖得出如下:
在這里插入圖片描述
那么計算圖從前向過程為,假設樣本有兩個特征
在這里插入圖片描述
問題:計算出 J 關于 z 的導數
在這里插入圖片描述
所以我們這樣可以求出總損失相對于 w1 w2 b 參數的某一點導數,從而可以更新參數:
在這里插入圖片描述

所以當我們計算損失函數的某個點相對于 w1 w2 b 的導數之后,就可以更新這次優化后的結果:
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/896301.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/896301.shtml
英文地址,請注明出處:http://en.pswp.cn/news/896301.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

002簡單MaterialApp主題和Scaffold腳手架

002最簡單的MaterialApp主題和Scaffold腳手架使用導航欄_嗶哩嗶哩_bilibilihttps://www.bilibili.com/video/BV1RZ421p7BL?spm_id_from333.788.videopod.episodes&vd_source68aea1c1d33b45ca3285a52d4ef7365f&p1501.MaterialApp純凈的 /*MaterialApp 是主題,自帶方向設…

DeepSeek開源周Day1:FlashMLA引爆AI推理性能革命!

項目地址:GitHub - deepseek-ai/FlashMLA 開源日歷:2025-02-24起 每日9AM(北京時間)更新,持續五天! ? 一、開源周震撼啟幕 繼上周預告后,DeepSeek于北京時間今晨9點準時開源「FlashMLA」,打響開源周五連…

17.C++類型轉換

1. C語言中的類型轉換 在C語言中,如果賦值運算符左右兩側類型不同,或者形參與實參類型不匹配,或者返回值類型與接收返回值類型不一致時,就需要發生類型轉換,C語言中共有兩種形式的類型轉換:隱式類型轉換和顯…

springboot志同道合交友網站設計與實現(代碼+數據庫+LW)

摘 要 現代經濟快節奏發展以及不斷完善升級的信息化技術,讓傳統數據信息的管理升級為軟件存儲,歸納,集中處理數據信息的管理方式。本志同道合交友網站就是在這樣的大環境下誕生,其可以幫助使用者在短時間內處理完畢龐大的數據信…

VMware中的linux常用指令

常用 Linux 基礎命令 文件與目錄操作 ls:查看當前目錄的文件和子目錄,ls -a顯示所有文件,包括隱藏文件。cd:切換目錄,如 **cd ~** 切換到個人家目錄。pwd:查看當前目錄。mkdir:創建文件夾&#…

20250212:https通信

1:防止DNS劫持:使用 https 進行通信。 因為是SDK授權開發,需要盡量壓縮so庫文件和三方依賴。所以第一想法是使用 head only 的 cpp-httplib 進行開發。 cpp-httplib 需要 SSL 版本是 3.0及以上。但本地已經在開發使用的是1.0.2a版本,不滿足需求。 方案1:升級OpenSSL 將Op…

VisionPro-PMA工具

VisionPro-PMA工具 模板匹配的核心概念 康耐視(Cognex)的VisionPro是一款廣泛應用工業自動化的機器視覺軟件平臺,其模板匹配(Pattern Matching)功能是核心工具之一,常用與目標定位、特征識別和質量檢測等場景。 模板匹配:通過預先定義的參…

2025最新最全【大模型學習路線規劃】零基礎入門到精通_大模型 開發 學習路線

第一階段:基礎理論入門 目標:了解大模型的基本概念和背景。 內容: 人工智能演進與大模型興起。 大模型定義及通用人工智能定義。 GPT模型的發展歷程。 第二階段:核心技術解析 目標:深入學習大模型的關鍵技術和工…

使用CSS3DRenderer/CSS2DRenderer給模型上面添加html標簽

先放一下預覽圖 主要使用css2dRender和css3dRender,添加圖片和標簽。 思路:使用css3dRender添加一個圖片,然后獲取的位置坐標,使用css3dRender添加一個文字標簽,也設置這個位置坐標,此外z軸設置一個高度&a…

完美隱藏滾動條方案 (2024 最新驗證)

完美隱藏滾動條方案 (2024 最新驗證) css /* 全局隱藏豎直滾動條但保留滾動功能 */ html {overflow: -moz-scrollbars-none; /* Firefox 舊版 */scrollbar-width: none; /* Firefox 64 */-ms-overflow-style: none; /* IE/Edge */overflow-y: overlay; …

Linux 內核配置機制詳細講解

本文是對 Linux 內核配置機制 make menuconfig 的 超詳細分步解析,涵蓋其工作原理、界面操作、配置邏輯及底層實現: 一、內核配置系統概述 Linux 內核的配置系統是一個 基于文本的交互式配置工具鏈,核心目標是通過定義 CONFIG_XXX 宏來控制內…

視頻裂變加群推廣分享引流源碼

源碼介紹 視頻裂變加群推廣分享引流源碼 最近網上很火,很多人都在用,適合引流裂變推廣 測試環境:PHP7.4(PHP版本不限制) 第一次訪問送五次觀看次數,用戶達到觀看次數后需要分享給好友或者群,好友必須點擊推廣鏈接后才會增加觀看次…

python-leetcode-每日溫度

739. 每日溫度 - 力扣(LeetCode) class Solution:def dailyTemperatures(self, temperatures: List[int]) -> List[int]:n len(temperatures)answer [0] * nstack [] # 存儲索引for i, temp in enumerate(temperatures):while stack and temperat…

文件下載技術的終極選擇:`<a>` 標簽 vs File Saver.js

文件下載技術的終極選擇&#xff1a;<a> 標簽 vs File Saver.js 在 Web 開發中&#xff0c;文件下載看似簡單&#xff0c;實則暗藏玄機。工作種常糾結于 <a> 標簽的原生下載和 File Saver.js 等插件的靈活控制之間。本文將從原理、優缺點、場景對比到實戰技巧&…

deepseek sse流式輸出

鏈接 semi-ui-vue聊天組件 - 可以用這個組件優化界面 sse服務端消息推送 webflux&webclient Hi-Dream-Blog - 參考這個博客&#xff0c;可以在后臺將markdown語法轉為html 文章目錄 鏈接效果代碼pom.xmlDeepSeekControllerWebConfigDeepSeekClientAiChatRequestAiChatM…

Linux時間日期類指令

1、data指令 基本語法&#xff1a; date &#xff1a; 顯示當前時間date %Y : 顯示當前年份date %m &#xff1a; 顯示當前月份date %d &#xff1a; 顯示當前哪一天date “%Y-%m-%d %H:%M:%S" &#xff1a; 顯示年月日時分秒date -s 字符串時間 &#xff1a; 設置系統時…

SQLMesh 系列教程9- 宏變量及內置宏變量

SQLMesh 的宏變量是一個強大的工具&#xff0c;能夠顯著提高 SQL 模型的動態化能力和可維護性。通過合理使用宏變量&#xff0c;可以實現動態時間范圍、多環境配置、參數化查詢等功能&#xff0c;從而簡化數據模型的開發和維護流程。隨著數據團隊的規模擴大和業務復雜度的增加&…

鵬哥c語言數組(初階數組)

前言&#xff1a; 對應c語言視頻54集 內容&#xff1a; 一維數組的創建 數組是一組相同元素的集合&#xff0c; 數組的創建方式 type_t就是數組的元素類型&#xff0c;const_n是一個常量表達式&#xff0c;用來指定數組的大小 c99標準之前的&#xff0c;數組的大小必須是…

爬蟲運行后如何保存數據?

爬蟲運行后&#xff0c;將獲取到的數據保存到本地或數據庫中是常見的需求。Python 提供了多種方式來保存數據&#xff0c;包括保存為文本文件、CSV 文件、JSON 文件&#xff0c;甚至存儲到數據庫中。以下是幾種常見的數據保存方法&#xff0c;以及對應的代碼示例。 1. 保存為文…

計算機視覺:經典數據格式(VOC、YOLO、COCO)解析與轉換(附代碼)

第一章&#xff1a;計算機視覺中圖像的基礎認知 第二章&#xff1a;計算機視覺&#xff1a;卷積神經網絡(CNN)基本概念(一) 第三章&#xff1a;計算機視覺&#xff1a;卷積神經網絡(CNN)基本概念(二) 第四章&#xff1a;搭建一個經典的LeNet5神經網絡(附代碼) 第五章&#xff1…