機器學習2-梯度下降與反向傳播

損失函數 與 平均方差函數 傻傻分不清

損失函數是概念;平均方差函數是具體的實現

損失函數(如均方誤差 MSE)用于衡量模型預測值與真實值之間的差距。損失越小,說明模型對當前數據的擬合越好。

但模型并非擬合度越高越好,假設模型輸入它沒見過的數據,模型預測的結果跟實際出入很大,不符合要求,這種現象叫過擬合;如果模型對新數據也有很好的預測效果,就是泛化能力強

后續。。。

?對于直線模型很簡單,但是世界事物的規律是很復雜的不能通過直線模型來表達,更多是彎彎曲曲的曲線,要描述這樣曲線 是通過? 非線性函數 (激活函數) 嵌套線性函數,一層嵌套還是不能描述出這樣復雜曲線,就需要n多層的這樣嵌套函數,理論上能造出非常復雜的曲線(很抽象很難理解)

激活函數 :

梯度下降:

w = w - 學習率 × ?L/?w

臥槽! 這個公式是什么意思?其實???L/?w 是梯度,還是不懂,什么是梯度?回到二維平面,這個梯度等同與初中數學的斜率。這里拋物線描述的是直線模型的損失函數在變量w 方向上變化?。機器通過不斷調整w值讓損失函數最小,什么時候最小? 答:頂點最小,頂點怎么求?有頂點公式,也可以使用? ?導數 = 0 求出。

但是復雜模型的損失函數不是一條簡單的拋物線,于是就有梯度下降算法,本質上是不斷猜和試,但是不能盲猜,面多加水,水多加面,水和面不能一下加太多,就使用小勺子(學習率)慢慢調

如下圖

?當切點在右邊是正數,就減去一點點;?當切點在左邊是負數數,負負得正加一點點。就這樣一點點不斷地試,總有w是某個值,讓損失函數最小。

而 ?L/?w是高緯度的曲面的表面曲線求導,這里方便人的理解,高維我這里通常指3維,4維我們想象不出來!

下圖是一座大山,是3維立體的,紅線就是曲面上的某條曲線?,像不像一個個階梯,?L/?w 就好比下山某條曲線的陡峭程度,如果?L/?w的絕對值(包含正負數)越大 說明越陡峭!?L/?w如果是正數右傾斜,如果是負數表示左傾斜

?L/?w 那是多少怎么算?? 這里是使用 鏈式法則(不展開講,高數不過關,但這不影響我們理解,機器會就行)

總結一下:

W新 = W當前 - 學習率 × ?L/?w

這個是公式指導機器如何自己調整W值,當W猜測是3時,預測值與真實值誤差大了,?L/?w就變大,那我猜測新的W 值,就需要減少一點?L/?w。?L/?w有時很大,就需要使用學習率進行縮放。回到下山例子就是,人下山既要快,就需要選擇最陡峭的路線,但是不安全,就需要使用學習率控制,要快也要安全。

反向傳播:在神經網絡從后往前,使用損失函數指導修改預測函數參數的過程,就是反向傳播

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/86794.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/86794.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/86794.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

安全生產風險管控平臺:企業安全管理的智能化解決方案

在工業生產、建筑施工、能源化工等領域,安全生產是企業可持續發展的基石。然而,傳統安全管理模式依賴人工巡檢、紙質記錄和事后處理,難以滿足現代化企業的高效風險管控需求。安全生產風險管控平臺應運而生,它利用物聯網、大數據、…

如何保證數據庫與 Redis 緩存的一致性?

在現代互聯網應用中,Redis 緩存幾乎是性能優化的標配。但在使用過程中,一個繞不過去的問題就是: 如何保證 Redis 緩存與數據庫之間的數據一致性? 特別是在高并發場景下,讀寫操作錯位可能導致緩存中出現臟數據&#xff…

現代 JavaScript (ES6+) 入門到實戰(三):字符串與對象的魔法升級—模板字符串/結構賦值/展開運算符

在前兩篇,我們升級了變量和函數。今天,我們要給 JavaScript 中最常用的兩種數據類型——字符串(String)和對象(Object)——裝備上 ES6 帶來的強大魔法。 準備好告別丑陋的 號拼接和重復的對象屬性賦值了嗎…

GitLab 備份恢復與配置遷移詳盡教程(實戰版)

🛠 GitLab 備份恢復與配置遷移詳盡教程(實戰版) 🧱 一、環境準備 1.1 檢查版本一致性 恢復目標機 GitLab 版本必須與備份文件所用版本一致或兼容(推薦相同版本) 查看當前 GitLab 版本: sudo g…

英飛凌高性能BMS解決方案助力汽車電動化

隨著電動汽車越來越被大眾接受,車輛電氣化、智能化程度越來越高,如何提高電動汽車的續航里程,同時保障車輛安全可靠持久運行是當前最主要的技術難題之一。而先進的電池管理系統 (BMS)有助于克服電動汽車廣泛普及的關鍵障礙:續航里…

react + ant-design實現數字對比動畫效果:當新獲取的數字比之前展示的數字多或少2時,顯示“+2”或“-2”的動畫效果

react ant-design實現數字對比動畫效果:當新獲取的數字比之前展示的數字多或少2時,顯示“2”或“-2”的動畫效果 1. 創建獨立的 AnimatedValue 組件 // components/AnimatedValue/index.jsx import React, { useState, useEffect, useRef } from reac…

自動化測試--Appium和ADB及常用指令

1.Appium Appium工具庫: appium server:服務器(類似于瀏覽器的驅動),核心進行客戶端命令的接受,完成設備的自動化指令 appium client:客戶端,讓代碼進行調用,發送自動化的…

2025.6.29總結

有一點我很好奇,工作后,我該拿什么去衡量自己的進步呢? 在我的大學四年,確實有個量化的標準,讀了多少本書,寫了多少篇總結,多少篇技術博客,多少行代碼,運動了多少公里&a…

Docker 部署 Kong云原生API網關

Docker 部署 Kong云原生API網關 本指南提供了在 Docker Compose 上配置 Kong Gateway 的步驟,基于有數據庫模式的配置。本指南中使用的數據庫是 PostgreSQL。 前置條件 準備一臺Ubuntu服務器: 節點IP: 192.168.73.11操作系統: Ubuntu 24…

深度剖析 Apache Pulsar:架構、優勢與選型指南

Apache Pulsar 是一款云原生分布式消息流平臺,融合了消息隊列、流處理和存儲能力,采用獨特的“存儲計算分離”架構(Broker 無狀態 BookKeeper 持久化存儲)。以下從核心特性、對比優勢及適用場景展開分析: 一、Pulsar…

java 導出word 實現循環表格

如果是固定的值 用 {{}} 即可 但是如果是循環表格,那么就需要制定模板為如圖 然后在處理表格數據時候: /*** 傳入 節點對象 返回生成的word文檔* param flangeJoint* return* throws IOException*/private XWPFTemplate getXwpfTemplate(CmComplaintEn…

XIP (eXecute In Place)

NOR Flash 能直接執行代碼(XIP)而 NAND Flash 不能,根本原因在于它們的物理結構和訪問接口存在本質區別。下面用技術原理 + 現實比喻幫你徹底理解: 1. XIP 是什么? XIP (eXecute In Place) 指代碼不需要從存儲介質復制到 RAM,而是 CPU 直接從存儲介質(如 Flash)中讀取…

【android bluetooth 協議分析 10】【AVRCP詳解1】【PlaybackStateCompat類如何查看】

1. 問題 android/app/src/com/android/bluetooth/avrcpcontroller/AvrcpControllerService.java import android.support.v4.media.MediaBrowserCompat.MediaItem; import android.support.v4.media.session.PlaybackStateCompat;private int toPlaybackStateFromJni(int fro…

【AI學習從零至壹】LLM模型prompt開發及?模型應?

LLM模型prompt開發及?模型應? ?語?模型 LLM如何構建?個AI對話系統關于模型的訓練 ollama調?LLM模型設置API KEY測試一個對話 prompt提示詞提示詞結構特征提示詞的五大核心價值1. 信息傳遞的精準性2. 輸出質量的可控性3. 用戶意圖的對?性4. 復雜任務的拆解性5. 倫理?險的…

ubuntu20.04如何給appImage創建快捷方式

ubuntu20.04如何給appImage創建快捷方式 1. 確保AppImage是可執行的 chmod x /path/to/your/appimage2. 創建.desktop文件 在~/.local/share/applications/目錄下創建一個新的 .desktop 文件: vi ~/.local/share/applications/your-appname.desktop添加以下內容…

RT-Thread 詳解:國產開源實時操作系統

一、RT-Thread 概述 定義:RT-Thread 是中國自主研發的開源實時操作系統(RTOS),兼具實時性與物聯網(IoT)特性,支持從資源受限的 MCU(如 STM32、ESP32)到高性能處理器&…

Wan2 1-VACE

簡介 VACE是阿里新開源的視頻編輯/生成框架,號稱能夠執行任意的視頻編輯/生成。總體而言,該模型在整體結構上并沒有太大改變,僅僅是在原Wan2.1模型的基礎上,加了一個接受mask和視頻輸入的controlnet而已。但是這篇文章認為&#…

基于 opencv+yolov8+easyocr的車牌追蹤識別

(本項目所有代碼打包至我的資源中,大家可在我的文章底部選擇下載) 目錄 需求 實現效果 學習視頻 大致思路 代碼實現 資源下載 需求 通過車輛識別技術,識別視頻中每個車輛及其車牌號,車輛應進行追蹤,避免重復…

sqlserver函數與過程(二)

過程 SQLserver 過程是具有特定功能,可多次對數據表操作的獨立模塊。返回值通常用return 返回整數 0,1…。(可選)也可通過output 參數或select 語句返回結果集。 1.過程的定義 本過程定義了一個過程,輸入一個動態SQL語句&#…

OpenCV學習3

1、創建圖像窗口滑動條 OpenCV 4中通過createTrackbar()函數在顯示圖像的窗口上創建滑動條。 int cv::createTrackbar(const String &trackbarname,const String &winname, int *value, int count, TrackbarCallback onChange 0, void *us…