反向傳播的核心是什么：計算損失函數對可訓練參數的梯度=== 損失函數能通過計算圖連接到可訓練參數

反向傳播的核心是什么：計算損失函數對可訓練參數的梯度=== 損失函數能通過計算圖連接到可訓練參數

bicheng/2025/6/27 9:08:46/文章來源:https://blog.csdn.net/qq_38998213/article/details/148497374

反向傳播的核心是什么：計算損失函數對可訓練參數的梯度

損失函數能通過計算圖連接到可訓練參數

在深度學習中，反向傳播的核心是計算損失函數對可訓練參數的梯度，從而更新這些參數。對于LLM（大型語言模型）而言，是否需要“LLM輸出的參數”才能進行反向傳播

一、反向傳播的基本原理

反向傳播的前提是：

存在可訓練的參數（如權重矩陣、偏置項、嵌入向量等）。
損失函數與這些參數之間存在可導的計算圖。

無論模型輸出是什么，只要損失函數能通過計算圖連接到可訓練參數，即可進行反向傳播。
關鍵點：反向傳播的目標是更新參數，而不是“依賴模型輸出的參數”。模型輸出（如生成的文本、分類概率）是計算損失的依據，但不是反向傳播的必需條件。

二、LLM反向傳播的兩種典型場景

1. 訓練LLM本體參數（如預訓練或微調）

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/84032.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/84032.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/84032.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

KINGCMS被入侵

KINGCMS被入侵

現象會強制跳轉到一個異常網站,請掉截圖代碼. 代碼中包含經過混淆處理的JavaScript，它使用了一種技術來隱藏其真實功能。代碼中使用了eval函數來執行動態生成的代碼，這是一種常見的技術，惡意腳本經常使用它來隱藏其真實目的。這段腳本會檢…

閱讀更多...

深入探索串的高級操作：從算法到 LeetCode 實戰

深入探索串的高級操作：從算法到 LeetCode 實戰

串是編程中最常用的數據結構之一，從簡單的文本處理到復雜的文本匹配算法，串的應用無處不在。在掌握了串的基本概念、存儲結構以及KMP算法之后，現在讓我們深入探索串的更多高級操作，例如求子串、串的替換等，并通過LeetC…

閱讀更多...

在rocky linux 9.5上在線安裝 docker

在rocky linux 9.5上在線安裝 docker

前面是指南，后面是日志 sudo dnf config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo sudo dnf install docker-ce docker-ce-cli containerd.io -y docker version sudo systemctl start docker sudo systemctl status docker …

閱讀更多...

OneNet + openssl + MTLL

OneNet + openssl + MTLL

1.OneNet 使用的教程 1.在網絡上搜索onenet，注冊并且登錄賬號。 2.產品服務-----物聯網服務平臺立即體驗 3.在底下找到立即體驗進去 4.產品開發------創建產品 5.關鍵是選擇MQTT，其他的內容自己填寫 6.這里產品以及開發完成，接下來就是添加設…

閱讀更多...

【Fiddler工具判斷前后端Bug】

【Fiddler工具判斷前后端Bug】

Fiddler工具判斷前后端Bug的方法使用Fiddler抓包工具可以高效定位問題是出在前端還是后端，主要通過分析請求和響應的內容、狀態碼、數據格式等關鍵信息。分析請求是否成功發送檢查請求是否從客戶端正確發出，觀察Fiddler抓取的請求列表。若請求未出…

閱讀更多...

【論文閱讀筆記】《A survey on deep learning approaches for text-to-SQL》

【論文閱讀筆記】《A survey on deep learning approaches for text-to-SQL》

文章目錄一、論文基本信息1. 文章標題2. 所屬刊物/會議3. 發表年份4. 作者列表5. 發表單位二、摘要三、解決問題四、創新點五、自己的見解和感想六、研究背景七、研究方法（模型、實驗數據、評估指標）八、總結（做了什么、得到了什么、有什么…

閱讀更多...

【強連通分量縮點最長路拓撲排序】P2656 采蘑菇|普及+

【強連通分量縮點最長路拓撲排序】P2656 采蘑菇|普及+

本文涉及知識點 C圖論強連通分量縮點最長路拓撲排序 P2656 采蘑菇題目描述小胖和 ZYR 要去 ESQMS 森林采蘑菇。 ESQMS 森林間有 N N N 個小樹叢， M M M 條小徑，每條小徑都是單向的，連接兩個小樹叢，上面都有一定數量的…

閱讀更多...

Dubbo Logback 遠程調用攜帶traceid

Dubbo Logback 遠程調用攜帶traceid

背景 A項目有調用B項目的服務，A項目使用 logback 且有 MDC 方式做 traceid，調用B項目的時候，traceid 沒傳遞過期，導致有時候不好排查問題和鏈路追蹤準備工作因為使用的是 alibaba 的 dubbo 所以需要加入單獨的包 <depend…

閱讀更多...

nodejs：用 nodemailer 發送一封帶有附件的郵件

nodejs：用 nodemailer 發送一封帶有附件的郵件

我們將使用 nodemailer 庫來發送帶有附件的郵件。首先，確保已經安裝了nodemailer。如果沒有安裝，可以通過 npm install nodemailer 來安裝。 cnpm install nodemailer --save dependencies: – nodemailer ^7.0.3 步驟： 引入nodemailer模…

閱讀更多...

Scade 語言概念 - 方程(equation)

Scade 語言概念 - 方程(equation)

在 Scade 6 程序中自定義算子(Operator)的定義、或數據流定義(data_def)的內容中，包含一種基本的語言結構：方程(equation)(注1)。在本篇中，將敘述 Scade 語言方程的文法形式，以及作用。注1: 對 Scade 中的 equation, 或 equation…

閱讀更多...

STM32開發，創建線程棧空間大小判斷

STM32開發，創建線程棧空間大小判斷

1. 使用RTOS提供的API函數（以FreeRTOS為例） 函數原型：UBaseType_t uxTaskGetStackHighWaterMark(TaskHandle_t xTask)功能：獲取指定任務堆棧中剩余的最小空間（以字為單位，非字節）。使用步驟&am…

閱讀更多...

thinkphp8.1 調用巨量廣告API接口，刷新token

thinkphp8.1 調用巨量廣告API接口，刷新token

1、在mysql中建立表sys_token; CREATE TABLE sys_token (id int UNSIGNED NOT NULL,access_token varchar(50) COLLATE utf8mb4_general_ci NOT NULL,expires_in datetime NOT NULL,refresh_token varchar(50) COLLATE utf8mb4_general_ci NOT NULL,refresh_token_expires_in …

閱讀更多...

【leetcode】遞歸，回溯思想 + 巧妙解法-解決“N皇后”，以及“解數獨”題目

【leetcode】遞歸，回溯思想 + 巧妙解法-解決“N皇后”，以及“解數獨”題目

📚?前言 🌟 本期內容亮點：我們將深入解析力扣（LeetCode）上的幾道經典算法題，涵蓋不同難度和題型，幫助大家掌握解題思路和代碼實現技巧。無論是準備面試還是提升算法能力，這些題解都…

閱讀更多...

【iOS安全】iPhone X iOS 16.7.11 (20H360) WinRa1n 越獄教程

【iOS安全】iPhone X iOS 16.7.11 (20H360) WinRa1n 越獄教程

前言越獄iPhone之后，一定記得安裝一下用于屏蔽更新的描述文件（可使用愛思助手） 因為即便關閉了自動更新，iPhone仍會在某些時候自動更新系統，導致越獄失效；更為嚴重的是，更新后的iOS版本可能是…

閱讀更多...

??高頻通信與航天電子的材料革命：獵板PCB高端壓合基材技術解析??

??高頻通信與航天電子的材料革命：獵板PCB高端壓合基材技術解析??

—聚酰亞胺/陶瓷基板在5G與航天場景的產業化應用?? ??一、極端環境材料體系：突破溫域與頻率極限?? ??聚酰亞胺基板（PI）的航天級穩定性?? 獵板在衛星通信PCB中采用真空層壓工藝處理聚酰亞胺基材（Dk≈10.2）&a…

閱讀更多...

pikachu靶場通關筆記13 XSS關卡09-XSS之href輸出

pikachu靶場通關筆記13 XSS關卡09-XSS之href輸出

目錄一、href 1、常見取值類型 2、使用示例 3、安全風險二、源碼分析 1、進入靶場 2、代碼審計 3、滲透思路三、滲透實戰 1、注入payload1 2、注入payload2 3、注入payload3 本系列為通過《pikachu靶場通關筆記》的XSS關卡(共10關）滲透集合&#xff…

閱讀更多...

day26-計算機網絡-4

day26-計算機網絡-4

1. tcp的11種狀態 ss -ant -a 表示看所有狀態 -n 表示不將ip解析為主機名 -t 表示tcp 1.1. closed狀態（客戶端、服務端） 客戶端發起建立連接前的狀態服務端啟動服務前的狀態 1.2. listen狀態（服務端） 服務端軟件運行的時候狀…

閱讀更多...

基于autodl部署Cross-Modal-Re-ID-baseline

基于autodl部署Cross-Modal-Re-ID-baseline

https://arxiv.org/abs/2001.04193 https://github.com/mangye16/Cross-Modal-Re-ID-baseline/tree/master?tabreadme-ov-file# 需要SYSU-MM01.zip pip install numpy pandas scipy scikit-learn pillow tqdm把SYSU-MM01放到…/Datasets/SYSU-MM01/ori_data下先運行pytho…

閱讀更多...

線程安全集合

線程安全集合

前置閱讀： 數據結構等算法概念樹堆排序鎖相關概念： 鎖概念鎖實現隊列 Queue 與 Deque 的區別 Queue 是單端隊列，只能從一端插入元素，另一端刪除元素，實現上一般遵循先進先出（FIFO） 規則…

閱讀更多...

ESP32與STM32

ESP32與STM32

ESP32與STM32深度對比：物聯網與嵌入式開發的王者之爭一、核心架構對比 1.1 ESP32 - 無線物聯網霸主 // 典型雙核架構配置 #include "freertos/FreeRTOS.h" #include "freertos/task.h"void app_main() {// 核心0執行無線通信任務xTaskCreat…

閱讀更多...

最新文章