（四）優化函數，學習速率與反向傳播算法--九五小龐

（四）優化函數，學習速率與反向傳播算法--九五小龐

news/2025/8/8 11:09:11/文章來源:https://blog.csdn.net/qq_37241964/article/details/136423538

多層感知器

在這里插入圖片描述

梯度下降算法

梯度的輸出向量表明了在每個位置損失函數增長最快的方向，可將它視為表示了在函數的每個位置向那個方向移動函數值可以增長。
曲線對應于損失函數。點表示權值的當前值，即現在所在的位置。
梯度用箭頭表示，表明為了增加損失，需要向右移動。此外，箭頭的長度概念化地表示了如果在對應的方向移動，函數值能夠增長多少。如果向著梯度的反方向移動，則損失函數的值會相應減少。

學習速率

梯度就是表明損失函數相對參數的變化率，對梯度進行縮放的參數被稱為學習速率（learning rate）或可稱之為步長
學習速率是一種超參數或對模型的一種手工可配置的設置，需要為它指定正確的值。如果學習速率太小，則找到損失函數極小值點時可能需要許多輪迭代；如果太大，則算法可能會“跳過”極小值點并且因為周期性的“跳躍”而永遠無法找到極小值點。
在具體實踐中，可通過查看損失函數值隨時間變化曲線，來判斷學習速率的選取是否合適
合適的學習速率，損失函數隨時間下降，直到一個底部，不合適的學習速率，損失函數可能會發生震蕩

學習速率選取原則

在調整學習速率時，既要使其足夠小，保證不至于發生超調，也要保證它足夠大，以使損失函數能夠盡快下降，從而可通過較少次數的迭代更快的完成學習

反向傳播算法

反向傳播算法是一種高效計算數據流圖中梯度的技術，每一層的導數都是后一層的導數與前一層輸出之積，這正是鏈式法則的奇妙之處，誤差反向傳播算法利用的正是這一特點。
前饋時，從輸入開始，逐一計算每個隱含層的輸出，直到輸出層。
然后開始計算導數，并從輸出層經各隱含層逐一反向傳播。為了減少計算量，還需對所有已完成計算的元素進行復用。這便是反向傳播算法名稱的由來。

常見的優化函數

優化器（optimizer）是編譯模型的所需要的兩個參數之一。
可以先實例化一個優化器對象，然后將它傳入model.compile(),或者你可以通過名稱來調用優化器。在后一種情況下，將使用優化器的默認參數。

SGD：隨機梯度下降優化器

隨機梯度下降優化器SGD和min-batch是同一個意思，抽取m個小批量（獨立同分布）樣本，通過計算他們平梯度均值。

SGD參數

在這里插入圖片描述

RMSprop：網絡優化算法

經驗上，RMSprop被證明有效且使用的深度學習網絡優化算法
RMSprop增加了一個衰減系數來控制歷史信息的獲取多少，RMSprop會對學習率進行衰減。
建議使用優化器的默認參數（除了學習率lr，它可以被自由調節）
這個優化器你通常是訓練循環神經網絡RNN的不錯選擇。

Adam：Momentum+RMSprop

Adam算法可以看做是修正后的Momentum+RMSprop算法
Adam通常被認為對超參數選擇相當魯棒
學習率建議為0.0001
Adam是一種可以替代傳統隨機梯度下降過程的一階優化算法，它能基于訓練數據迭代的更新神經網絡權重。
Adam通過計算梯度的一階矩估計和二階矩估計而為不同的參數設計獨立的自適應性學習率

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/715276.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/715276.shtml
英文地址，請注明出處：http://en.pswp.cn/news/715276.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

GEE入門篇|圖像處理（三）：閾值處理、掩膜和重新映射圖像

GEE入門篇|圖像處理（三）：閾值處理、掩膜和重新映射圖像

閾值處理、掩膜和重新映射圖像本章前一節討論了如何使用波段運算來操作圖像， 這些方法通過組合圖像內的波段來創建新的連續值。本期內容使用邏輯運算符對波段或索引值進行分類，以創建分類圖像。 1.實現閾值實現閾值使用數字（閾值&#xf…

閱讀更多...

PXE網絡啟動實戰（第一篇啟動WinPE）

PXE網絡啟動實戰（第一篇啟動WinPE）

免責聲明：文中有一些圖片來源自網絡，如有版權請通知我刪除，謝謝！目錄一、無盤站二、PXE啟動三、PXE啟動原理四、啟動WinPE 1、服務器準備 2、客戶端 3、TFTP服務 4、WinPE選擇 5、具體操作：預告一、無盤站網絡啟動最早用于無盤系統，那時的電腦只配備軟…

閱讀更多...

【python量化】多種Transformer模型用于股價預測（Autoformer, FEDformer和PatchTST等）_neuralforecast

【python量化】多種Transformer模型用于股價預測（Autoformer, FEDformer和PatchTST等）_neuralforecast

寫在前面在本文中，我們利用Nixtla的NeuralForecast框架，實現多種基于Transformer的時序預測模型，包括：Transformer, Informer, Autoformer, FEDformer和PatchTST模型，并且實現將它們應用于股票價格預測的簡單例子。 …

閱讀更多...

Libero集成開發環境中Identify應用與提高

Libero集成開發環境中Identify應用與提高

Libero集成開發環境中Identify應用與提高 Identify的安裝

閱讀更多...

小米手機相冊閃退

小米手機相冊閃退

環境： HyperOS 1.0 小米手機分身處理步驟： 1）清理相冊緩存：設置->應用設置->相冊->清理數據->清除緩存（注意：別點清理全部數據；這個方法對我沒用）。 2）卸…

閱讀更多...

操作系統原理與實驗——實驗三優先級進程調度

操作系統原理與實驗——實驗三優先級進程調度

實驗指南運行環境： Dev c 算法思想： 本實驗是模擬進程調度中的優先級算法，在先來先服務算法的基礎上，只需對就緒隊列到達時間進行一次排序。第一個到達的進程首先進入CPU，將其從就緒隊列中出隊后。若此后隊首的進程的…

閱讀更多...

多租戶 TransmittableThreadLocal 線程安全問題

多租戶 TransmittableThreadLocal 線程安全問題

在一個多租戶項目中，用戶登錄時,會在自定義請求頭攔截器AsyncHandlerInterceptor將該用戶的userId,cstNo等用戶信息設置到TransmittableThreadLocal中,在后續代碼中使用.代碼如下: HeaderInterceptor 請求頭攔截器 public class HeaderInterceptor implements Asyn…

閱讀更多...

阿里云國際云服務器全局流量分析功能詳細介紹

阿里云國際云服務器全局流量分析功能詳細介紹

進行全局流量分析時，內網DNS解析會作為一個整體模塊，其他模塊的邊緣虛框顏色會置灰，示意作為一個整體進行全局分析，左側Region可以展開/匯總，也可以單獨選中某個Region模塊進行分析（這時其他Region的流量線…

閱讀更多...

【Java面試題】Redis的用途

【Java面試題】Redis的用途

以下是一些常見的用途 1.緩存 Redis 可以用作緩存系統，，將頻繁訪問的數據存儲在內存中，從而加快數據訪問速度，減少對數據庫的訪問壓力。 2.消息隊列 Redis 支持發布/訂閱模式和列表數據結構，可以用作消息隊列系統的…

閱讀更多...

道可云元宇宙每日資訊｜廈門首個元宇宙辦稅大廳啟用

道可云元宇宙每日資訊｜廈門首個元宇宙辦稅大廳啟用

道可云元宇宙每日簡報（2024年3月1日）訊，今日元宇宙新鮮事有： 中國軍號元宇宙發布會即將舉行近日，解放軍新聞傳播中心中國軍號即將正式上線。中國軍號元宇宙發布會也將在“云端”與您見面。全方位展現解放軍新聞傳播…

閱讀更多...

加密與安全_探索簽名算法

加密與安全_探索簽名算法

文章目錄概述應用常用數字簽名算法CodeDSA簽名ECDSA簽名小結概述在非對稱加密中，使用私鑰加密、公鑰解密確實是可行的，而且有著特定的應用場景，即數字簽名。數字簽名的主要目的是確保消息的完整性、真實性和不可否認性。通過使用私鑰加…

閱讀更多...

云服務器購買教程

云服務器購買教程

在購買云服務器之前，建議仔細評估自身需求和預算，并與多個云服務提供商進行比較，以確保選擇到最適合的解決方案。購買云服務器的具體步驟可能因所選云服務提供商而異。以下以實際操作的方式介紹如何購買一款云服務器。云服務器購買常見問題…

閱讀更多...

【數倉】zookeeper軟件安裝及集群配置

【數倉】zookeeper軟件安裝及集群配置

相關文章【數倉】基本概念、知識普及、核心技術【數倉】數據分層概念以及相關邏輯【數倉】Hadoop軟件安裝及使用（集群配置）【數倉】Hadoop集群配置常用參數說明一、環境準備準備3臺虛擬機 Hadoop131：192.168.56.131Hadoop132&#xff…

閱讀更多...

【Spring連載】使用Spring Data訪問 MongoDB----對象映射之基于類型的轉換器

【Spring連載】使用Spring Data訪問 MongoDB----對象映射之基于類型的轉換器

【Spring連載】使用Spring Data訪問 MongoDB----對象映射之基于類型的轉換器一、自定義轉換二、轉換器消歧(Disambiguation)三、基于類型的轉換器3.1 寫轉換3.2 讀轉換3.3 注冊轉換器一、自定義轉換下面的Spring Converter實現示例將String對象轉換為自定義Email值對象: R…

閱讀更多...

藍橋杯_定時器的綜合應用實例

藍橋杯_定時器的綜合應用實例

一工程代碼在單片機訓練平臺上，利用定時器T0，數碼管模塊和2個獨立按鍵（J5的2，3短接），設計一個秒表，具有清零，暫停，啟動功能。顯示模式：分-秒-0.05秒&…

閱讀更多...

Linux進程——信號詳解（上）

Linux進程——信號詳解（上）

文章目錄信號入門生活角度的信號技術應用角度的信號用kill -l命令可以察看系統定義的信號列表信號處理常見方式概述產生信號通過鍵盤進行信號的產生，ctrlc向前臺發送2號信號通過系統調用異常軟件條件信號入門生活角度的信號你在網上買了很多件商品&#xff0…

閱讀更多...

前端面試練習24.3.2-3.3

前端面試練習24.3.2-3.3

HTMLCSS部分一.說一說HTML的語義化在我看來，它的語義化其實是為了便于機器來看的，當然，程序員在使用語義化標簽時也可以使得代碼更加易讀，對于用戶來說，這樣有利于構建良好的網頁結構，可以在優化用戶體…

閱讀更多...

vue3項目中如何一個vue組件中的一個div里面的圖片鋪滿整個屏幕樣式如何設置

vue3項目中如何一個vue組件中的一個div里面的圖片鋪滿整個屏幕樣式如何設置

在Vue 3項目中，要使一個div內的圖片鋪滿整個屏幕，你需要確保幾個關鍵點：div元素和圖片元素的樣式設置正確，以及確保它們能夠覆蓋整個視口（viewport）。以下是一個簡單的步驟和代碼示例，幫助你實現…

閱讀更多...

代碼隨想錄算法訓練營第四八天 | 買股票

代碼隨想錄算法訓練營第四八天 | 買股票

目錄只買賣一次可買賣多次 LeetCode 121. 買賣股票的最佳時機 LeetCode 122. 買賣股票的最佳時機II 只買賣一次給定一個數組 prices ，它的第 i 個元素 prices[i] 表示一支給定股票第 i 天的價格。你只能選擇某一天買入這只股票，并選擇在未來的某…

閱讀更多...

瀏覽器輸入URL到頁面渲染經歷了哪些過程？

瀏覽器輸入URL到頁面渲染經歷了哪些過程？

瀏覽器輸入URL到頁面渲染的過程可以分為以下幾個步驟： 解析URL：當用戶在瀏覽器的地址欄輸入URL后，瀏覽器會首先解析這個URL，判斷其是否合法。查找緩存：瀏覽器會查看自己的緩存，判斷是否有之前訪問過的這個U…

閱讀更多...

最新文章