(四)優化函數,學習速率與反向傳播算法--九五小龐

多層感知器

在這里插入圖片描述

梯度下降算法

  • 梯度的輸出向量表明了在每個位置損失函數增長最快的方向,可將它視為表示了在函數的每個位置向那個方向移動函數值可以增長。
    在這里插入圖片描述
    在這里插入圖片描述
  • 曲線對應于損失函數。點表示權值的當前值,即現在所在的位置。
  • 梯度用箭頭表示,表明為了增加損失,需要向右移動。此外,箭頭的長度概念化地表示了如果在對應的方向移動,函數值能夠增長多少。如果向著梯度的反方向移動,則損失函數的值會相應減少。

學習速率

  • 梯度就是表明損失函數相對參數的變化率,對梯度進行縮放的參數被稱為學習速率(learning rate)或可稱之為步長
  • 學習速率是一種超參數或對模型的一種手工可配置的設置,需要為它指定正確的值。如果學習速率太小,則找到損失函數極小值點時可能需要許多輪迭代;如果太大,則算法可能會“跳過”極小值點并且因為周期性的“跳躍”而永遠無法找到極小值點。
  • 在具體實踐中,可通過查看損失函數值隨時間變化曲線,來判斷學習速率的選取是否合適
  • 合適的學習速率,損失函數隨時間下降,直到一個底部,不合適的學習速率,損失函數可能會發生震蕩
    在這里插入圖片描述

學習速率選取原則

  • 在調整學習速率時,既要使其足夠小,保證不至于發生超調,也要保證它足夠大,以使損失函數能夠盡快下降,從而可通過較少次數的迭代更快的完成學習

反向傳播算法

  • 反向傳播算法是一種高效計算數據流圖中梯度的技術,每一層的導數都是后一層的導數與前一層輸出之積,這正是鏈式法則的奇妙之處,誤差反向傳播算法利用的正是這一特點。
  • 前饋時,從輸入開始,逐一計算每個隱含層的輸出,直到輸出層。
  • 然后開始計算導數,并從輸出層經各隱含層逐一反向傳播。為了減少計算量,還需對所有已完成計算的元素進行復用。這便是反向傳播算法名稱的由來。

常見的優化函數

  • 優化器(optimizer)是編譯模型的所需要的兩個參數之一。
  • 可以先實例化一個優化器對象,然后將它傳入model.compile(),或者你可以通過名稱來調用優化器。在后一種情況下,將使用優化器的默認參數。

SGD:隨機梯度下降優化器

  • 隨機梯度下降優化器SGD和min-batch是同一個意思,抽取m個小批量(獨立同分布)樣本,通過計算他們平梯度均值。
SGD參數

在這里插入圖片描述

RMSprop:網絡優化算法

  • 經驗上,RMSprop被證明有效且使用的深度學習網絡優化算法
  • RMSprop增加了一個衰減系數來控制歷史信息的獲取多少,RMSprop會對學習率進行衰減。
  • 建議使用優化器的默認參數(除了學習率lr,它可以被自由調節)
  • 這個優化器你通常是訓練循環神經網絡RNN的不錯選擇。

Adam:Momentum+RMSprop

  • Adam算法可以看做是修正后的Momentum+RMSprop算法
  • Adam通常被認為對超參數選擇相當魯棒
  • 學習率建議為0.0001
  • Adam是一種可以替代傳統隨機梯度下降過程的一階優化算法,它能基于訓練數據迭代的更新神經網絡權重。
  • Adam通過計算梯度的一階矩估計和二階矩估計而為不同的參數設計獨立的自適應性學習率

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/715276.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/715276.shtml
英文地址,請注明出處:http://en.pswp.cn/news/715276.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

GEE入門篇|圖像處理(三):閾值處理、掩膜和重新映射圖像

閾值處理、掩膜和重新映射圖像 本章前一節討論了如何使用波段運算來操作圖像, 這些方法通過組合圖像內的波段來創建新的連續值。 本期內容使用邏輯運算符對波段或索引值進行分類,以創建分類圖像。 1.實現閾值 實現閾值使用數字(閾值&#xf…

PXE網絡啟動實戰(第一篇 啟動WinPE)

免責聲明:文中有一些圖片來源自網絡,如有版權請通知我刪除,謝謝! 目錄 一、無盤站 二、PXE啟動 三、PXE啟動原理 四、啟動WinPE 1、服務器準備 2、客戶端 3、TFTP服務 4、WinPE選擇 5、具體操作: 預告 一、無盤站 網絡啟動最早用于無盤系統,那時的電腦只配備軟…

【python量化】多種Transformer模型用于股價預測(Autoformer, FEDformer和PatchTST等)_neuralforecast

寫在前面 在本文中,我們利用Nixtla的NeuralForecast框架,實現多種基于Transformer的時序預測模型,包括:Transformer, Informer, Autoformer, FEDformer和PatchTST模型,并且實現將它們應用于股票價格預測的簡單例子。 …

Libero集成開發環境中Identify應用與提高

Libero集成開發環境中Identify應用與提高 Identify的安裝

小米手機相冊閃退

環境: HyperOS 1.0 小米手機分身 處理步驟: 1)清理相冊緩存:設置->應用設置->相冊->清理數據->清除緩存(注意:別點清理全部數據;這個方法對我沒用)。 2)卸…

操作系統原理與實驗——實驗三優先級進程調度

實驗指南 運行環境: Dev c 算法思想: 本實驗是模擬進程調度中的優先級算法,在先來先服務算法的基礎上,只需對就緒隊列到達時間進行一次排序。第一個到達的進程首先進入CPU,將其從就緒隊列中出隊后。若此后隊首的進程的…

多租戶 TransmittableThreadLocal 線程安全問題

在一個多租戶項目中,用戶登錄時,會在自定義請求頭攔截器AsyncHandlerInterceptor將該用戶的userId,cstNo等用戶信息設置到TransmittableThreadLocal中,在后續代碼中使用.代碼如下: HeaderInterceptor 請求頭攔截器 public class HeaderInterceptor implements Asyn…

阿里云國際云服務器全局流量分析功能詳細介紹

進行全局流量分析時,內網DNS解析會作為一個整體模塊,其他模塊的邊緣虛框顏色會置灰,示意作為一個整體進行全局分析,左側Region可以展開/匯總,也可以單獨選中某個Region模塊進行分析(這時其他Region的流量線…

【Java面試題】Redis的用途

以下是一些常見的用途 1.緩存 Redis 可以用作緩存系統,,將頻繁訪問的數據存儲在內存中,從而加快數據訪問速度,減少對數據庫的訪問壓力。 2.消息隊列 Redis 支持發布/訂閱模式和列表數據結構,可以用作消息隊列系統的…

道可云元宇宙每日資訊|廈門首個元宇宙辦稅大廳啟用

道可云元宇宙每日簡報(2024年3月1日)訊,今日元宇宙新鮮事有: 中國軍號元宇宙發布會即將舉行 近日,解放軍新聞傳播中心中國軍號即將正式上線。中國軍號元宇宙發布會也將在“云端”與您見面。全方位展現解放軍新聞傳播…

加密與安全_探索簽名算法

文章目錄 概述應用常用數字簽名算法CodeDSA簽名ECDSA簽名小結 概述 在非對稱加密中,使用私鑰加密、公鑰解密確實是可行的,而且有著特定的應用場景,即數字簽名。 數字簽名的主要目的是確保消息的完整性、真實性和不可否認性。通過使用私鑰加…

云服務器購買教程

在購買云服務器之前,建議仔細評估自身需求和預算,并與多個云服務提供商進行比較,以確保選擇到最適合的解決方案。購買云服務器的具體步驟可能因所選云服務提供商而異。以下以實際操作的方式介紹如何購買一款云服務器。 云服務器購買常見問題…

【數倉】zookeeper軟件安裝及集群配置

相關文章 【數倉】基本概念、知識普及、核心技術【數倉】數據分層概念以及相關邏輯【數倉】Hadoop軟件安裝及使用(集群配置)【數倉】Hadoop集群配置常用參數說明 一、環境準備 準備3臺虛擬機 Hadoop131:192.168.56.131Hadoop132&#xff…

【Spring連載】使用Spring Data訪問 MongoDB----對象映射之基于類型的轉換器

【Spring連載】使用Spring Data訪問 MongoDB----對象映射之基于類型的轉換器 一、自定義轉換二、轉換器消歧(Disambiguation)三、基于類型的轉換器3.1 寫轉換3.2 讀轉換3.3 注冊轉換器 一、自定義轉換 下面的Spring Converter實現示例將String對象轉換為自定義Email值對象: R…

藍橋杯_定時器的綜合應用實例

一 工程 代碼 在單片機訓練平臺上,利用定時器T0,數碼管模塊和2個獨立按鍵(J5的2,3短接),設計一個秒表,具有清零,暫停,啟動功能。 顯示模式:分-秒-0.05秒&…

Linux進程——信號詳解(上)

文章目錄 信號入門生活角度的信號技術應用角度的信號用kill -l命令可以察看系統定義的信號列表信號處理常見方式概述 產生信號通過鍵盤進行信號的產生,ctrlc向前臺發送2號信號通過系統調用異常軟件條件 信號入門 生活角度的信號 你在網上買了很多件商品&#xff0…

前端面試練習24.3.2-3.3

HTMLCSS部分 一.說一說HTML的語義化 在我看來,它的語義化其實是為了便于機器來看的,當然,程序員在使用語義化標簽時也可以使得代碼更加易讀,對于用戶來說,這樣有利于構建良好的網頁結構,可以在優化用戶體…

vue3項目中如何一個vue組件中的一個div里面的圖片鋪滿整個屏幕樣式如何設置

在Vue 3項目中,要使一個div內的圖片鋪滿整個屏幕,你需要確保幾個關鍵點:div元素和圖片元素的樣式設置正確,以及確保它們能夠覆蓋整個視口(viewport)。以下是一個簡單的步驟和代碼示例,幫助你實現…

代碼隨想錄算法訓練營第四八天 | 買股票

目錄 只買賣一次可買賣多次 LeetCode 121. 買賣股票的最佳時機 LeetCode 122. 買賣股票的最佳時機II 只買賣一次 給定一個數組 prices ,它的第 i 個元素 prices[i] 表示一支給定股票第 i 天的價格。 你只能選擇 某一天 買入這只股票,并選擇在 未來的某…

瀏覽器輸入URL到頁面渲染經歷了哪些過程?

瀏覽器輸入URL到頁面渲染的過程可以分為以下幾個步驟: 解析URL:當用戶在瀏覽器的地址欄輸入URL后,瀏覽器會首先解析這個URL,判斷其是否合法。查找緩存:瀏覽器會查看自己的緩存,判斷是否有之前訪問過的這個U…