36. Adam 算法詳解

Adam(Adaptive Moment Estimation)是一種結合動量法和自適應學習率的優化算法,自2014年提出以來,迅速成為深度學習中最流行和常用的優化算法之一。Adam算法的核心思想是利用梯度的一階動量和二階動量來動態調整學習率,既保持了動量法的優點,又結合了RMSProp的自適應學習率特性。

Adam 算法原理

Adam算法通過計算梯度的一階動量(即梯度的指數加權平均)和二階動量(即梯度平方的指數加權平均)來調整每個參數的學習率。具體公式如下:

1. 梯度的一階動量:
\[ m_t = \beta_1 m_{t-1} + (1 - \beta_1) g_t \]

2. 梯度的二階動量:
\[ v_t = \beta_2 v_{t-1} + (1 - \beta_2) g_t^2 \]

3. 偏差修正:
\[ \hat{m}_t = \frac{m_t}{1 - \beta_1^t} \]
\[ \hat{v}_t = \frac{v_t}{1 - \beta_2^t} \]

4. 更新參數:
\[ \theta_{t+1} = \theta_t - \frac{\alpha \hat{m}_t}{\sqrt{\hat{v}_t} + \epsilon} \]

其中:
- \( \beta_1 \) 和 \( \beta_2 \) 分別是動量和均方根動量的衰減率,常用值為 \( \beta_1 = 0.9 \) 和 \( \beta_2 = 0.999 \)。
- \( \epsilon \) 是一個很小的常數,用于防止分母為零,常用值為 \( 10^{-8} \)。

Adam 優缺點

優點:

- 自適應學習率:根據一階動量和二階動量動態調整每個參數的學習率,使得訓練過程更加穩定。
- 快速收斂:結合動量法的加速特性和RMSProp的平穩特性,能夠快速收斂到最優解。
- 適用于大規模數據:對于大規模數據和稀疏梯度,表現出色。

缺點:

- 參數較多:Adam算法需要調整的超參數較多(例如 \( \beta_1, \beta_2, \epsilon \)),調參復雜度高。
- 可能不穩定:在某些情況下,Adam可能會出現不穩定的收斂行為。

Adam 代碼實現

下面是一個使用Adam優化器的示例代碼:
?

import torch
import matplotlib.pyplot as plt# 定義超參數
learning_rate = 0.001
epochs = 100# 隨機生成數據
x = torch.randn(100, 1)
y = 2 * x + 3 + torch.randn(100, 1) * 0.5# 初始化參數
w = torch.randn(1, requires_grad=True)
b = torch.zeros(1, requires_grad=True)# 定義Adam優化器
optimizer = torch.optim.Adam([w, b], lr=learning_rate)# 記錄損失
losses = []for epoch in range(epochs):# 預測y_pred = x * w + b# 計算損失loss = torch.mean((y_pred - y) ** 2)losses.append(loss.item())# 清空梯度optimizer.zero_grad()# 反向傳播loss.backward()# 更新參數optimizer.step()# 可視化訓練過程
plt.plot(range(epochs), losses)
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.title('Training Loss with Adam')
plt.show()

Adam 與其他算法的比較

Adam算法集成了SGD、動量法、Adagrad、Adadelta等多種優化算法的優點,具有快速收斂和穩定的特點。以下是它與其他算法的對比:

1. SGD:基本的隨機梯度下降法,收斂速度較慢,易陷入局部最優。
2. 動量法:在SGD基礎上加入一階動量,加速收斂,但仍然可能陷入局部最優。
3. Adagrad:自適應學習率,但對歷史梯度的累積會導致學習率不斷減小,后期訓練緩慢。
4. RMSProp:改進了Adagrad,通過引入衰減系數解決學習率不斷減小的問題。
5. Adam:結合動量法和RMSProp的優點,具有快速收斂和穩定的特點,是目前最常用的優化算法。

小結

Adam算法是目前最常用的優化算法之一,結合了動量法和RMSProp的優點,通過計算一階和二階動量來動態調整學習率,具有快速收斂和穩定的特點。盡管Adam需要調整的超參數較多,但其優越的性能使得它成為深度學習中最廣泛使用的優化算法之一。

希望通過本節的講解,大家能對Adam算法有一個全面的了解,并能夠在實際項目中熟練應用。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/44773.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/44773.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/44773.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于jeecgboot-vue3的Flowable流程-集成仿釘釘流程(五)仿釘釘流程的json數據保存與顯示

因為這個項目license問題無法開源,更多技術支持與服務請加入我的知識星球。 1、需要做一個界面保存與顯示仿釘釘的流程,先建一個表,用online建 2、通過上面生成代碼,放入到相應的前后端工程里 3、修改前端仿釘釘流程的設計功能&a…

spark基于Spark的對招聘信息的分析與設計-計算機畢業設計源碼50716

目 錄 摘要 1 緒論 1.1 研究背景 1.2 研究意義 1.3論文結構與章節安排 2 系統分析 2.1 可行性分析 2.2.1 數據新增流程 2.2.2 數據刪除流程 2.3 系統功能分析 2.3.1 功能性分析 2.3.2 非功能性分析 2.4 系統用例分析 2.5本章小結 3 系統總體設計 3.1 系統架構設…

Vue2/Vue3實現全局/局部添加防篡改水印的效果。刪除元素無效!更改元素屬性無效!支持圖片、元素、視頻等等。

水印目的 版權保護:水印可以在圖片、文檔或視頻中嵌入作者、品牌或版權所有者的信息,以防止未經授權的復制、傳播或使用。當其他人使用帶有水印的內容時,可以追溯到原始作者或版權所有者,從而加強版權保護。 身份識別:水印可以用作作者或品牌的標識符,使觀眾能夠輕松識…

springboot對ZonedDateTime返回結果json是string-源碼分析

springboot對ZonedDateTime返回結果json是string-源碼分析 application/json格式默認使用ObjectMapper實例進行序列化ObjectMapper自動注入分析springboot關于jackson配置 java.time.ZonedDateTime application/json格式默認使用ObjectMapper實例進行序列化 controller返回后&…

人形機器人的理想與現實

李開復曾提到過一個AI界流傳的“騙子又來了曲線”。 人會不斷給機器進行“是否具有人類智能”的鑒定,而這個過程,總是從被人工智能在某些領域的驚艷表現震撼,到逐漸認識到當時的人工智能還有各種局限,以至于產生巨大心理落差。 近…

html js 3d z軸移動 實現星空

用chatgpt還有kimi 讓實現動畫效果的星空,都太垃圾了 不是y軸移動,就是x軸移動, 我要z軸移動,他們就是搞不出來, ai寫代碼還有很長的路。 <!DOCTYPE html> <meta charset="utf-8" /> <head> <title>ai相關博客</title> </h…

【操作系統】手把手帶你搭建DNS服務器!

DNS服務器 DNS服務器指域名系統或者域名服務。域名系統為Internet上的主機分配域名地址和IP地址&#xff0c;用戶使用域名地址&#xff0c;該系統就會自動把域名地址轉為IP地址。域名服務是運行域名系統的Internet工具。執行域名服務的服務器稱之為DNS服務器&#xff0c;通過DN…

51單片機嵌入式開發:8、 STC89C52RC 操作LCD1602原理

STC89C52RC 操作LCD1602原理 1 LCD1602概述1.1 LCD1602介紹1.2 LCD1602引腳說明1.3 LCD1602指令介紹 2 LCD1602外圍電路2.1 LCD1602接線方法2.2 LCD1602電路原理 3 LCD1602軟件操作3.1 LCD1602顯示3.2 LCD1602 protues仿真 4 總結 1 LCD1602概述 1.1 LCD1602介紹 LCD1602是一種…

maven——(重要)手動創建,構建項目

創建項目 手動按照maven層級建好文件夾&#xff0c;并寫上java&#xff0c;測試代碼和pom文件 構建項目 在dos窗口中執行如下命令 compile編譯 當前maven倉庫中什么都沒有。 在pom所在層級下&#xff0c;執行&#xff1a; mvn compile 就開始顯示下面這些&#xff0c;…

數據庫-ubuntu環境下安裝配置mysql

文章目錄 什么是數據庫&#xff1f;一、ubuntu環境下安裝mysql二、配置mysql配置文件1.先登上root賬號2.配置文件的修改show engines \G; mysql和mysqld數據庫的基礎操作登錄mysql創建數據庫顯示當前數據庫使用數據庫創建表插入students表數據打印students表數據select * from …

前端使用Vue和Element實現可拖動彈框效果,且不影響底層元素操作,Cesium作為底圖(可拖拽的視頻實時播放彈框,底層元素可以正常操作)

簡述&#xff1a;在前端開發中&#xff0c;彈框和實時視頻播放是常見的需求。這里來簡單記錄一下&#xff0c;如何使用Vue.js和Element UI實現一個可拖動的彈框&#xff0c;并在其中播放實時視頻。同時&#xff0c;確保在拖拽彈框時&#xff0c;底層元素仍然可以操作。這里來記…

vue 畫二維碼及長按保存

需求 想要做如下圖的二維碼帶文字&#xff0c;且能夠長按保存 前期準備 一個canvas安裝qrcode&#xff08;命令&#xff1a;npm i qrcode&#xff09; 畫二維碼及文字 初始化畫布 <template><div><canvas ref"canvas" width"300" he…

JAVASE進階day07(泛型,集合,Set,TreeSet,枚舉,數據結構)

泛型 1.泛型的基本使用 限制集合存儲的數據類型 package com.lu.day07.generics;/*** 定義了一個泛型類* E 泛型通配字母(不固定代替真實數據類型A-Z都可以)* 常見的泛型通配字母:* E:element 元素* T:type 類型* R:return 返回值類型* K:key 鍵* …

14.爬蟲---Selenium 經典動態渲染工具的使用

14.Selenium 經典動態渲染工具的使用 1.查看chrome瀏覽器版本2.ChromeDriver 安裝3.Selenium 安裝4.驗證安裝5.基本用法5.1啟動瀏覽器5.2導航到頁面5.3查找元素5.3.1單個元素 find_element5.3.2多個元素 find_elements 5.4 執行操作5.5 動作鏈ActionChains5.6 執行 JavaScript …

Python基礎語法:運算符詳解(算術運算符、比較運算符、邏輯運算符、賦值運算符)②

文章目錄 Python中的運算符詳解一、算術運算符二、比較運算符三、邏輯運算符四、賦值運算符五、綜合示例結論 Python中的運算符詳解 在Python編程中&#xff0c;運算符用于執行各種操作&#xff0c;例如算術計算、比較、邏輯判斷和賦值。了解并掌握這些運算符的使用方法是編寫…

pychopper的安裝與使用

文章目錄 安裝使用 安裝 在Linux環境下使用conda安裝 通常習慣一個軟件一個虛擬環境&#xff1a; conda create -n pychopper -c nanoporetech -c conda-forge -c bioconda "nanoporetech::pychopper"使用 參考官方文檔&#xff1a; https://github.com/epi2me-la…

N-(4-Azido-2-nitrophenyl)-N‘‘-biotinylnorspemidine

?一、基本信息 常用名&#xff1a;N-(4-Azido-2-nitrophenyl)-N-biotinylnorspemidine 英文名&#xff1a;N-(4-Azido-2-nitrophenyl)-N-biotinylnorspemidine CAS號&#xff1a;786609-83-4 分子式&#xff1a;C22H33N9O4S 分子量&#xff1a;519.62 二、結構特點 該化…

SQL職場必備:掌握數據庫技能提升職場競爭力

&#x1f482; 個人網站:【 摸魚游戲】【網址導航】【神級代碼資源網站】&#x1f91f; 一站式輕松構建小程序、Web網站、移動應用&#xff1a;&#x1f449;注冊地址&#x1f91f; 基于Web端打造的&#xff1a;&#x1f449;輕量化工具創作平臺&#x1f485; 想尋找共同學習交…

vue3 + tsx 表格 Action 單獨封裝組件用法

前言 先上圖看右側列 action 的 UI 效果&#xff1a; 正常來說&#xff0c;如果一個表格的附帶 action 操作&#xff0c;我們一般會放在最右側的列里面實現&#xff0c;這個時候有些UI 框架支持在 SFC 模板里面定義額外的 solt&#xff0c;當然如果不支持&#xff0c;更通用的…

【網絡】SCTP協議概念

SCTP協議 SCTP&#xff08;Stream Control Transmission Protocol&#xff09;是一種傳輸層協議&#xff0c;設計用于提供可靠的數據傳輸服務&#xff0c;同時具備一些類似UDP&#xff08;User Datagram Protocol&#xff09;的屬性。以下是SCTP協議的基本概念、優缺點以及與T…