【深度學習】神經網絡術語：Epoch、Batch Size和迭代

【深度學習】神經網絡術語：Epoch、Batch Size和迭代

news/2025/8/28 9:43:15/文章來源:https://blog.csdn.net/qq_15719613/article/details/134574457

batchsize：中文翻譯為批大小（批尺寸）。

簡單點說，批量大小將決定我們一次訓練的樣本數目。

batch_size將影響到模型的優化程度和速度。

為什么需要有 Batch_Size :

batchsize 的正確選擇是為了在內存效率和內存容量之間尋找最佳平衡。

Batch_Size的取值：

神經網絡術語：Epoch、Batch Size和迭代

全批次（藍色）

如果數據集比較小我們就采用全數據集。全數據集確定的方向能夠更好地代表樣本總體，從而更準確地朝向極值所在的方向。

注：對于大的數據集我們不能使用全批次，因為會得到更差的結果。

迷你批次（綠色）

選擇一個適中的 Batch_Size 值。就是說我們選定一個batch的大小后，將會以batch的大小將數據輸入深度學習的網絡中，然后計算這個batch的所有樣本的平均損失，即代價函數是所有樣本的平均。

隨機（batch_size等于1的情況）（紅色）

每次修正方向以各自樣本的梯度方向修正，橫沖直撞各自為政，難以達到收斂。

適當的增加Batchsize 的優點：

1.通過并行化提高內存利用率。

2.單次epoch的迭代次數減少，提高運行速度。（單次epoch=（全部訓練樣本/batchsize） / iteration =1）

3.適當的增加Batch_Size，梯度下降方向準確度增加，訓練震動的幅度減小。（看上圖便可知曉）?

經驗總結：

相對于正常數據集，如果Batch_Size過小，訓練數據就會非常難收斂，從而導致underfitting。

增大Batch_Size，相對處理速度加快。

增大Batch_Size，所需內存容量增加（epoch的次數需要增加以達到最好結果）。

這里我們發現上面兩個矛盾的問題，因為當epoch增加以后同樣也會導致耗時增加從而速度下降。因此我們需要尋找最好的batch_size。

再次重申：batchsize 的正確選擇是為了在內存效率和內存容量之間尋找最佳平衡。

Iteration: 中文翻譯為迭代。

迭代是重復反饋的動作，神經網絡中我們希望通過迭代進行多次的訓練以到達所需的目標或結果。

每一次迭代得到的結果都會被作為下一次迭代的初始值。

一個迭代 = 一個正向通過+一個反向通過

epoch：中文翻譯為時期。

一個時期 = 所有訓練樣本的一個正向傳遞和一個反向傳遞。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/162837.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/162837.shtml
英文地址，請注明出處：http://en.pswp.cn/news/162837.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Postgresql源碼（116）提升子查詢案例分析

Postgresql源碼（116）提升子查詢案例分析

0 總結對于SQL：select * from student, (select * from score where sno > 2) s where student.sno s.sno; pullup在pull_up_subqueries函數內遞歸完成，分幾步： 將內層rte score追加到上層rtbable中：rte1是student、rte2帶…

閱讀更多...

nginx編譯安裝

nginx編譯安裝

1.下載nginx： 地址：http://nginx.org/en/download.html 2.安裝依賴安裝gcc: yum install -y gcc安裝pcre庫 yum install -y pcre pcre-devel安裝zlib庫： yum install -y zlib zlib-devel3.安裝nginx ./configure --prefix/usr/local/ngi…

閱讀更多...

Spark SQL將Hive表中的數據寫入到MySQL數據庫中

Spark SQL將Hive表中的數據寫入到MySQL數據庫中

import org.apache.spark.sql.SparkSessionobject HiveToMySQL {def main(args: Array[String]): Unit {// 創建SparkSessionval spark SparkSession.builder().appName("HiveToMySQL").enableHiveSupport().getOrCreate()// 讀取Hive表數據val hiveDF spark.tabl…

閱讀更多...

一體化大氣環境監測設備實時守護我們的空氣質量

一體化大氣環境監測設備實時守護我們的空氣質量

WX-CSQX12 隨著空氣污染問題的日益嚴重，大氣環境監測設備成為了我們生活中不可或缺的一部分。而一體化的大氣環境監測設備，更是為我們的環境保護工作帶來了更多的便利和效益。一體化大氣環境監測設備是一種集成了多種功能于一體的環保設備，…

閱讀更多...

BootStrap【表格二、基礎表單、被支持的控件、表單狀態】(二)-全面詳解（學習總結---從入門到深化）

BootStrap【表格二、基礎表單、被支持的控件、表單狀態】(二)-全面詳解（學習總結---從入門到深化）

目錄表格二表單_基礎表單表單_被支持的控件表單_表單狀態表格二緊縮表格通過添加 .table-condensed 類可以讓表格更加緊湊，單元格中的內補（padding）均會減半 <table class"table table-condensed table-bordered"…

閱讀更多...

學習量化交易如何入門？

學習量化交易如何入門？

Python 量化入門很簡單，只需 3 步就能快速上手! 題主在程序方向沒有相關經驗，今天就從量化行業的通用語言-Python 著手，教大家如何快速入門。一、準備工作在開始 Python 編程之前，首先需要確保你的計算機上安裝了合適的 Pytho…

閱讀更多...

【深度學習】Transformer簡介

【深度學習】Transformer簡介

近年來，Transformer模型在自然語言處理（NLP）領域中橫掃千軍，以BERT、GPT為代表的模型屢屢屠榜，目前已經成為了該領域的標準模型。同時，在計算機視覺等領域中，Transformer模型也逐漸得到了重視&a…

閱讀更多...

【PythonGIS】基于Python面矢量轉換線矢量

【PythonGIS】基于Python面矢量轉換線矢量

今天有些不一樣，發這篇文章并不是項目需要。單純的想到有這個功能沒使用Python實現，所以就去研究了一下，第一時間就和大家分享。如何使用Python的osgeo庫實現面矢量數據與線矢量數據的互相轉換。一、導入所需庫 import os from osgeo impor…

閱讀更多...

論文速讀《DeepFusion: Lidar-Camera Deep Fusion for Multi-Modal 3D Object Detection》

論文速讀《DeepFusion: Lidar-Camera Deep Fusion for Multi-Modal 3D Object Detection》

概括主要內容文章《DeepFusion: Lidar-Camera Deep Fusion for Multi-Modal 3D Object Detection》提出了兩種創新技術，以改善多模態3D檢測模型的性能，通過更有效地融合相機和激光雷達傳感器數據來提高對象檢測的準確性，尤其是在行人檢測方面…

閱讀更多...

自動化提交git

自動化提交git

1.前要這里只是講解如何在Windows上創建自動化腳本/程序來達到自動pull、commit、push，減少冗余的倉庫更新工作，避免在多平臺下合作造成版本沖突等。 2.原理使用Windows下默認的cmd/bat腳本編寫代碼。只需要在網絡上查詢一些相關的語法&#xff0…

閱讀更多...

2023亞太杯數學建模C題思路 - 我國新能源電動汽車的發展趨勢

2023亞太杯數學建模C題思路 - 我國新能源電動汽車的發展趨勢

1 賽題問題C 我國新能源電動汽車的發展趨勢新能源汽車是指以先進技術原理、新技術、新結構的非常規汽車燃料為動力來源( 非常規汽車燃料指汽油、柴油以外的燃料），將先進技術進行汽車動力控制和驅動相結合的汽車。新能源汽車主要包括四種類型&#x…

閱讀更多...

【計算思維】藍橋杯STEMA 科技素養考試真題及解析 6

【計算思維】藍橋杯STEMA 科技素養考試真題及解析 6

1、明明買了一個掃地機器人，可以通過以下指令控制機器人運動: F:向前走 10 個單位長度 L:原地左轉 90 度 R:原地右轉 90 度機器人初始方向向右，需要按順序執行以下那條指令，才能打掃完下圖中的道路 A、F-L-F-R-F-F-R-F-L-F B、F-R-F-L-F-F…

閱讀更多...

h5如何使用navigateBack回退到微信小程序頁面并攜帶參數

h5如何使用navigateBack回退到微信小程序頁面并攜帶參數

前言在h5中使用navigateBack回退到微信小程序頁面很常見，但是有一種交互需要在回退之后的頁面可以得到通知，拿到標識之后，進行某些操作，這樣的話，由于微信官方并沒有直接提供這樣的api，就需要我們開動腦筋…

閱讀更多...

視頻剪輯有妙招：批量置入封面，輕松提升視頻效果

視頻剪輯有妙招：批量置入封面，輕松提升視頻效果

隨著社交媒體的興起，視頻已經成為分享和交流的重要方式。無論是專業的內容創作者還是普通的社交媒體用戶，都要在視頻剪輯上下一番功夫，才能讓視頻更具吸引力。而一個吸引的封面往往能在一瞬間抓住眼球，提高點擊率。還在因如何選擇…

閱讀更多...

【SpringBoot】Redisson 分布式鎖注解和 @Transactional 注解一起使用問題

【SpringBoot】Redisson 分布式鎖注解和 @Transactional 注解一起使用問題

一、前言平時使用切面去加分布式鎖，是先開啟事務還是先嘗試獲得鎖？這兩者有啥區別？ 業務中怎么控制切面的順序？切面的順序對事務的影響怎么避免？ 下面程序分析： OverrideTransactionalpublic ReceiveH5…

閱讀更多...

uni-app - 彈出框

uni-app - 彈出框

目錄 1.基本介紹 2.原生uinapp 通過uni.showActionSheet實現 3.使用組件 Popup 彈出層 ③效果展示 1.基本介紹彈出框讓我們在需要時在屏幕底部彈出一個菜單，它通常用于在各種應用程序中進行選擇操作。Uniapp為我們提供了基本的底部彈出框組件，但它也有…

閱讀更多...

OpenSearch開發環境安裝Docker和Docker-Compose兩種方式

OpenSearch開發環境安裝Docker和Docker-Compose兩種方式

文章目錄簡介常用請求創建映射寫入數據查詢數據其他安裝Docker方式安裝OpenSearch安裝OpenSearchDashboard Docker-Compose方式Docker-Compose安裝1.設置主機環境2.下載docker-compose.yml文件3.啟動docker-compose4.驗證問題問題1：IPv4 forwarding is disabled.…

閱讀更多...

如何搭建Zblog網站并通過內網穿透將個人博客發布到公網

如何搭建Zblog網站并通過內網穿透將個人博客發布到公網

文章目錄 1. 前言2. Z-blog網站搭建2.1 XAMPP環境設置2.2 Z-blog安裝2.3 Z-blog網頁測試2.4 Cpolar安裝和注冊 3. 本地網頁發布3.1. Cpolar云端設置3.2 Cpolar本地設置 4. 公網訪問測試5. 結語 1. 前言想要成為一個合格的技術宅或程序員，自己搭建網站制作網頁是繞…

閱讀更多...

Altium Designer學習筆記11

Altium Designer學習筆記11

畫一個LED的封裝： 使用這個SMD5050的封裝。我們先看下這個芯片的功能說明： 5050貼片式發光二極管： XL-5050 是單線傳輸的三通道LED驅動控制芯片，采用的是單極性歸零碼協議。數據再生模塊的功能，自動將級聯輸出的數…

閱讀更多...

CSGO搬磚干貨，全網最詳細教學！

CSGO搬磚干貨，全網最詳細教學！

CSGO游戲搬磚全套操作流程及注意事項（第一課） 在電競游戲中，CSGO（Counter-Strike: Global Offensive）被廣大玩家譽為經典之作。然而，除了在游戲中展現個人實力和團隊合作外，有些玩家還將CSGO作為…

閱讀更多...

最新文章