batchsize大小對訓練速度的影響

1.batchsize越大是不是訓練越快？

GPU :一塊2080Ti
平臺：pytorch cuda
圖片數量：2700

batchsize	一個圖片處理時間	GPU內存占用	GPU算力使用	一個epoch 所用時間
1	0.117s	2.5G	20%	2700 * 0.0117 = 318s
5	0.516s	8G	90%	2700 * 0.516/5 = 279s

batchsize大了之后，占用的資源多了，算力多了，但是速度沒有提升，這樣是不是太坑了。
我們其實可以把 batchsize設置小點，然后把剩余的內存跑其他實驗，而且再在同一張卡上跑一個新的實驗，對之前的速度也沒有影響。

結論：
1.本人實驗 batchsize越大，訓練速度提升不大
2.bachsize小點，多跑幾個實驗真香

完成每個epoch運算的所需的全部時間主要卡在：

load數據的時間，
每個epoch的iter數量。
因此對于每個epoch，不管是純計算時間還是全部時間，大體上還是大batch能夠更節約時間一點，但隨著batch增大，iter次數減小，完成每個epoch的時間更取決于加載數據所需的時間，此時也不見得大batch能帶來多少的速度增益了。

2.batchsize大了，是不是結果會變好？

收集資料發現，確實是這樣的，但是也不能太大了

在這里插入圖片描述

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/535202.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/535202.shtml
英文地址，請注明出處：http://en.pswp.cn/news/535202.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！