caffe 中的一些參數介紹

轉自:http://blog.csdn.net/cyh_24/article/details/51537709

solver.prototxt

net: "models/bvlc_alexnet/train_val.prototxt" 
test_iter: 1000       # 
test_interval: 1000 # base_lr: 0.01 # 開始的學習率 lr_policy: "step" # 學習率的drop是以gamma在每一次迭代中 gamma: 0.1 stepsize: 100000 # 每stepsize的迭代降低學習率:乘以gamma display: 20 # 沒display次打印顯示loss max_iter: 450000 # train 最大迭代max_iter momentum: 0.9 # weight_decay: 0.0005 # snapshot: 10000 # 沒迭代snapshot次,保存一次快照 snapshot_prefix:  "models/bvlc_reference_caffenet/caffenet_train" solver_mode: GPU # 使用的模式是GPU 
  • test_iter
    在測試的時候,需要迭代的次數,即test_iter* batchsize(測試集的)=測試集的大小,測試集的 batchsize可以在prototx文件里設置。

  • test_interval
    訓練的時候,每迭代test_interval次就進行一次測試。

  • momentum
    靈感來自于牛頓第一定律,基本思路是為尋優加入了“慣性”的影響,這樣一來,當誤差曲面中存在平坦區的時候,SGD可以更快的速度學習。


  • wim?wi?η?E?wi

train_val.prototxt

layer { # 數據層name: "data"type: "Data"top: "data" top: "label" include { phase: TRAIN # 表明這是在訓練階段才包括進去 } transform_param { # 對數據進行預處理 mirror: true # 是否做鏡像 crop_size: 227 # 減去均值文件 mean_file: "data/ilsvrc12/imagenet_mean.binaryproto" } data_param { # 設定數據的來源 source: "examples/imagenet/ilsvrc12_train_lmdb" batch_size: 256 backend: LMDB } }


layer {name: "data" type: "Data" top: "data" top: "label" include { phase: TEST # 測試階段 } transform_param { mirror: false # 是否做鏡像 crop_size: 227 # 減去均值文件 mean_file: "data/ilsvrc12/imagenet_mean.binaryproto" } data_param { source: "examples/imagenet/ilsvrc12_val_lmdb" batch_size: 50 backend: LMDB } }
  • lr_mult
    學習率,但是最終的學習率需要乘以 solver.prototxt 配置文件中的 base_lr .

    如果有兩個 lr_mult, 則第一個表示 weight 的學習率,第二個表示 bias 的學習率
    一般 bias 的學習率是 weight 學習率的2倍’

  • decay_mult
    權值衰減,為了避免模型的over-fitting,需要對cost function加入規范項。


  • wiwi?η?E?wi?ηλwi
  • num_output
    卷積核(filter)的個數

  • kernel_size
    卷積核的大小。

    如果卷積核的長和寬不等,需要用 kernel_h 和 kernel_w 分別設定

  • stride
    卷積核的步長,默認為1。也可以用stride_h和stride_w來設置。

  • pad
    擴充邊緣,默認為0,不擴充。

    擴充的時候是左右、上下對稱的,比如卷積核的大小為5*5,那么pad設置為2,則四個邊緣都擴充2個像素,即寬度和高度都擴充了4個像素,這樣卷積運算之后的特征圖就不會變小。
    也可以通過pad_h和pad_w來分別設定。

  • weight_filler
    權值初始化。 默認為“constant”,值全為0.
    很多時候我們用”xavier”算法來進行初始化,也可以設置為”gaussian”

weight_filler {type: "gaussian" std: 0.01 }
  • bias_filler

偏置項的初始化。一般設置為”constant”, 值全為0。

bias_filler {type: "constant" value: 0 }
  • bias_term

    是否開啟偏置項,默認為true, 開啟

  • group
    分組,默認為1組。如果大于1,我們限制卷積的連接操作在一個子集內。
    卷積分組可以減少網絡的參數,至于是否還有其他的作用就不清楚了。

    每個input是需要和每一個kernel都進行連接的,但是由于分組的原因其只是與部分的kernel進行連接的
    如: 我們根據圖像的通道來分組,那么第i個輸出分組只能與第i個輸入分組進行連接。

  • pool
    池化方法,默認為MAX。目前可用的方法有 MAX, AVE, 或 STOCHASTIC

  • dropout_ratio
    丟棄數據的概率

轉載于:https://www.cnblogs.com/Allen-rg/p/5822550.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/256492.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/256492.shtml
英文地址,請注明出處:http://en.pswp.cn/news/256492.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ANSYS——相同模型不同創建方式的同載荷同約束下的比較

目錄 1、問題描述: 2、相同部分: 3、梁單元創建(BEAM) 4、實體單元創建

python 制作二進制文件數據集(bin)

為了方便進行深度學習的程序調用與實現,需要將excel的數據文件轉換為二進制文件。好處就是接口統一,讀寫速度快,節約空間。 一、調用庫 使用xlrd讀入execel表格,經過處理后轉換為對應的dataframe結構,再使用pickle庫…

ConcurrentDictionary的ToDictionary

如果Value是引用&#xff0c;那么在使用Value.Clear()的時候。會清空Value的所有元素&#xff0c;但是不會改變Value的引用 private static void Main(){try{var concurrentDictionary new ConcurrentDictionary<string, List<int>>();concurrentDictionary.TryAd…

遠程連接mysql數據庫注意點記錄

一、如何新建獨立帳號并設置權限 這里我使用Navicat作為我的數據庫管理工具&#xff0c;打開Navicat。 選擇“用戶”--“新建用戶” 輸入用戶名、主機、密碼&#xff0c;需要注意的是&#xff0c;主機那不是寫“localhost”&#xff0c;而是寫“%” 然后可以設置“服務器權限”…

【域控管理】父域的搭建

從這篇博文開始&#xff0c;所有的域控系統都是在虛擬機中創建的。 在VM里安裝Windows Server 2008 R2的方法就不多說了&#xff0c;無腦式安裝&#xff0c;略過不提。 進到系統桌面&#xff0c;打開本地連接&#xff0c;設置網卡的IP地址&#xff0c;如下圖&#xff1a; 注意&…

ANSYS——網格劃分的不同方法以及GUI模塊的操作(自由網格、映射網格、掃掠、拖拉)

目錄 一、GUI操作模塊的解釋 二、不同的網格劃分方法和網格類型

tensorflow2 tensorboard可視化使用

tensorflow2自帶tensorboard&#xff0c;所以不必再自行安裝tensorboard。 一、使用環境 win10 x64&#xff1b; anaconda3tensorflow2&#xff08;cpu版本&#xff09; 二、使用 1.在模型訓練之前插入以下代碼 log_dir os.path.join(logs) #win10下的bug&#xff0c; if…

oracle字符亂碼的解決方法

原因分析&#xff1a; 客戶端字符集就是為了讓數據庫知道我們傳遞過去的字符是屬于哪種字符集&#xff0c;以便于Oracle在存儲字符時進行相應的編碼映射&#xff08;查看客戶端字符集通過查找注冊表中的NLS_LANG鍵&#xff09;。在客戶端查詢數據庫時顯示字符的時候我們使用的是…

[]End of 2017OI

今年大概到此為止了&#xff0c;現在這個算是做一個簡短的階段性總結吧 今年打的第一場大概是省賽&#xff0c;當時整個人處于&#xff08;迷茫&#xff0c;不知道選物理還是選信息備戰中考持續摸魚OI頹廢&#xff09;的狀態&#xff0c;KMP都不會導致簽到題都沒有分&#xff0…

Javascript閉包——懂不懂由你,反正我是懂了

摘要&#xff1a;“如果你不能向一個六歲的孩子解釋清楚&#xff0c;那么其實你自己根本就沒弄懂。”好吧&#xff0c;我試著向一個27歲的朋友就是JS閉包(JavaScript closure)卻徹底失敗了。越來越覺得國內沒有教書育人的氛圍&#xff0c;為了弄懂JS的閉包&#xff0c;我使出了…

ANSYS——命令流學習(材料屬性設置、建模的命令流)

目錄 ANSYS基本關鍵字 命令流的整體結構、每個模塊的標識 !文件說明段/BATCH

IOS用CGContextRef畫各種圖形(文字、圓、直線、弧線、矩形、扇形、橢圓、三角形、圓角矩形、貝塞爾曲線、圖片)...

首先了解一下CGContextRef: An opaque type that represents a Quartz 2D drawing environment. Graphics Context是圖形上下文,可以將其理解為一塊畫布,我們可以在上面進行繪畫操作,繪制完成后,將畫布放到我們的view中顯示即可,view看作是一個畫框. 自己學習時實現的demo&…

eclipse maven jetty插件方式啟動項目

2019獨角獸企業重金招聘Python工程師標準>>> 1. 2.點擊run即可啟動項目 參考:maven命令具體含義請自行百度.例子:maven clean的作用 / maven djetty 轉載于:https://my.oschina.net/u/3146772/blog/1576710

AWS S3 Windows系統下的文件夾上傳基于python

AWS S3 上傳文件&#xff0c;基于cmd命令行發現無法上傳文件夾&#xff0c;只能上傳單個文件&#xff0c;不知道是我能力不行還是什么原因&#xff0c;如果有大佬了解的可以在下面評論下! 一、環境配置 1.win10 X64&#xff1b; 2.awscli 1.18.91 3.python&#xff08;程序…

51nod 1004 【快速冪】

思路&#xff1a; 掐住最后一位&#xff0c;快速冪一發就好了 #include<cstdio> #include <map> #include<iostream> #include<string.h> #include<algorithm> using namespace std;typedef __int64 LL;int cal(int g,int x) {int ans1;while(g…

ANSYS——桿單元簡介與示例(含新版本2019版本桿實常數設置、ANSYS help的使用、單元列表使用的舉例)

目錄 桿的一些介紹 問題描述: 求解步驟: 一、設置研究問題為靜力學結構問題

Maya 學習資料

羅其勝3d角色強化 CGwhat-Maya變形金剛擎天柱建模教程 Pixar in the box - khan academy Siggraph歷屆優秀動畫 CG軟件發展史&#xff1a;MAYA動畫十年歷程 maya 2014奧迪汽車模型制作教程 &#xff08;yj6k&#xff09; 海賊王路飛建模教程高清全集 轉載于:https://www.cnblog…

windows系統環境變量過長解決方案(PATH too long installer unable to modify Path)

在按照官方文檔安裝PCL庫時&#xff0c;發現如下danteng的錯誤&#xff0c;內心極度崩潰&#xff01;以前也遇到過&#xff0c;當時暫時解決了該問題&#xff0c;現在又遇到了重新解決一次&#xff0c;為了方便以后遇到該問題時不再不知所措&#xff0c;現做個筆記&#xff01;…

jQuery插件-輕量圖片輪換-UISlide2

UISlide 的不同效果展現&#xff1a;運行代碼 本文轉自懶得安分博客園博客&#xff0c;原文鏈接&#xff1a;XXXXXXXX&#xff0c;如需轉載請自行聯系原作者

劍指Offer_61_序列化二叉樹

題目描述 請實現兩個函數&#xff0c;分別用來序列化和反序列化二叉樹 解題思路 使用前序遍歷&#xff0c;將遇到的結點添加到字符串中&#xff0c;遇到null則將一個#添加要序列化字符串中。反序列化時&#xff0c;每次讀取根結點&#xff0c;然后讀取其左結點&#xff0c;遇到…