這篇文章,9分轉載轉述;很少有自己的見解;
首先先露怯:自己真正是去年開始接觸機器學習當中的深度學習當中的卷積神經網絡當中的前向預測部分;
不過,剛才看完了這里的討論,(知乎,對于大規模機器學習的理解和認識),
現在的理解還是得到了強化:自己一直覺得這個領域的理論基礎欠缺,目前還是處在經驗驗證的階段,至少無法預測最優和最佳適用場景;
所以,剛剛接觸的時候,覺得核心就是對于系統實現工作的掌握,掌握代碼實現的所有細節;因為在大家都是摸瞎的情況下,對于工具的掌握往往決定了工作的效率
或者運行效率;與剛才貼出的連接的看法類似;
但是,如果對于理論背景模糊,那么唯一青霞的,我理解應該就是問題本身,即使暫時沒有對于問題的形式化描述給出信服有力地證明和形式化描述,但是
這一個個的問題才是與問題直接相關聯,而那些平臺工具還只是停留在“術”上面,對于這個理論的推演還是貢獻有限;
非常淺薄的認識;
?
之前笑談DL這部分的核心競爭力是調參,調侃歸調侃,如果要嚴肅的討論,調參目的不過是提高預測/分類的準確率,還是需要不少trick,并對于應用場景和數據
有著深入的理解;今天看到這么一篇文章,講述如果提高機器模型準確率的,值得一讀;數據集需要為它選用適當的算法來獲取最高的準確率,而選擇依賴經驗和不斷的嘗試;
“機器學習算法是由參數驅動的”; 這里還有另外一篇《Real-World Machine Learning: Model Evaluation and Optimization》 (CH-LINK),也是經驗之談,非常值得
一讀;其實更需要強調的是模型的假設構建;這篇文章強調在后續的兩個步驟:model-evaluation and model-optimization;文章開張主旨句:監督學習的主要任務就是用模型實現精準的預測;側重評估,而非上一篇文章中側重訓練和建模,例如介紹了cross-validation的兩種常見方法holdout和k-fold/leave-one-out;
?
?
未完待續。。。。