上一次學習了評估一個模型的泛化能力,現在繼續學習通過調參來提升模型的泛化性能。scikit-learn中許多算法的參數設置,在嘗試調參之前,重要的是要理解參數的含義。找到一個模型的重要參數(提供最佳泛化性能的參數)的取值是一項棘手的任務,但對于幾乎所有模型和數據集來說都是必要的。
scikit-learn 中有一些標準方法可以幫我們完成調參。最常用的方法就是網格搜索(grid search),它主要是指嘗試我們關心的參數的所有可能組合。
例如:一個具有RBF(徑向基函數)核的核SVM的例子,它在SVC類中實現。
它有2個重要參數:核寬度gamma和正則化參數C。假設我們希望嘗試C的取值為0.001、0.01、0.1、1、10和100,gamma也取這6個值。由于我們想要嘗試的C和gamma都有6個不同的取值,所以總共有36種參數組合。所有可能的組合組成了SVM的參數設置表