之前我們提到了常見的任務和算法,本篇我們使用邏輯回歸來進行分類
分類問題 | 回歸問題 | 聚類問題 | 各種復雜問題 |
---|---|---|---|
決策樹√ | 線性回歸√ | K-means√ | 神經網絡√ |
邏輯回歸√ | 嶺回歸 | 密度聚類 | 深度學習√ |
集成學習√ | Lasso回歸 | 譜聚類 | 條件隨機場 |
貝葉斯 | 層次聚類 | 隱馬爾可夫模型 | |
支持向量機 | 高斯混合聚類 | LDA主題模型 |
目錄
一.分類問題
二.邏輯回歸的基本原理
(1)邏輯回歸
(2)邏輯回歸模型的參數學習
(3)邏輯回歸模型的決策邊界
(4)應用案例:銀行貸款審批
(5)小結?
三.基于Scikit-learn實現邏輯回歸
(1)Python支持的邏輯回歸實現
(2)邏輯回歸應用案例實現
(3)用邏輯回歸實現多元分類
(4)機器學習一般流程總結
?四.分類模型的性能評估
(1)平衡問題分類模型的性能評估
(2)非平衡問題分類模型的性能評估
(3)小結
一.分類問題
????????分類是將樣本劃分到已知的目標類中。它從數據中學習一個分類決策函數或分類模型(也稱為分類器classifier),判斷新的未知數據的類別。分類問題的目標不是連續值,而是有限個離散值,即類別。
????????這時我們想知道,線性回歸的方法可以解決我們的分類問題嗎?
????????但是如果點的分布更復雜,如右下角又多出一些點(圖3),從圖中看原來的分割線依然有效。但新的回歸訓練得到的分割線將如圖4紫色線所示。已有的點有明顯的分類錯誤,無法在現有訓練集上得到好的線性分類函數。
??所以我們需要一個分類算法來處理這類問題,也就是我們的邏輯回歸。
二.邏輯回歸的基本原理
(1)邏輯回歸
????????邏輯回歸是一種監督學習算法。通過對有標記的樣本數據進行學習,獲得一個二分類決策函數,用來預測未知數據的類別。
sigmoid函數可以將負無窮到正無窮的自變量的值得計算結果,映射到0到1的值。
所以說先線性回歸再邏輯回歸,最后再進行判斷的決策。
(2)邏輯回歸模型的參數學習
(3)邏輯回歸模型的決策邊界
而這里的b+w1x1+w2x2 = 0,就是可以看作進行邏輯學習后得到的決策邊界。
(4)應用案例:銀行貸款審批
(5)小結?
三.基于Scikit-learn實現邏輯回歸
(1)Python支持的邏輯回歸實現
(2)邏輯回歸應用案例實現
(3)用邏輯回歸實現多元分類
(4)機器學習一般流程總結
?四.分類模型的性能評估
(1)平衡問題分類模型的性能評估
接下來我們用代碼來實現 :