機器學習算法-邏輯回歸

今天我們用?「預測考試是否及格」?的例子來講解邏輯回歸,從原理到實現一步步拆解,保證零基礎也能懂!

🎯?例子背景

假設你是班主任,要根據學生的「學習時間」預測「是否及格」,手上有以下數據:

學習時間(h)是否及格(1=是,0=否)
10
20
31
41
51

新問題:學習3.5小時的學生,及格概率有多大?


🌟?邏輯回歸核心思想

不是直接預測類別,而是計算屬于某類的概率
比如:P(及格|學習3.5h) = 70%?→ 若閾值設50%,則判定為及格

🔑?關鍵特點
  1. 輸出范圍在0~1之間(概率)

  2. S型函數(Sigmoid)?將線性結果轉為概率


📈?原理分步拆解

1.?先做線性回歸

臨時計算?z = a×學習時間 + b
(比如初始假設:z = 0.6×時間 - 1.5)

2.?通過Sigmoid函數轉概率

公式:
P(及格) = 1 / (1 + e^(-z))

  • 當z=0時,P=0.5

  • z越大,P越接近1;z越小,P越接近0

3.?計算示例

對于學習3.5小時:
z = 0.6×3.5 - 1.5 = 0.6
P = 1 / (1 + e^(-0.6)) ≈ 0.65
→ 及格概率65%


🛠??Python代碼實現

1. 基礎版(手寫核心邏輯)
import numpy as np# Sigmoid函數
def sigmoid(z):return 1 / (1 + np.exp(-z))# 假設參數
a = 0.6  # 斜率
b = -1.5 # 截距# 預測函數
def predict(hours):z = a * hours + breturn sigmoid(z)print("學習3.5小時及格概率:", predict(3.5))  # 輸出: 0.65
2. 實戰版(用scikit-learn)
from sklearn.linear_model import LogisticRegression
import numpy as np# 準備數據
X = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)  # 學習時間
y = np.array([0, 0, 1, 1, 1])                 # 是否及格# 訓練模型
model = LogisticRegression()
model.fit(X, y)# 預測新數據
new_hour = np.array([[3.5]])
prob = model.predict_proba(new_hour)[0][1]  # 獲取概率
print(f"及格概率: {prob:.2%}")              # 輸出: 64.94%# 查看參數
print(f"方程: z = {model.coef_[0][0]:.2f}×時間 + {model.intercept_[0]:.2f}")
 

📊?決策邊界可視化

import matplotlib.pyplot as plt# 繪制數據點
plt.scatter(X, y, color=['red' if i==0 else 'blue' for i in y], label='真實數據')# 生成概率曲線
X_test = np.linspace(0, 6, 100).reshape(-1,1)
prob_curve = model.predict_proba(X_test)[:,1]
plt.plot(X_test, prob_curve, 'g-', label='概率曲線')# 標記決策邊界(P=0.5對應的X值)
decision_boundary = -model.intercept_ / model.coef_[0]
plt.axvline(x=decision_boundary, linestyle='--', color='black', label='決策邊界')plt.xlabel('學習時間(h)')
plt.ylabel('概率')
plt.legend()
plt.show()

決策邊界約在2.5小時(P=0.5的位置)*


🌟?關鍵知識點

  1. 閾值可調

    • 默認0.5,可根據需求調整(如醫療診斷需更高閾值)

  2. 為什么叫"回歸"

    • 底層用了線性回歸,只是加了Sigmoid轉換

  3. 多分類擴展

    • Softmax代替Sigmoid可處理多分類(如預測ABC等級)

  4. 評估指標

    • 常用準確率、ROC曲線、AUC值


🆚?vs 線性回歸

特性邏輯回歸線性回歸
輸出概率值(0~1)任意實數
應用分類問題(如是否垃圾郵件)預測數值(如房價)
函數Sigmoid直接線性輸出

💡?常見問題

Q:特征需要標準化嗎?
A:最好做!邏輯回歸雖不受量綱影響,但能加速收斂。

Q:學習時間6小時預測概率>1?
A:不會!Sigmoid函數永遠輸出0~1之間。


總結:邏輯回歸就是
① 線性計算 → ② 概率轉換 → ③ 閾值判斷
像老師通過學習時間判斷學生及格可能性,既簡單又實用! 🎓→📈

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/83293.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/83293.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/83293.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【論文解讀】CVPR2023 PoseFormerV2:3D人體姿態估計(附論文地址)

論文鏈接:https://arxiv.org/pdf/2303.17472 源碼鏈接:https://github.com/QitaoZhao/PoseFormerV2 Abstract 本文提出了 PoseFormerV2,通過探索頻率域來提高 3D 人體姿態估計的效率和魯棒性。PoseFormerV2 利用離散余弦變換(DC…

DRW - 加密市場預測

1.數據集描述 在本次比賽中,數據集包含加密市場的分鐘級歷史數據。您的挑戰是預測未來的加密貨幣市場價格走勢。這是一項kaggle社區預測競賽,您可以以 CSV 文件的形式或通過 Kaggle Notebooks 提交您的預測。有關使用 Kaggle Notebooks 的更多詳細信息&a…

嵌入式Linux系統中的啟動分區架構

在嵌入式Linux系統架構中,Linux內核、設備樹(Device Tree)與引導配置文件構成了系統啟動的基礎核心。如何安全、高效地管理這些關鍵文件,直接影響到系統的穩定性與可維護性。近年來,越來越多的嵌入式Linux開發者選擇將啟動相關文件從傳統的“混合存放”方式,轉向采用獨立…

用戶資產化視角下開源AI智能名片鏈動2+1模式S2B2C商城小程序的應用研究

摘要:在數字化時代,平臺流量用戶尚未完全轉化為企業的數字資產,唯有將其沉淀至私域流量池并實現可控、隨時觸達,方能成為企業重要的數字資產。本文從用戶資產化視角出發,探討開源AI智能名片鏈動21模式S2B2C商城小程序在…

Spring是如何實現屬性占位符解析

Spring屬性占位符解析 核心實現思路1?? 定義占位符處理器類2?? 處理 BeanDefinition 中的屬性3?? 替換具體的占位符4?? 加載配置文件5?? Getter / Setter 方法 源碼見:mini-spring 在使用 Spring 框架開發過程中,為了實現配置的靈活性&#xf…

【大模型面試每日一題】Day 31:LoRA微調方法中低秩矩陣的秩r如何選取?

【大模型面試每日一題】Day 31:LoRA微調方法中低秩矩陣的秩r如何選取? 📌 題目重現 🌟🌟 面試官:LoRA微調方法中低秩矩陣的秩r如何選取?: #mermaid-svg-g5hxSxV8epzWyP98 {font-family:"…

字節golang后端二面

前端接口使用restful格式,post與get的區別是什么? HTTP網絡返回的狀態碼有哪些? go語言切片與數組的區別是什么? MySQL實現并發安全避免兩個事務同時對一個記錄寫操作的手段有哪些? 如何實現業務的冪等性(在…

Spring Security安全實踐指南

安全性的核心價值 用戶視角的數據敏感性認知 從終端用戶角度出發,每個應用程序都涉及不同級別的數據敏感度。以電子郵件服務與網上銀行為例:前者內容泄露可能僅造成隱私困擾,而后者賬戶若被操控將直接導致財產損失。這種差異體現了安全防護需要分級實施的基本原則: // 偽…

Leetcode第451場周賽分析總結

題目鏈接 競賽 - 力扣&#xff08;LeetCode&#xff09;全球極客摯愛的技術成長平臺 題目解析 A. 3560. 木材運輸的最小成本 AC代碼 class Solution { public:long long minCuttingCost(int n, int m, int k) {if (n > m) swap(n, m); // n < m;using ll long lon…

Linux中的shell腳本

什么是shell腳本 shell腳本是文本的一種shell腳本是可以運行的文本shell腳本的內容是由邏輯和數據組成shell腳本是解釋型語言 用file命令可以查看文件是否是一個腳本文件 file filename 腳本書寫規范 注釋 單行注釋 使用#號來進行單行注釋 多行注釋 使用 : " 注釋內容…

PHP與MYSQL結合中中的一些常用函數,HTTP協議定義,PHP進行文件編程,會話技術

MYSQL&#xff1a; 查詢函數: 執行查詢語句: 1.mysql_query("SQL語法"); 凡是執行操作希望拿到數據庫返回的數據進行展示的(結果返回: 數據結果); 2.執行結果的處理:成功為結果集&#xff0c;失敗為false; 成功返回結果:SQL指令沒有錯誤&#xff0c;但是查詢結果…

數學分析——一致性(均勻性)和收斂

目錄 1. 連續函數 1.1 連續函數的定義 1.2 連續函數的性質 1.2.1 性質一 1.2.2 性質二 1.2.3 性質三 1.2.4 性質四 2. 一致連續函數 2.1 一致連續函數的定義 2.2 一致連續性定理(小間距定理)(一致連續函數的另一種定義) 2.3 一致連續性判定法 2.4 連…

湖北理元理律師事務所:企業債務優化的科學路徑與人文關懷

湖北理元理律師事務所&#xff1a;企業債務優化的科學路徑與人文關懷 在中小企業經營壓力增大的背景下&#xff0c;如何平衡債務清償與員工生計成為關鍵課題。湖北理元理律師事務所聯合計劃集團公司&#xff0c;為服務企業設計了一套兼顧法律合規性與民生保障的債務解決方案&a…

樹莓派安裝openwrt搭建軟路由(ImmortalWrt固件方案)

&#x1f923;&#x1f449;我這里準備了兩個版本的openwrt安裝方案給大家參考使用&#xff0c;分別是原版的OpenWrt固件以及在原版基礎上進行改進的ImmortalWrt固件。推薦使用ImmortalWrt固件&#xff0c;當然如果想直接在原版上進行開發也可以&#xff0c;看個人選擇。 &…

一鍵凈化Excel數據:高性能Python腳本實現多核并行清理

摘要 本文分享兩個基于Python的Excel數據凈化腳本&#xff0c;通過多進程并行技術清除工作表內不可見字符、批注、單元格樣式等冗余內容&#xff0c;利用OpenPyXL實現底層操作&#xff0c;結合tqdm進度條和進程級任務分配&#xff0c;可快速處理百萬級單元格數據。適用于數據分…

【Netty】EventLoopGroup

在Netty的ServerBootstrap中設置兩個EventLoopGroup的作用是將網絡操作的兩個關鍵階段分離到不同的線程組中處理&#xff0c;從而優化性能并簡化并發控制。具體來說&#xff1a; 1. 兩個EventLoopGroup的角色 第一個EventLoopGroup&#xff08;通常稱為bossGroup&#xff09;&…

【前端】Vue中使用CKeditor作為富文本編輯器

官網https://ckeditor.com/ 此處記錄一下我在使用的時候具體初始化的代碼。 <template><div><textarea :id"id"></textarea></div> </template><script> export default {name: CkEditor,data: function () {return {id:…

前端面經 websocket

應用層協議&#xff0c;實現一個TCP連接上的全雙工通信&#xff0c;實時通訊 之前的實時WEB 實現輪詢 增加輪詢頻率 ws wss 明文版本 和 密文版本 特點 # 1 頭部小 2 更注重實時性

【筆記】suna部署之獲取 Supabase API key 和 project URL

#工作記錄 Supabase | The Open Source Firebase Alternative 一、注冊與登錄 方式一&#xff1a;GitHub 授權登錄 在登錄頁面選擇 “繼續使用 GitHub” &#xff0c;跳轉到 GitHub 授權頁面&#xff08;如圖 5 所示&#xff09;。確認 “Supabase 的想要訪問您的 [賬戶名] 帳…

爬蟲工具鏈的詳細分類解析

以下是針對爬蟲工具鏈的詳細分類解析&#xff0c;涵蓋靜態頁面、動態渲染和框架開發三大場景的技術選型與核心特性&#xff1a; &#x1f9e9; 一、靜態頁面抓取&#xff08;HTML結構固定&#xff09; 工具組合&#xff1a;Requests BeautifulSoup 適用場景&#xff1a;目標數…