機器學習(5):支持向量機

1 介紹

????????支持向量機(Support Vector Machine,簡稱 SVM)是一種監督學習算法,主要用于分類和回歸問題。SVM 的核心思想是找到一個最優的超平面,將不同類別的數據分開。這個超平面不僅要能夠正確分類數據,還要使得兩個類別之間的間隔(margin)最大化。

1.1 線性可分

????????在二維空間上,兩類點被一條直線完全分開叫做線性可分。

????????樣本中距離超平面最近的一些點,這些點叫做支持向量。

1.2?軟間隔

????????在實際應用中,完全線性可分的樣本是很少的,如果遇到了不能夠完全線性可分的樣本,我們應該怎么辦?比如下面這個:

????????于是我們就有了軟間隔,相比于硬間隔的苛刻條件,我們允許個別樣本點出現在間隔帶里面,比如:

1.3?線性不可分

???????我們剛剛討論的硬間隔和軟間隔都是在說樣本的完全線性可分或者大部分樣本點的線性可分。但我們可能會碰到的一種情況是樣本點不是線性可分的,比如:

????????這種情況的解決方法就是將二維線性不可分樣本映射到高維空間中,讓樣本點在高維空間線性可分,比如:

????????對于在有限維度向量空間中線性不可分的樣本,我們將其映射到更高維度的向量空間里,再通過間隔最大化的方式,學習得到支持向量機,就是非線性 SVM。

1.4?優缺點

????????優點

  • 有嚴格的數學理論支持,可解釋性強,不依靠統計方法,從而簡化了通常的分類和回歸問題
  • 能找出對任務至關重要的關鍵樣本(即:支持向量)
  • 采用核技巧之后,可以處理非線性分類/回歸任務
  • 最終決策函數只由少數的支持向量所確定,計算的復雜性取決于支持向量的數目,而不是樣本空間的維數,這在某種意義上避免了“維數災難”。

????????缺點

  • 訓練時間長。當采用 SMO 算法時,由于每次都需要挑選一對參數,因此時間復雜度為?O(N2)?,其中 N 為訓練樣本的數量;
  • 當采用核技巧時,如果需要存儲核矩陣,則空間復雜度為?O(N2)?;
  • 模型預測時,預測時間與支持向量的個數成正比。當支持向量的數量較大時,預測計算復雜度較高。

????????因此支持向量機目前只適合小批量樣本的任務,無法適應百萬甚至上億樣本的任務。

2?使用 Python 實現 SVM

2.1?安裝必要的庫

????????首先,確保你已經安裝了scikit-learn庫。如果沒有安裝,可以使用以下命令進行安裝:

pip install scikit-learn

2.2?導入庫

import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm, datasets
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

2.3?加載數據集

????????我們將使用scikit-learn自帶的鳶尾花(Iris)數據集。

# 加載鳶尾花數據集
iris = datasets.load_iris()
X = iris.data[:, :2]  # 只使用前兩個特征
y = iris.target

2.4?劃分訓練集和測試集

# 將數據集劃分為訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

2.5?訓練 SVM 模型

# 創建SVM分類器
clf = svm.SVC(kernel='linear')  # 使用線性核函數# 訓練模型
clf.fit(X_train, y_train)

2.6?預測與評估

# 在測試集上進行預測
y_pred = clf.predict(X_test)# 計算準確率
accuracy = accuracy_score(y_test, y_pred)
print(f"模型準確率: {accuracy:.2f}")

2.7?可視化結果

# 繪制決策邊界
def plot_decision_boundary(X, y, model):h = .02  # 網格步長x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1xx, yy = np.meshgrid(np.arange(x_min, x_max, h),np.arange(y_min, y_max, h))Z = model.predict(np.c_[xx.ravel(), yy.ravel()])Z = Z.reshape(xx.shape)plt.contourf(xx, yy, Z, alpha=0.8)plt.scatter(X[:, 0], X[:, 1], c=y, edgecolors='k', marker='o')plt.xlabel('Sepal length')plt.ylabel('Sepal width')plt.title('SVM Decision Boundary')plt.show()plot_decision_boundary(X_train, y_train, clf)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/66815.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/66815.shtml
英文地址,請注明出處:http://en.pswp.cn/web/66815.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【前端知識】簡單易懂的vue前端頁面元素權限控制

文章目錄 設計思路代碼實現1. **權限數據管理**2. **權限判斷方法**3. **動態控制元素**4. **路由權限控制**5. **無權限頁面** 總結相關文獻 在前端實現基于 Vue 的權限控制,通常需要結合后端返回的用戶權限數據,動態控制頁面元素的顯示與隱藏、按鈕的可…

250123-java設計模式

設計模式是指經過大量實踐后經過總結和理論化后優選的代碼結構。 1.1 單態設計模式 一個類只能創建一個實例化對象。 1.2 模版設計模式 比如抽象類的應用。 1.3 代理設計模式 比如接口的應用。 1.4 共享設計模式 why?有效的減少垃圾空間的產生。 1.5 集成設…

C#性能優化技巧:利用Lazy<T>實現集合元素的延遲加載

一、C#中的Lazy C#中的Lazy<T>是一個泛型類&#xff0c;它實現了延遲加載&#xff08;Lazy Initialization&#xff09;的功能。延遲加載是指對象的創建被推遲&#xff0c;直到第一次被使用時才進行實例化。這對于大型或資源密集型對象的性能優化非常有用&#xff0c;因…

百度APP iOS端磁盤優化實踐(上)

01 概覽 在APP的開發中&#xff0c;磁盤管理已成為不可忽視的部分。隨著功能的復雜化和數據量的快速增長&#xff0c;如何高效管理磁盤空間直接關系到用戶體驗和APP性能。本文將結合磁盤管理的實踐經驗&#xff0c;詳細介紹iOS沙盒環境下的文件存儲規范&#xff0c;探討業務緩…

docker安裝elk6.7.1-搜集java日志

docker安裝elk6.7.1-搜集java日志 如果對運維課程感興趣&#xff0c;可以在b站上、A站或csdn上搜索我的賬號&#xff1a; 運維實戰課程&#xff0c;可以關注我&#xff0c;學習更多免費的運維實戰技術視頻 0.規劃 192.168.171.130 tomcat日志filebeat 192.168.171.131 …

SpringBoot的Swagger配置

一、Swagger配置 1.添加依賴 <dependency><groupId>com.github.xiaoymin</groupId><artifactId>knife4j-spring-boot-starter</artifactId><version>3.0.2</version> </dependency> 2.修改WebMvcConfig Slf4j Configurat…

linux+docker+nacos+mysql部署

一、下載 docker pull mysql:5.7 docker pull nacos/nacos-server:v2.2.2 docker images 二、mysql部署 1、創建目錄存儲數據信息 mkdir ~/mysql cd ~/mysql 2、運行 MySQL 容器 docker run -id \ -p 3306:3306 \ --name mysql \ -v $PWD/conf:/etc/mysql/conf.d \ -v $PWD/…

代碼隨想錄——二叉樹(一)

文章目錄 二叉樹遍歷先序遍歷中序遍歷后序遍歷層序遍歷層序遍歷Ⅱ二叉樹的右視圖二叉樹的層平均值N插樹的層序遍歷在每個樹行中找最大值填充每個節點的下一個右側節點指針填充每個節點的下一個右側節點指針 II 二叉樹遍歷 先序遍歷 二叉樹先序遍歷 遞歸形式 /*** Definitio…

詳細介紹:持續集成與持續部署(CI/CD)技術細節(關鍵實踐、CI/CD管道、優勢與挑戰)

目錄 前言1、 持續集成&#xff08;CI&#xff09;1.1、持續集成的關鍵實踐1.2、持續集成工具1.3、持續集成的優勢 2、持續部署與持續交付&#xff08;CD&#xff09;2.1、持續交付&#xff08;Continuous Delivery&#xff09;2.2、持續部署&#xff08;Continuous Deployment…

Linux 系統服務開機自啟動指導手冊

一、引言 在 Linux 系統中&#xff0c;設置服務開機自啟動是常見的系統配置任務。本文檔詳細介紹了多種實現服務開機自啟動的方法&#xff0c;包括 systemctl 方式、通用腳本方式、crontab 方案等&#xff0c;并提供了生產環境下的方案建議和開機啟動腳本示例。 二、systemct…

Java如何向http/https接口發出請求

用Java發送web請求所用到的包都在java.net下&#xff0c;在具體使用時可以用如下代碼&#xff0c;你可以把它封裝成一個工具類 import javax.net.ssl.*; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.Outpu…

禁止 iOS 系統瀏覽器雙指放大頁面

網上找到禁止ios縮放的方法基本都試過了,但是還是有bug,如標題所示,下面我將總結一下禁止ios縮放,雙擊縮放的方法。 方法一 在 iOS 10之前&#xff0c;iOS 和 Android 都可以通過一行 meta 標簽來禁止頁面縮放&#xff1a; <meta content"widthdevice-width, initia…

讀西瓜書的數學準備

1&#xff0c;高等數學&#xff1a;會求偏導數就行 2&#xff0c;線性代數&#xff1a;會矩陣運算就行 參考&#xff1a;線性代數--矩陣基本計算&#xff08;加減乘法&#xff09;_矩陣運算-CSDN博客 3&#xff0c;概率論與數理統計&#xff1a;知道啥是隨機變量就行

PLC通信

PLC&#xff08;可編程邏輯控制器&#xff09;通信是指 PLC 與其他設備或系統之間進行數據傳輸和信息交換的過程 一、PLC通信方式 1 &#xff09;串行通信 數據按位順序依次傳輸&#xff0c;只需要一對傳輸線&#xff0c;成本低&#xff0c;傳輸距離長&#xff0c;但速度相對…

C/C++、網絡協議、網絡安全類文章匯總

&#x1f6f8; 文章簡介 本文章主要對本博客的所有文章進行了匯總&#xff0c;方便查找。內容涉及C/C編程&#xff0c;CMake、Makefile、Shell腳本&#xff0c;GUI編程框架MFC和QT&#xff0c;Git版本控制工具&#xff0c;網絡協議基礎知識&#xff0c;網絡安全領域相關知識&a…

java 中多線程、 隊列使用實例,處理大數據業務

場景&#xff1a; 從redis 訂閱數據 調用線程來異步處理數據 直接上代碼 定義線程管理類 import org.slf4j.Logger; import org.slf4j.LoggerFactory; import org.springframework.beans.BeansException; import org.springframework.beans.factory.BeanFactory; import org…

【自動駕駛】4 智駕生態概述

目錄 1 智駕生態概述 ▲ 關鍵組成部分 ▲ 概述 2 關鍵技術 ▲ 傳感器 ▲ 感知 ▲ 數據閉環 3 未來市場 1 智駕生態概述 智能駕駛生態&#xff0c;簡稱智駕生態&#xff0c;是指圍繞智能駕駛技術的開發、應用、服務和支持所形成的產業體系和合作網絡。 涵蓋了從硬件設…

2025.1.20——一、[RCTF2015]EasySQL1 二次注入|報錯注入|代碼審計

題目來源&#xff1a;buuctf [RCTF2015]EasySQL1 目錄 一、打開靶機&#xff0c;整理信息 二、解題思路 step 1&#xff1a;初步思路為二次注入&#xff0c;在頁面進行操作 step 2&#xff1a;嘗試二次注入 step 3&#xff1a;已知雙引號類型的字符型注入&#xff0c;構造…

”彩色的驗證碼,使用pytesseract識別出來的驗證碼內容一直是空“的解決辦法

問題&#xff1a;彩色的驗證碼&#xff0c;使用pytesseract識別出來的驗證碼內容一直是空字符串 原因&#xff1a;pytesseract只識別黑色部分的內容 解決辦法&#xff1a;先把彩色圖片精確轉換成黑白圖片。再將黑白圖片進行反相&#xff0c;將驗證碼部分的內容變成黑色&#…

Unity3D項目開發中的資源加密詳解

前言 在Unity3D游戲開發中&#xff0c;保護游戲資源不被非法獲取和篡改是至關重要的一環。資源加密作為一種有效的技術手段&#xff0c;可以幫助開發者維護游戲的知識產權和安全性。本文將詳細介紹Unity3D項目中如何進行資源加密&#xff0c;并提供相應的技術詳解和代碼實現。…