集成算法(聚類)

下面簡單集成算法代碼

from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt

# 創建數據集,生成 3 個中心的聚類數據,共 300 個樣本,每個樣本 2 個特征
X, _ = make_blobs(n_samples=300, centers=3, n_features=2, random_state=42)

# 進行 K 均值聚類,設置聚類數為 3
kmeans = KMeans(n_clusters=3, random_state=42)
y_pred = kmeans.fit_predict(X)

# 可視化聚類結果
plt.scatter(X[:, 0], X[:, 1], c=y_pred, cmap='viridis')
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1],?
s=300, c='red', marker='*', label='Centroids')
plt.legend()
plt.title('K-Means Clustering')
plt.show()

這段代碼展示了如何使用scikit-learn庫實現K均值(K-Means)聚類算法,并通過可視化呈現聚類結果。

首先是數據生成環節。代碼利用make_blobs函數創建了一個模擬數據集,其中參數n_samples=300指定生成300個樣本,centers=3定義了數據潛在的3個聚類中心,n_features=2設置每個樣本包含2個特征(便于二維可視化),random_state=42確保結果可重復。生成的數據集X是一個300行2列的數組,包含了分布在3個中心周圍的樣本點,由于未使用標簽信息,該過程屬于無監督學習的數據準備。

接下來是K均值聚類的實現。通過KMeans類初始化模型,n_clusters=3指定聚類數量為3(與數據生成時的中心數一致),random_state=42固定隨機種子以保證結果穩定。調用fit_predict方法同時完成模型訓練和預測,返回的y_pred是長度為300的數組,每個元素表示對應樣本所屬的聚類類別(0、1或2),實現了對無標簽數據的自動分組。

最后是結果可視化部分。使用matplotlib.pyplot繪制散點圖:以樣本的兩個特征分別作為橫、縱軸,用c=y_pred通過不同顏色區分聚類結果,cmap='viridis'設置配色方案;同時用紅色星號標記出聚類中心(kmeans.cluster_centers_存儲了3個中心的坐標),并通過s=300放大顯示以突出其位置。圖表添加了圖例、標題,最終通過plt.show()展示圖像。

從結果來看,可視化圖像會清晰呈現3組顏色不同的樣本點,每組點圍繞一個紅色星號(聚類中心)分布,直觀體現了K均值算法的核心思想——通過迭代計算,將數據劃分為K個聚類,使每個樣本到其所屬聚類中心的距離之和最小化。此案例中,由于使用了預設3個中心的模擬數據,聚類結果通常會與真實分布高度吻合,驗證了K均值在簡單數據集上的有效性。該代碼為理解無監督聚類算法提供了直觀示例,可通過調整n_clusters等參數觀察不同聚類數量對結果的影響。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/96743.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/96743.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/96743.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

01 網絡信息內容安全--緒論

1 課程內容 網絡信息內容獲取技術網絡信息內容預處理技術網絡信息內容過濾技術社會網絡分析技術入侵檢測技術異常流量檢測技術對抗攻擊技術 2 理論研討 分為16個組 2.1 網絡信息內容獲取技術:第1組 【用DeepSeek網站爬蟲,數據獲取零成本&#xff01…

GPT-5:天變了嗎?還是風停了?

2025年8月8日,OpenAI 發布了 GPT-5。這次更新被許多人寄予厚望,也引發了不少爭議。對普通用戶來說,這是一場“又快又會做事”的智能盛宴;而對資深開發者和 AI 研究者而言,GPT-5 可能更像是一次不夠激進、略顯保守的版本…

生信分析自學攻略 | R語言數據篩選和修改

在《生信小白自學攻略》系列的前幾篇文章中,我們已經了解了 R 和 RStudio 的安裝、RStudio 的深度探索,以及 R 語言的基本數據類型和數據結構。現在,是時候深入探討如何運用 R 語言對數據進行精細化處理了。本篇推文將詳細介紹如何在 R 中對數…

從零開始學習概念物理(第13版)(1)

前言:對我來說,最有用的就是物理了,尤其是電磁學。但是要學好它,我得夯實我的基礎,前面更加基礎的數學和物理都不能拉下。現在我問了Deepseek推薦的國外物理書,這本《概念物理》是最適合我,等入…

CSS變量

元素背景需要統一,一個個設置修改起來很麻煩,也沒有全局變量? CSS中的變量_css變量-CSDN博客 -- 前綴定義變量,var(--) 使用變量,:root 表示根元素。 :root { --bg:#222; --fg:#bbb; } body { background:var(--bg)…

C++(Qt)軟件調試---vscode配置clang-tidy靜態分析(30)

C(Qt)軟件調試—vscode配置clang-tidy靜態分析(30) 文章目錄C(Qt)軟件調試---vscode配置clang-tidy靜態分析(30)[toc]1 概述2 clang-tidy基本用法3 目前已有檢查項4 vscode配置clang-tidy5 .clang-tidy配置文件6 參考地址更多精彩…

每天自動備份oracle

oracle數據庫比其他數據庫都貴,但是自帶的管理工具卻很差,真不知道咋想的。想完成每天自動備份,只能自己動手(window環境):1、創建個備份目錄,如D:\databack2、創建個腳本:backup.bat核心內容如下&#xff…

HBase Coprocessor:擴展HBase功能的利器

HBase Coprocessor:擴展HBase功能的利器 關鍵詞:HBase, Coprocessor, 協處理器, RegionServer, 分布式計算, 擴展功能, 二級索引 摘要:HBase作為Hadoop生態中的分布式列存儲數據庫,以高可靠性、高吞吐量和強一致性著稱&#xff0c…

【Java后端】Spring Boot 實現請求設備來源統計與UA解析全攻略

Spring Boot 實現請求設備來源統計與UA解析全攻略 在 Web 應用的實際場景中,我們經常需要知道 請求來自哪里 —— 是 Android 手機?還是 iOS?或者是 PC 瀏覽器? 這類信息往往可以通過 User-Agent (UA) 來統計,進而幫助…

技術框架搭建:支撐競拍全流程

純競拍的技術框架是一個多層協同的系統,從用戶交互到數據處理,每個環節都有專門的技術組件提供支持。?前端層是用戶與競拍系統交互的窗口,核心目標是提供流暢、實時、直觀的操作體驗。采用 React、Vue 等主流前端框架構建單頁應用&#xff0…

2025.8.18-2025.8.24第34周:有內耗有掙扎

🌟 本周完成的3件亮點事情(可具體寫過程): openvla debug起來了把上周的演講視頻發給了導師,人家幫我提了很多建議。羅永浩,李想4小時訪談看完了即興演講開始不內耗,直接講,這樣才能…

點播視頻預覽是怎么做到的?

看進度條上的小窗口,你有沒有想過,嗶哩嗶哩是如何在進度條上顯示視頻預覽的? 這個功能非常有用,尤其是在播放長視頻時。 如何才能實現? 實現這一點有三種方法。 預先為視頻生成 CSS sprites,并通過 API 獲取預先為視頻生成 W…

prometheus監控kubernetes集群并使用 grafana展示數據

目錄 Prometheus組成及架構 prometheus核心組件 1.Prometheus Server 2.Exporters 3.Alertmanager 4.Pushgateway 數據流程 在k8s中部署PrometheusGrafana釘釘告警郵件告警 將kube-Prometheus包下載后傳入虛擬機 tar -xzv kube-promethus.zip cd 進入 ll 顯示目錄 …

K8s 實戰:Pod 版本更新回滾 + 生命周期管控

一、版本更新與回滾實驗背景本實驗通過 Kubernetes 的 Deployment 資源演示應用的版本更新與回滾流程。Deployment 是 Kubernetes 中用于管理 Pod 和 ReplicaSet 的核心資源,支持滾動更新(避免服務中斷)和版本回滾(應對更新故障&a…

靜電服漏檢率↓79%!陌訊多模態識別算法在智慧安檢的實戰解析

?原創聲明??:本文技術方案引自《陌訊視覺算法技術白皮書V3.1》,實測數據來自工業場景部署驗證 一、行業痛點:靜電防護失效的隱形風險 據《電子制造業安防報告2025》統計,精密電子車間因靜電服穿戴不規范導致的次品率高達23%&a…

StarRocks不能啟動 ,StarRocksFe節點不能啟動問題 處理

StarRocks不能啟動 ,StarRocksFe節點不能啟動問題 處理 問題描述 mysql:[Warning] Using a passwordon the command line interface can be insecureERROR 2003 (HYa00): Can’t connect to MysoL server on ‘192.168.5.128:9030’(111)Error: failed to query fE…

麒麟系統播放圖片 速度比較

pygame效果比opencv好,opencv有鋸齒:import pygame import os import timedef show_image_sdl(image_path):"""使用SDL2快速顯示圖片"""# 初始化pygamepygame.init()# 獲取屏幕信息info pygame.display.Info()screen_wid…

復雜場景橫幅識別準確率↑91%!陌訊多模態融合算法在智慧園區的實戰解析

一、行業痛點:園區違規橫幅識別的三重挑戰 據《2024智慧園區安防報告》(來源:CCSA TC10)統計: ??強光干擾??:玻璃幕墻反光導致文字識別錯誤率超50% ??形變干擾??:橫幅褶皺、飄動造成關…

Mybatis Plus - 代碼生成器簡單使用

1.引入依賴<dependency><groupId>com.baomidou</groupId><artifactId>mybatis-plus-boot-starter</artifactId><version>3.5.12</version></dependency><dependency><groupId>com.baomidou</groupId><ar…

vue2騰訊地圖點擊地圖獲取地址經緯度web

注意&#xff1a;&#xff01;&#xff01;&#xff01;在做uniapp小程序導航功能時&#xff0c;拿到我們在后臺管理設置的經緯度&#xff0c;根據經緯度去導航到店的時候&#xff0c;最好用騰訊地圖來獲取經緯度&#xff0c;uniapp小程序那邊默認導航經緯度是騰訊系的&#xf…