【數據挖掘】Matplotlib

Matplotlib 是 Python 最常用的 數據可視化 庫之一,在數據挖掘過程中,主要用于 數據探索 (EDA)趨勢分析模式識別結果展示


📌 1. Matplotlib 基礎

1.1 安裝 & 導入

# 如果未安裝 Matplotlib,請先安裝
# pip install matplotlibimport matplotlib.pyplot as plt
import numpy as np

1.2 基本繪圖

x = np.linspace(0, 10, 100)  # 生成 100 個 0-10 之間的等距點
y = np.sin(x)plt.plot(x, y)  # 畫圖
plt.xlabel("X 軸")  # X 軸標簽
plt.ylabel("Y 軸")  # Y 軸標簽
plt.title("Sine Wave")  # 圖標題
plt.grid(True)  # 添加網格
plt.show()  # 顯示圖像

📌 輸出: 繪制 正弦曲線 📈


📌 2. 常見圖表類型

2.1 折線圖 (Line Plot)

x = np.arange(1, 11)
y = np.random.randint(10, 100, size=10)plt.plot(x, y, marker="o", linestyle="-", color="b", label="數據趨勢")
plt.legend()
plt.show()

📌 適用場景: 用于 趨勢分析時間序列數據


2.2 散點圖 (Scatter Plot)

x = np.random.rand(50)
y = np.random.rand(50)plt.scatter(x, y, color="g", alpha=0.7)  # 透明度 alpha 控制點的透明度
plt.title("Scatter Plot")
plt.show()

📌 適用場景: 適合用于 關系分析、聚類分析


2.3 柱狀圖 (Bar Chart)

categories = ["A", "B", "C", "D", "E"]
values = [10, 25, 15, 30, 20]plt.bar(categories, values, color="orange")
plt.title("Bar Chart Example")
plt.show()

📌 適用場景: 適用于 類別數據分析


2.4 直方圖 (Histogram)

data = np.random.randn(1000)  # 生成 1000 個隨機數plt.hist(data, bins=30, color="purple", alpha=0.75)
plt.title("Histogram Example")
plt.show()

📌 適用場景: 適合 分布分析,如 正態分布檢驗


2.5 盒須圖 (Box Plot)

data = [np.random.rand(100) * i for i in range(1, 5)]plt.boxplot(data, patch_artist=True)
plt.title("Box Plot Example")
plt.show()

📌 適用場景: 適合 異常值分析、數據分布分析


📌 3. 進階繪圖技巧

3.1 子圖 (Subplot)

fig, axes = plt.subplots(2, 2, figsize=(10, 8))x = np.linspace(0, 10, 100)
axes[0, 0].plot(x, np.sin(x))
axes[0, 0].set_title("Sine Wave")axes[0, 1].scatter(np.random.rand(50), np.random.rand(50))
axes[0, 1].set_title("Scatter Plot")axes[1, 0].bar(["A", "B", "C"], [10, 20, 30])
axes[1, 0].set_title("Bar Chart")axes[1, 1].hist(np.random.randn(1000), bins=30)
axes[1, 1].set_title("Histogram")plt.tight_layout()  # 自動調整子圖間距
plt.show()

📌 適用場景:一個畫布上同時繪制多個圖表


3.2 統計相關性分析

import seaborn as sns
import pandas as pd# 生成隨機數據
df = pd.DataFrame(np.random.rand(10, 4), columns=["A", "B", "C", "D"])# 計算相關性
correlation_matrix = df.corr()# 相關性熱圖
plt.figure(figsize=(8, 6))
sns.heatmap(correlation_matrix, annot=True, cmap="coolwarm", linewidths=0.5)
plt.title("Correlation Matrix Heatmap")
plt.show()

📌 適用場景: 特征工程、變量相關性分析


3.3 動態更新數據

import timeplt.ion()  # 開啟交互模式
fig, ax = plt.subplots()x = []
y = []for i in range(10):x.append(i)y.append(np.random.randint(1, 10))ax.clear()ax.plot(x, y, marker="o", linestyle="-", color="b")plt.pause(0.5)plt.ioff()  # 關閉交互模式
plt.show()

📌 適用場景: 實時數據可視化,如股市走勢


📌 4. Matplotlib 在數據挖掘中的應用

數據挖掘任務適用圖表
數據探索 (EDA)直方圖、盒須圖、散點圖
趨勢分析折線圖
相關性分析熱圖、散點圖
異常值檢測盒須圖
分類數據分析柱狀圖
數據分布分析直方圖

📌 5. 總結

Matplotlib 在數據挖掘中的核心作用: ? 數據可視化:幫助理解數據的分布、趨勢、相關性
? 異常值檢測:通過箱線圖、散點圖檢測異常點
? 模式識別:發現數據中的模式或聚類結構
? 結果展示:清晰直觀地展示數據分析和挖掘結果

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/72243.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/72243.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/72243.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

DHCP配置實驗

實驗拓撲圖 首先配置server的IP地址和網關 接下來配置R1 undo info-center enable dhcp enable //開啟DHCP服務 ip pool dhcp-pool1 //開始配置dhcp地址池 gateway-list 192.168.1.254 //配置網關 network 192.168.1.0 mask 255.255.255.0 //配置網段和子網掩碼 dns-list …

Linux:ELF文件-靜動態庫原理

??所屬專欄:Linux?? ??作者主頁:嶔某?? ELF文件 什么是編譯?編譯就是將程序源代碼編譯成能讓CPU直接執行的機器代碼 如果我們要編譯一個 .c文件,使用gcc -c將.c文件編譯為二進制文件.o ,如果一個項目有多個.…

C++性能優化常用技巧

一. 選擇合適的數據結構 1.1 map與unordered_map的選擇 如果僅僅只需要使用到快速查找的特性,那么unordered_map更加合適,他的復雜度是O(1)。如果還需要排序以及范圍查找的能力,那么就選擇map。 1.2 vector與list的選擇 通常情況下&#…

Towards Graph Foundation Models: A Survey and Beyond

Towards Graph Foundation Models: A Survey and Beyond WWW24 ?#paper/???#? #paper/💡#? 背景和動機 背景與意義 隨著基礎模型(如大語言模型)在NLP等領域的突破,圖機器學習正經歷從淺層方法向深度學習的范式轉變。GFM…

基于 Python 深度學習的電影評論情感分析可視化系統(2.0 全新升級)

基于 Python 深度學習的電影評論情感分析可視化系統,基于 Flask 深度學習,構建了一個 影評情感分析系統,能夠 自動分析影評、計算情感趨勢 并 可視化展示,對于電影行業具有重要參考價值! 基于 Python 深度學習的電影評…

Cargo, the Rust package manager, is not installed or is not on PATH.

今天在Windows操作系統上通過pip 安裝jupyter的時候遇到這個報錯,Cargo, the Rust package manager, is not installed or is not on PATH.。 解決辦法 官網:https://rustup.rs/# 下載:https://win.rustup.rs/x86_64 安裝完成之后&#xff0c…

CSS—text文本、font字體、列表list、表格table、表單input、下拉菜單select

目錄 1.文本 2.字體 3.列表list a.無序列表 b.有序列表 c.定義列表 4.表格table a.內容 b.合并單元格 3.表單input a.input標簽 b.單選框 c.上傳文件 4.下拉菜單 1.文本 屬性描述color設置文本顏色。direction指定文本的方向 / 書寫方向。letter-spacing設置字符…

開啟AI短劇新紀元!SkyReels-V1/A1雙劍合璧!昆侖萬維開源首個面向AI短劇的視頻生成模型

論文鏈接:https://arxiv.org/abs/2502.10841 項目鏈接:https://skyworkai.github.io/skyreels-a1.github.io/ Demo鏈接:https://www.skyreels.ai/ 開源地址:https://github.com/SkyworkAI/SkyReels-A1 https://github.com/Skywork…

數學建模:MATLAB極限學習機解決回歸問題

一、簡述 極限學習機是一種用于訓練單隱層前饋神經網絡的算法,由輸入層、隱藏層、輸出層組成。 基本原理: 輸入層接受傳入的樣本數據。 在訓練過程中隨機生成從輸入層到隱藏層的所有連接權重以及每個隱藏層神經元的偏置值,這些參數在整個…

Android15音頻進階之定位混音線程丟幀問題(一百零八)

簡介: CSDN博客專家、《Android系統多媒體進階實戰》一書作者 新書發布:《Android系統多媒體進階實戰》?? 優質專欄: Audio工程師進階系列【原創干貨持續更新中……】?? 優質專欄: 多媒體系統工程師系列【原創干貨持續更新中……】?? 優質視頻課程:AAOS車載系統+…

_ 為什么在python中可以當變量名

在 Python 中,_(下劃線)是一個有效的變量名,這主要源于 Python 的命名規則和一些特殊的使用場景。以下是為什么 _ 可以作為變量名的原因和常見用途: --- ### 1. **Python 的命名規則** Python 允許使用字母&#xff…

Electron+Vite+React+TypeScript開發問題手冊

ElectronViteReactTypeScript跨平臺開發全問題手冊 一、開發環境配置類問題 1.1 依賴安裝卡頓(國內網絡環境) 問題現象:執行npm install時卡在node-gyp編譯或Electron二進制包下載階段 解決方案: # 配置國內鏡像源 npm config …

【計算機網絡入門】初學計算機網絡(七)

目錄 1. 滑動窗口機制 2. 停止等待協議(S-W) 2.1 滑動窗口機制 2.2 確認機制 2.3 重傳機制 2.4 為什么要給幀編號 3. 后退N幀協議(GBN) 3.1 滑動窗口機制 3.2 確認機制 3.3 重傳機制 4. 選擇重傳協議(SR&a…

《Python實戰進階》No 8:部署 Flask/Django 應用到云平臺(以Aliyun為例)

第8集:部署 Flask/Django 應用到云平臺(以Aliyun為例) 2025年3月1日更新 增加了 Ubuntu服務器安裝Python詳細教程鏈接。 引言 在現代 Web 開發中,開發一個功能強大的應用只是第一步。為了讓用戶能夠訪問你的應用,你需…

GitLab Pages 托管靜態網站

文章目錄 新建項目配置博客添加 .gitlab-ci.yml其他配置 曾經用 Github Pages 來托管博客內容,但是有一些不足: 在不科學上網的情況下,是沒法訪問的,或者訪問速度非常慢代碼倉庫必須是公開的,如果設置為私有&#xff0…

TVbox蜂蜜影視:智能電視觀影新選擇,簡潔界面與強大功能兼具

蜂蜜影視是一款基于貓影視開源項目 CatVodTVJarLoader 開發的智能電視軟件,專為追求簡潔與高效觀影體驗的用戶設計。該軟件從零開始編寫,界面清爽,操作流暢,特別適合在智能電視上使用。其最大的亮點在于能夠自動跳過失效的播放地址…

形象生動講解Linux 虛擬化 I/O

用現實生活的比喻和簡單例子來解釋 Linux 虛擬化 I/O,就像給朋友講故事一樣。 虛擬化 I/O 要解決什么問題? 想象你有一棟大房子(物理服務器),想把它分割成多個小公寓(虛擬機)出租。每個租客&…

Java內存管理與性能優化實踐

Java內存管理與性能優化實踐 Java作為一種廣泛使用的編程語言,其內存管理和性能優化是開發者在日常工作中需要深入了解的重要內容。Java的內存管理機制借助于垃圾回收(GC)來自動處理內存的分配和釋放,但要實現高效的內存管理和優…

代碼隨想錄算法訓練營第三十天 | 卡碼網46.攜帶研究材料(二維解法)、卡碼網46.攜帶研究材料(滾動數組)、LeetCode416.分割等和子集

代碼隨想錄算法訓練營第三十天 | 卡碼網46.攜帶研究材料(二維解法)、卡碼網46.攜帶研究材料(滾動數組)、LeetCode416.分割等和子集 01-1 卡碼網46.攜帶研究材料(二維) 相關資源 題目鏈接:46. 攜…

nvidia驅動更新,centos下安裝openwebui+ollama(非docker)

查看centos內核版本 uname -a cat /etc/redhat-release下載對應的程序(這個是linux64位版本通用的) https://cn.download.nvidia.cn/tesla/550.144.03/NVIDIA-Linux-x86_64-550.144.03.run cudnn想辦法自己下一下,我這里是12.x和11.x通用的…