Seaborn數據可視化實戰:Seaborn數據可視化基礎-從內置數據集到外部數據集的應用

Seaborn數據集探索與圖表繪制實踐

學習目標

通過本課程,你將學習如何使用Seaborn庫中的內置數據集,了解如何加載這些數據集,并掌握使用這些數據集繪制圖表的基本方法。此外,你還將學習如何導入外部數據集,并在Seaborn中使用它們進行數據可視化。

相關知識點

  • Seaborn數據集探索與圖表繪制實踐

學習內容

1 Seaborn數據集探索與圖表繪制實踐

1.1 依賴庫安裝
%pip install seaborn
%pip install matplotlib
1.2 Seaborn內置數據集的加載與使用

Seaborn是一個基于Matplotlib的高級數據可視化庫,它提供了許多內置的數據集,這些數據集非常適合用于學習和測試。Seaborn的數據集涵蓋了多種類型的數據,包括但不限于時間序列數據、分類數據和多變量數據等。這些數據集不僅有助于理解Seaborn的功能,還能幫助我們快速上手數據可視化。

加載內置數據集

加載Seaborn的內置數據集非常簡單,只需要調用seaborn.load_dataset()函數,并傳入數據集的名稱作為參數。Seaborn中包含的數據集名稱可以通過查看官方文檔或直接調用seaborn.get_dataset_names()來獲取。

import seaborn as sns# 獲取所有可用的數據集名稱
print(sns.get_dataset_names())# 加載'tips'數據集
tips = sns.load_dataset('tips')
print(tips.head())

這段代碼首先導入了Seaborn庫,并使用get_dataset_names()函數獲取了所有可用的數據集名稱。然后,我們選擇了’tips’數據集進行加載,并打印了數據集的前幾行,以便查看數據的結構。

使用內置數據集

加載數據集后,我們就可以使用Seaborn的各種繪圖函數來探索數據。例如,我們可以使用sns.scatterplot()函數來繪制散點圖,使用sns.barplot()函數來繪制條形圖等。

# 繪制'tips'數據集中的散點圖
sns.scatterplot(x='total_bill', y='tip', data=tips)
import matplotlib.pyplot as plt
plt.show()# 繪制'tips'數據集中的條形圖
sns.barplot(x='day', y='total_bill', data=tips)
plt.show()

在這段代碼中,我們首先使用scatterplot()函數繪制了’tips’數據集中’total_bill’和’tip’之間的關系圖。接著,使用barplot()函數繪制了不同日子的’total_bill’平均值的條形圖。通過這些圖表,我們可以直觀地看到數據之間的關系。

使用Seaborn繪制基本圖表

Seaborn提供了多種繪圖函數,每種函數都針對特定類型的數據和圖表。了解這些函數的基本用法,可以幫助我們更有效地進行數據可視化。

繪制散點圖

散點圖是用于顯示兩個數值變量之間關系的圖表。在Seaborn中,可以使用scatterplot()函數來繪制散點圖。

# 繪制'tips'數據集中的散點圖,添加顏色和大小參數
sns.scatterplot(x='total_bill', y='tip', hue='smoker', size='size', data=tips)
plt.show()

在這段代碼中,我們不僅繪制了’total_bill’和’tip’之間的散點圖,還通過hue參數添加了顏色編碼,表示是否吸煙,通過size參數調整了點的大小,表示餐桌的人數。這樣,圖表不僅顯示了兩個變量之間的關系,還提供了額外的信息。

繪制條形圖

條形圖用于顯示分類數據的分布情況。在Seaborn中,可以使用barplot()函數來繪制條形圖。

# 繪制'tips'數據集中的條形圖,顯示不同日子的'total_bill'平均值
sns.barplot(x='day', y='total_bill', data=tips, ci=None)
plt.show()

在這段代碼中,我們繪制了不同日子的’total_bill’平均值的條形圖。通過設置ci=None,我們去除了置信區間,使得圖表更加簡潔。

1.3 導入外部數據集

雖然Seaborn提供了豐富的內置數據集,但在實際工作中,我們更常用的是自己收集或從其他來源獲取的數據。Seaborn支持從CSV、Excel等文件中導入數據。

從CSV文件導入數據

從CSV文件導入數據非常簡單,可以使用Pandas庫的read_csv()函數。

!wget https://model-community-picture.obs.cn-north-4.myhuaweicloud.com/ascend-zone/notebook_datasets/d2450e362fd711f0aa39fa163edcddae/tips.csv
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt# 從CSV文件導入數據
data = pd.read_csv('tips.csv')
print(data.head())

在這段代碼中,我們使用Pandas的read_csv()函數從指定路徑讀取CSV文件,并將數據加載到一個DataFrame中。然后,我們打印了數據的前幾行,以檢查數據是否正確加載。

使用外部數據集繪制圖表

一旦數據被加載到DataFrame中,我們就可以像使用內置數據集一樣使用這些數據來繪制圖表。

繪制’tips’數據集中的散點圖,添加顏色和大小參數

sns.scatterplot(x=‘total_bill’, y=‘tip’, hue=‘smoker’, size=‘size’, data=data)
plt.show()
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/94398.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/94398.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/94398.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

漫談《數字圖像處理》之經典空域邊緣檢測Canny與LOG

在《數字圖像處理》的圖像分割領域,Canny 邊緣檢測與 LOG(高斯拉普拉斯)邊緣檢測是兩款極具代表性的先進空域算法。不同于深度學習驅動的方法,它們通過對圖像像素的直接計算提取邊緣,下面用更貼近日常認知的語言&#…

搶紅包案例加強版

加join的功能是保證線程全部運行完畢,之后好統計構造器剛開始為空列表,利用這個方法返回每個成員列表(把每個員工弄成一個列表里面寫他們搶到的紅包大小,索引代表搶到的個數。)

曲面方程的三維可視化:從數學解析到Python實現

在三維幾何建模中,我們經常遇到需要將隱式方程可視化的需求。本文將深入探討一個特定的曲面方程: XH?YH2+ZH2tan?(θ)?H2πarcsin?(YHYH2+ZH2)=0 X_H - \frac{\sqrt{Y_H^2 + Z_H^2}}{\tan(\theta)} - \frac{H}{2\pi} \arcsin\left( \frac{Y_H}{\sqrt{Y_H^2 + Z_H^2}} \r…

當GitHub宕機時,我們如何協作

引言簡述GitHub在全球開發協作中的重要性提出假設性問題:當GitHub不可用時,如何確保團隊協作不中斷常見的GitHub宕機場景服務完全不可用(如DNS問題、全球性故障)部分功能受限(如API速率限制、倉庫訪問失敗)…

如何確定哪些層應添加適配器(Adapter)?(58)

“它如何確定哪些層應添加適配器(Adapter)?是否只有量化層符合條件?我能否也將適配器添加到常規(非量化)線性層上?” 這個問題提得很好,我會逐一為你解答。首先,先給出簡潔結論: ? 主流模型架構會預配置目標層列表,適配器將應用于這些列表中的層。 ? 無論目標層…

【內網滲透】CVE-2025-21420 利用cleanmgr本地提權

目錄 原理 POC 復現 一個windows本地提權漏洞 這是一個存在于Windows磁盤清理工具(cleanmgr.exe)中的權限提升漏洞。攻擊者可以利用該系統組件在處理特定目錄時的邏輯缺陷,通過精心構造的符號鏈接(Symbolic Link)&a…

什么是JSON-RPC 2.0,在項目中應該怎么使用

它是什么 JSON-RPC 2.0 是一種超輕量、與傳輸無關的遠程調用協議:用 JSON 表達“方法名 參數 → 結果/錯誤”。可跑在 HTTP、WebSocket、Unix 管道,甚至 stdio 上(很多開發協議如 LSP 就用它)。 報文長這樣 ? 請求: …

基于CentOS7:Linux服務器的初始化流程

文章目錄前言一、服務器初始化1.1 配置國內 Yum 源(加速軟件安裝)1.1.1 使用阿里云源1.1.2 使用清華源(可選)1.2 更新系統與安裝必備工具1.3 網絡連接驗證1.4 配置主機名1.5 同步時間1.6 配置iptables防火墻1.6.1 手動配置iptable…

如何避免MyBatis二級緩存中的臟讀

避免 MyBatis 二級緩存中的臟讀問題(即緩存數據與數據庫實際數據不一致),需要從緩存更新機制、配置策略、業務設計等多維度入手。以下是經過實踐驗證的解決方案,結合底層原理和具體實現:一、理解二級緩存臟讀的根源臟讀…

Python實現RANSAC進行點云直線、平面、曲面、圓、球體和圓柱擬合

本節我們分享使用RANSAC算法進行點云的擬合。RANSAC算法是什么?不知道的同學們前排罰站!(前面有)總的來說,RANSAC(Random Sample Consensus)是一種通用的迭代魯棒估計框架,無論擬合何種幾何模型&#xff0c…

實驗2 天氣預報

實驗1 天氣預報一、實驗目標二、實驗步驟(一)準備工作(二)小程序開發項目創建頁面配置視圖設計邏輯實現三、程序運行結果四、問題總結與體會主要問題及解決方案主要收獲chunk的博客地址一、實驗目標 1、掌握服務器域名配置和臨時…

【CVE-2025-5419】(內附EXP) Google Chrome 越界讀寫漏洞【內附EXP】

前言 近日,奇安信CERT監測到Google Chrome中曝出一枚高危安全漏洞(CVE-2025-5419,QVD-2025-21836),該漏洞屬于越界讀寫問題,攻擊者只需通過構造惡意網頁,就可能觸發漏洞,從而繞過Chrome的沙箱防護,直接實現遠程代碼執行,最終完全控制用戶設備。目前,安全社區已確認…

【科研繪圖系列】R語言在海洋生態學中的應用:浮游植物糖類組成與溶解性有機碳的關系

禁止商業或二改轉載,僅供自學使用,侵權必究,如需截取部分內容請后臺聯系作者! 文章目錄 介紹 數據準備 數據處理 糖類組成隨年齡的變化 糖類組成與DOC含量的關系 數據可視化 加載R包 數據下載 導入數據 數據預處理 畫圖 總結 系統信息 介紹 本教材通過R語言及其強大的數據…

webpack文件指紋:hash、chunkhash與contenthash詳解

文件指紋就是打包后輸出文件的后綴,每次構建都會生成不同的文件后綴,這樣可以防止瀏覽器的默認緩存,使客戶端代碼可以及時修改。文件指紋的三種方式:? hash ?:基于整個項目構建內容生成全局哈希值,任何文…

Pytest 插件怎么寫:從0開發一個你自己的插件

概述 你用過 pytest-html 生成報告,或用 pytest-xdist 并行運行測試嗎?這些強大的功能,其實都是 Pytest 插件 這些都是我們引入項目后直接使用的,當然 你也可以自己寫一個 Pytest 插件 基本原理 Pytest 的強大,源于它的 插件系統。它允許你通過定義特定的函數(稱為 H…

Java:IO流——基礎篇

目錄 前言 一、File 類 1、概述 ①構造方法 ②實例對象 2、使用 ①查看名稱、路徑、長度 ②判斷、創建和刪除操作 ③目錄遍歷操作 二、IO流 1、流的概念 2、流的分類 ①按數據流向 ②按數據類型 ③按功能 3、字節流 ⑴FileInputStream——文件輸入流 ⑵FileOutputStream——文件…

數據挖掘 5.1~5.2 PCA——前言

5.1 Twelve ways to fool the masses 5.1 愚弄大眾的十二種方法 5.2.1 Prelim: Old MacDonald meets Lagrange 5.2.1 前言:老麥克唐納遇見拉格朗日 5.2. Prelim: Meet stubborn vectors 5.2. 前言:遇見頑固向量 5.2.3 Prelim: Covariance and its friend…

DeepSeek分析

(非走向數字時代,融入數字生活,構建數字生態的分解,只是感覺可以分享給大家---因此現設置VIP,旺海涵) 這是deepseek剛爆的時候,春節緊急對其做的分析。 內容還是私藏狀態,做了初步評估,感覺可以分享給大家!!! 但是非共享的構建數字生態的核心,因此添加了vip設置…

2025第五屆人工智能、自動化與高性能計算國際會議 (AIAHPC 2025)

重要信息 官網:www.aiahpc.org 時間:2025年9月19-21日 地點:中國合肥 主題 1、高性能計算 并行和分布式系統架構 高性能計算的語言和編譯器 并行和分布式軟件技術 并行和分布式算法 嵌入式系統 計算智能 點對點計算 網格和集群計算…

CORS解決跨域問題的多個方案 - nginx站點配置 / thinkphp框架內置中間件 / 純前端vue、vite的server.proxy代理

效果圖 跨域報錯 跨域解決 方案實測 1. nginx、apache站點配置 > OK 2. thinkphp框架內置中間件 “跨域請求支持” > OK 3. 純前端vue、vite的server.proxy代理 > 不OK 方案具體設置 1. nginx、apache站點配置 > OK 修改nginx服務器的站點的跨域信息 日志下…