數據分析基本內容（第二十節課內容總結）

數據分析基本內容（第二十節課內容總結）

diannao/2025/8/13 12:46:45/文章來源:https://blog.csdn.net/2302_77621804/article/details/150272470

`1.pd.read_csv('一個文件.csv')`：

從本地文件加載數據，返回一個 DataFrame 對象，這是 pandas 中用于存儲表格數據的主要數據結構

`2.df.head()`：

查看數據的前五行，幫助快速了解數據的基本結構和內容

`3.df.info()`：

查看數據的特征，包括每列的非空值數量、數據類型以及內存使用情況

`4.df.shape`：

返回數據的行數和列數，幫助了解數據的規模

`5.df.describe()`：

生成數據的描述性統計信息，如均值、標準差、最小值、最大值等，但默認只對數值型列進行統計

`6.df.drop_duplicates(inplace = False)`：

刪除重復行，inplace=False 表示返回一個新的 DataFrame，而不修改原數據

`7.data.reset_index(inplace = True,drop = True)`：

重置索引，drop=True 表示丟棄舊的索引

inplace=True：直接在原數據上修改，節省內存，但會改變原始數據。

inplace=False：返回一個新的數據對象，原始數據保持不變

drop：用于刪除行或列，可以通過 inplace 參數控制是否直接修改原數據

`8.data.loc[data['sale_count'].isnull()].head()` 和? ? ? ? ? ? ? ? ? ?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?`data.loc[data['comment_count'].isnull()].tail()`：

分別查看 sale_count 和 comment_count 列中缺失值的前五行和后五行，幫助了解缺失數據的情況

`9.data.fillna(0)`：

用 0 填補所有缺失值

`10.data.isnull().any()`：

檢查數據中是否還有缺失值

`11.lcut_for_search`

針對搜索引擎的分詞模式，更適合提取關鍵詞

12.`data.groupby('店名')['銷售額'].sum()`：

按店鋪名稱（店名）分組，計算每個店鋪的總銷售額

13.`plt.pie`：繪制餅圖

`autopct='%0f%%'`：

顯示百分比格式

`pctdistance=0.9`：

百分比標簽與餅圖中心的距離

14.`plt.bar`：繪制柱狀圖

15.`ci=0`：不顯示置信區間

16.`plt.tight_layout():`

自動調整子圖的布局，避免標簽重疊

17.pctdistance

pctdistance 的值小于 1，百分比標簽會顯示在餅圖內部，距離圓心越近，值越小

pctdistance 的值大于 1，百分比標簽會顯示在餅圖外部

18.ascending

ascending=True??表示按照升序排序（從小到大）

ascending=False??表示按照降序排序（從大到小）

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/95260.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/95260.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/95260.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

2025年最新原創多目標算法：多目標酶作用優化算法（MOEAO）求解MaF1-MaF15及工程應用---盤式制動器設計，提供完整MATLAB代碼

2025年最新原創多目標算法：多目標酶作用優化算法（MOEAO）求解MaF1-MaF15及工程應用---盤式制動器設計，提供完整MATLAB代碼

一、酶作用優化算法酶作用優化（Enzyme Action Optimizer, EAO）算法是一種2025年提出的新型仿生優化算法，靈感源于生物系統中酶的催化機制，發表于JCR 2區期刊《The Journal of Supercomputing》。其核心思想是模擬酶與底物的特異性…

閱讀更多...

用 COLMAP GUI 在 Windows 下一步步完成相機位姿估計（SfM）和稀疏點云重建的詳細步驟：

用 COLMAP GUI 在 Windows 下一步步完成相機位姿估計（SfM）和稀疏點云重建的詳細步驟：

使用 COLMAP GUI 進行 SfM 和稀疏點云重建的步驟1. 打開 COLMAP GUI運行 colmap.bat，會彈出圖形界面。2. 新建項目（或打開已有項目）點擊菜單欄的 File > New Project，選擇一個空文件夾作為項目目錄（建議新建一個空目…

閱讀更多...

天線設計介質材料PEC和FR4有什么區別嗎

天線設計介質材料PEC和FR4有什么區別嗎

在電磁仿真（包括 CST 中），PEC 和 FR4 是兩種完全不同的材料類型，主要區別如下：材料性質：PEC（Perfect Electric Conductor，理想電導體）：是一種理論上的理想材料…

閱讀更多...

mysql鎖+索引

mysql鎖+索引

mysql鎖按鎖的粒度分類表級鎖（Table - level locks）特點：對整張表進行鎖定，實現簡單，加鎖和釋放鎖的速度快，但并發度較低。當一個事務對表加表級鎖后，其他事務對該表的讀寫操作都可能被阻塞。應…

閱讀更多...

計算機視覺CS231n學習（7）

計算機視覺CS231n學習（7）

可視化和理解這里主要是對CNN中間的層的結果可視化濾波器可視化直接可視化網絡各層的濾波器權重，高層濾波器的可視化結果趣味性較低，而底層濾波器通常對應邊緣、紋理等基礎視覺特征 （“高層濾波器” 通常指的是網絡中靠后的卷積層所包含的濾…

閱讀更多...

OpenBMC中工廠模式的簡明工作流程解析

OpenBMC中工廠模式的簡明工作流程解析

本文將以最簡單直接的方式，從零開始講解OpenBMC中工廠模式的完整工作流程，包括從設計到使用的全生命周期。 1. 工廠模式最簡示例我們先從一個最基礎的工廠模式實現開始： // 產品接口 class GpioPin { public:virtual void setValue(bool val…

閱讀更多...

解決：Error updating changes: detected dubious ownership in repository at

解決：Error updating changes: detected dubious ownership in repository at

在通過 Git Bash 提交項目代碼時輸入 git add . 命令后，報錯：Error updating changes: detected dubious ownership in repository at ...這是因為該項目的所有者與現在的用戶不一致比如說： 該項目的所有者是 Administrator，…

閱讀更多...

DataEase V2 社區版安裝部署

DataEase V2 社區版安裝部署

參考：使用外置 MySQL 部署 DataEase v2 - FIT2CLOUD 知識庫一、下載安裝包開源社區 - FIT2CLOUD 飛致云選擇社區版下載下載后上傳到 linux 的目錄 （要求至少200G） 二、在MySQL8中創建數據庫 # 創建DataEase庫 CREATE DATABASE datae…

閱讀更多...

nginx高性能web服務器

nginx高性能web服務器

web服務基礎介紹一、Web服務核心流程 #mermaid-svg-NCj4hbRIvvgMXmcK {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-NCj4hbRIvvgMXmcK .error-icon{fill:#552222;}#mermaid-svg-NCj4hbRIvvgMXmcK .error-text{fil…

閱讀更多...

_init__.py的作用

_init__.py的作用

目錄場景1：沒有 `__init__.py` 的情況場景2：有 `__init__.py` 并導入模塊場景3：用 `__all__` 定義"推薦工具" 注意：工具箱內部的工具互相調用情況1：在 `__init__.py` 中導入模塊情況2：在 `__init__.py` 中直接導入模塊里的功能關鍵原則在 Python 中，__…

閱讀更多...

瀏覽器面試題及詳細答案 88道（12-22）

瀏覽器面試題及詳細答案 88道（12-22）

《前后端面試題》專欄集合了前后端各個知識模塊的面試題，包括html，javascript，css，vue，react，java，Openlayers，leaflet，cesium，mapboxGL，threejs&…

閱讀更多...

開發避坑指南（23）：Tomcat高版本URL特殊字符限制問題解決方案（RFC 7230 RFC 3986）

開發避坑指南（23）：Tomcat高版本URL特殊字符限制問題解決方案（RFC 7230 RFC 3986）

異常信息 java.lang.IllegalArgumentException: 在請求目標中找到無效字符[/order/show?orderType01&orderTitle0xe50x8f0xa30xe50xb20xb80xe50x8a0xa80xe60x800x81&pageNum1 ]。有效字符在RFC 7230和RFC 3986中定義org.apache.coyote.http11.Http11InputBuffer.parse…

閱讀更多...

HTTPS的應用層協議

HTTPS的應用層協議

HTTPS的應用層協議方案 5 - 非對稱加密對稱加密證書認證在客戶端和服務器剛一建?連接的時候, 服務器給客戶端返回一個證書，證書包含了之前服務端的公鑰, 也包含了網站的身份信息. 客戶端進行認證當客戶端獲取到這個證書之后, 會對證書進行校驗(防止證書是偽…

閱讀更多...

【SpringBoot】05 容器功能 - SpringBoot底層注解的應用與實戰 - @Configuration + @Bean

【SpringBoot】05 容器功能 - SpringBoot底層注解的應用與實戰 - @Configuration + @Bean

文章目錄前言一、創建兩個組件二、使用傳統方式源代碼解釋三、使用SpringBoot方法源代碼解釋四、查看是否添加到組件中查看自定義組件名配置類在容器中注冊的是單實例組件配置類本身也是容器中的一個組件Configuration的proxyBeanMethods屬性：代理bean的方法proxyBe…

閱讀更多...

c#聯合Halcon進行OCR字符識別（含halcon-25.05 百度網盤）

c#聯合Halcon進行OCR字符識別（含halcon-25.05 百度網盤）

1.下載安裝halcon 通過網盤分享的文件：halcon-25.05.0.0-x64-win64 鏈接: https://pan.baidu.com/s/1XAx-8ZQM-ZHkgHIc-dhCYw 提取碼: whek 2.c#環境配置創建test_halcon_ocr項目找到halcon的安裝路徑我的： D:\halcon\HALCON-25.05-Progress\bin\x64…

閱讀更多...

絲桿支撐座怎樣助力升降設備實現智能化？

絲桿支撐座怎樣助力升降設備實現智能化？

絲桿支撐座作為傳動系統中的關鍵支撐部件，憑借其高剛性、抗沖擊及精準定位能力，廣泛應用于重型機械與升降設備領域，為設備提供穩定可靠的軸向承載與徑向支撐，確保高負荷工況下的安全運行。電梯 / 升降平臺：液壓電梯的輔…

閱讀更多...

Notta：高效智能的音頻轉文字工具

Notta：高效智能的音頻轉文字工具

本文轉載自：Notta：高效智能的音頻轉文字工具 - Hello123 ** 一、產品簡介 Notta 是一款基于 AI 語音識別引擎的語音轉文字工具，支持 58 種語言的轉錄和 42 種語言的翻譯。用戶可通過實時錄音或上傳音頻 / 視頻文件（如 MP3、WAV …

閱讀更多...

Docker私有倉庫創建及Docky存儲與網絡配置（小白的“升級打怪”成長之路）

Docker私有倉庫創建及Docky存儲與網絡配置（小白的“升級打怪”成長之路）

目錄一、Docker私有倉庫創建 1、在一臺安裝Docker私有倉庫的主機上添加docker-compose 命令 2、安裝docker-ce服務 3、Docker 鏡像加速 4、安裝Harbor倉庫 5、使用腳本安裝倉庫 6、網站登陸 7、客戶端使用Harbor倉庫二、Docky存儲與網絡配置 1、存儲與網絡掛載主機…

閱讀更多...

谷歌ADK接入文件操作MCP

谷歌ADK接入文件操作MCP

文章目錄MCP基礎概念文件操作服務器文件操作MCP接入谷歌ADK項目創建多輪對話代碼MCP基礎概念 MCP技術體系中，會將外部工具運行腳本稱作服務器，而接入這些外部工具的大模型運行環境稱作客戶端。一個客戶端可以接入多個不同類型的服務器，但都…

閱讀更多...

高光譜技術的獨特優勢

高光譜技術的獨特優勢

高光譜技術憑借其?納米級連續光譜采集能力?和?圖譜合一的探測模式?，在多個領域展現出不可替代的獨特優勢：一、光譜維度：精細物質指紋識別?納米級連續光譜解析? 通過 ?5-10nm帶寬的數百個連續波段?（最高330個通道&#xff…

閱讀更多...

最新文章