Pandas數據分析工具基礎

文章目錄

  • 0. 學習目標
  • 1. Pandas的數據結構分析
    • 1.1 Series - 序列
      • 1.1.1 Series概念
      • 1.1.2 Series類的構造方法
      • 1.1.3 創建Series對象
        • 1.1.3.1 基于列表創建Series對象
        • 1.1.3.2 基于字典創建Series對象
      • 1.1.4 獲取Series對象的數據
      • 1.1.5 Series對象的運算
      • 1.1.6 增刪Series對象的行數據
        • 1.1.6.1 增加行數據
        • 1.1.6.2 刪除行數據
    • 1.2 DataFrame - 數據幀
      • 1.2.1 DataFrame概念
      • 1.2.2 DataFrame類的構造方法
      • 1.2.3 創建DataFrame對象
      • 1.2.4 獲取DataFrame對象的列數據
        • 1.2.4.1 通過索引方式
        • 1.2.4.2 通過屬性方式
        • 1.2.4.3 獲取列數據的推薦方式
      • 1.2.5 增刪DataFrame對象的列數據
        • 1.2.5.1 增加列數據
        • 1.2.5.2 刪除列數據
      • 1.2.6 DataFrame對象的運算
  • 2. Pandas索引操作及高級索引
    • 2.1 索引對象
      • 2.1.1 索引對象概念
      • 2.1.2 索引的子類
    • 2.2 重置索引
      • 2.2.1 如何重置索引
      • 2.2.2 reindex()方法
        • 2.2.2.1 語法格式
        • 2.2.2.2 參數說明
        • 2.2.2.3 案例演示
    • 2.3 索引操作
      • 2.3.1 通過索引位置或索引名稱獲取序列的數據
      • 2.3.2 通過位置索引切片或索引名稱切片獲取序列的數據
      • 2.3.3 通過不連續的索引獲取序列的不連續數據
      • 2.3.4 通過布爾索引獲取序列的數據
      • 2.3.5 數據幀的行索引和列索引
      • 2.3.6 通過索引方式訪問數據幀的數據
  • 3 算術運算與數據對齊
    • 3.1 采用NaN補齊缺失值
    • 3.2 用戶指定補齊值
  • 4. 數據排序
    • 4.1 按索引排序
      • 4.1.1 對序列按索引排序
      • 4.1.2 對數據幀按索引排序
    • 4.2 按值排序
      • 4.2.1 對序列按值排序
      • 4.2.2 對數據幀按值排序
  • 5. 統計計算與描述
    • 5.1 統計函數
    • 5.2 統計描述
  • 6. 層次化索引
    • 6.1 認識層次化索引
      • 6.1.1 層次化索引概念
      • 6.1.2 創建層次化索引
        • 6.1.2.1 利用嵌套列表創建層次化索引
        • 6.1.2.2 通過MultiIndex的方法構建層次化索引
          • 6.1.2.2.1 將元組列轉換成Mutilndex對象
          • 6.1.2.2.2 將數組列表轉換成MultiIndex對象
          • 6.1.2.2.3 將多個集合的笛卡爾成績轉換成MutliIndex對象
      • 6.1.3 基于層次化索引的序列案例演示
    • 6.2 按照分層索引排序數據
  • 7. 讀寫數據操作
    • 7.1 讀寫文本文件
      • 7.1.1 CSV文件
        • 7.1.1.1 寫CSV文件
        • 7.1.1.2 讀CSV文件
      • 7.1.2 TXT文件
    • 7.2 讀寫Excel文件
      • 7.2.1 寫Excel文件
      • 7.2.2 讀Excel文件
    • 7.3 讀取HTML表格數據
      • 7.3.1 讀取HTML函數
      • 7.3.2 案例演示
    • 7.3.4 讀寫數據庫
      • 7.3.4.1 讀寫數據庫概述
      • 7.3.4.2 讀寫數據庫函數
      • 7.3.4.3 讀寫數據庫案例演示
        • 7.3.4.3.1 讀數據庫
        • 7.3.4.3.2 寫數據庫
  • 8. 小結

0. 學習目標

  1. 掌握 數據結構分析,索引操作及高級索引
  2. 掌握 算術運算與數據對齊,數據排序
  3. 掌握 統計計算與描述 ,層次化索引
  4. 掌握 讀寫數據操作

1. Pandas的數據結構分析

  • Pandas中有兩個主要的數據結構:Series(一維的數據結構)和DataFrame(二維的數據結構)

1.1 Series - 序列

1.1.1 Series概念

  • Series是一個類似一維數組的對象,它能夠保存任何類型的數據,主要由一組數據和與之相關的索引兩部分構成。
    在這里插入圖片描述
  • 注意:Series的索引位于左邊,數據位于右邊。

1.1.2 Series類的構造方法

Series(data

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/91950.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/91950.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/91950.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

大模型——Qwen開源會寫中文的生圖模型Qwen-Image

Qwen開源會寫中文的生圖模型Qwen-Image 會寫中文,這基本上是開源圖片生成模型的獨一份了。 這次開源的Qwen-Image 的最大賣點是“像素級文字生成”。它能直接在像素空間內完成排版:從小字注腳到整版海報均可清晰呈現,且同時支持英文字母與漢字。 以下圖片均來自官網的生成…

大模型知識庫(1)京東云 JoyAgent介紹

一、核心定位? JoyAgent 是京東云推出的 ?首個 100% 開源的企業級多智能體平臺,定位為“可插拔的智能發動機”,旨在通過開箱即用的產品級能力,降低企業部署智能體的門檻。其特點包括: ?完整開源?:前端&#xff0…

PowerShell 入門2: 使用幫助系統

PowerShell 入門 2:使用幫助系統 🎯 一、認識 PowerShell 幫助系統 1. 使用 Get-Help 查看命令說明 Get-Help Get-Service或使用別名: gsv2. 更新幫助系統 Update-Help3. 搜索包含關鍵詞的命令(模糊搜索) Help *log*&a…

hyper-v實戰系列:顯卡虛擬化(GPU分區)--windows篇詳解

一般來說,windows系統中最常使用的虛擬機就3個:vmware workstation,virtualbox和微軟系統自帶的hyper-v。后面與前兩者最大的區別就是能調用物理顯卡的性能。 我在這篇博文會詳述如何設置windows虛擬機的顯卡虛擬化,并會隨之…

WebGL應用實時云渲染改造后如何與網頁端實現數據通信

WebGL是一種基于OpenGL ES 2.0的Web技術,屬于BS架構,它允許在瀏覽器中渲染交互式3D和2D圖形。 隨著大場景高精度的開發要求深入,對于較高級的 WebGL 應用程序,需要性能更強的系統要求,如仍然維持低端硬件或瀏覽器&…

初始化列表,變量存儲區域和友元變量

前言初始化列表是書寫構造函數的一種方式,某些成員變量之只能通過初始化列表進行初始化。另外學習c不可避免地需要知道什么樣的變量存儲在什么區域當中如棧,堆,靜態區,常量區初始化列表書寫格式書寫上,初始化列表&…

excel插入復選框 親測有效

特別說明 1.開始位置是0 2.\u0052是勾選對號 3.\u25A1是不勾選 4.\u0052長度是1 5.\u25A1長度是1 6.漢字長度是1 7.起止位置不能超過索引位置(比如整體長度是6,截止位置最大填寫5) 示例代碼 package com.zycfc.xz.Util.excel;import org.apache.poi.hssf.usermodel.HSSFRichT…

Mac上優雅簡單地使用Git:從入門到高效工作流

Mac上優雅簡單地使用Git:從入門到高效工作流 本文將帶你解鎖在Mac上優雅使用Git的技巧,結合命令行與圖形工具,讓版本控制變得輕松高效! 一、為什么Mac是Git的最佳搭檔? 天生支持Unix命令:Git基于Linux開發…

一文了解SOA的紋波

什么是光譜紋波我們在SOA/RSOA/SLD的ASE(放大的自發輻射)光譜測試中,經常會觀察到光譜中有周期性的變化,通常我們稱之為紋波。在實際應用中,我們大多不希望這些紋波的存在。添加圖片注釋,不超過 140 字&…

ossutil 使用方法

目錄 ossutil 使用方法 1. 📤 上傳文件/文件夾到 OSS 上傳單個文件: 上傳整個文件夾(遞歸): 2. 📥 從 OSS 下載文件/文件夾 下載單個文件: 下載整個文件夾: ossutil 使用方法…

從“多、老、舊”到“4i煥新”:品牌官方商城(小程序/官網/APP···)的范式躍遷與增長再想象

全新升級版本「佛羅倫薩小鎮奧萊GO」商城正式上線!會員福利加碼 2025年,品牌官方商城應該如何定義?—— 還是一套“電商貨架”? 在商派看來,現如今“品牌官方商城”則需要重新定義,結合不同品牌企業的業務…

WIN QT libsndfile庫編譯及使用

一、概述 libsndfile庫是一個用 C 語言編寫的開源庫,用于讀取和寫入多種音頻文件格式。 環境:QT5.9.9、cmakegui3.23.0、QT的編譯器是minWG32 二、安裝 1、下載libsndfile源碼,連接:https://github.com/libsndfile/libsndfile…

Supergateway教程

Supergateway 是一款專為 MCP(Model Context Protocol)服務器設計的遠程調試與集成工具,通過 SSE(Server-Sent Events)或 WebSocket(WS)協議實現基于 stdio 的服務器與客戶端的高效通信。 Super…

203.移除鏈表元素 707.設計鏈表 206.反轉鏈表

203.移除鏈表元素 Python鏈表節點定義: class ListNode:def __init__(self, val, nextNone):self.val valself.next next 性能分析 鏈表的特性和數組的特性進行一個對比,如圖所示: 203. 移除鏈表元素 這道題就是給大家一個鏈表&#x…

人工智能之數學基礎:利用全概率公式如何將復雜事件轉為簡單事件

本文重點 全概率公式是概率論中的核心工具,用于計算復雜事件的概率。其核心思想是將復雜事件分解為若干互斥且窮盡的簡單事件,通過計算各簡單事件的概率及其條件概率,最終求得目標事件的概率。 全概率公式 全概率公式就是將復雜事件簡單化,定義如下: 如果隨機事件A1,…

飛算JavaAI深度解析:從入門到對比

目錄 一、飛算JavaAI是什么 二、如何注冊和開始使用 三、使用體驗:它能帶來什么 四、與其他大模型的對比分析 五、總結與展望 隨著人工智能技術的飛速發展,大模型在軟件開發領域的應用越來越廣泛。其中,代碼生成工具作為提升開發效率的利…

Flutter各大主流狀態管理框架技術選型分析及具體使用步驟

技術選型決策樹 #mermaid-svg-m5gUL7Cpx4rYV2BQ {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-m5gUL7Cpx4rYV2BQ .error-icon{fill:#552222;}#mermaid-svg-m5gUL7Cpx4rYV2BQ .error-text{fill:#552222;stroke:#552…

Redis類型之String

1.Redis中的string注意本文以及之后講的redis的類型但是指的value的類型,所有的key都是stringRedis中的字符串,直接就是按照二進制數據的方式存儲的,不會做任何的編碼轉換,這里相對于mysql就比較好(個人感覺&#xff0…

[激光原理與應用-156]:光學器件 - 激光器為什么會出現多余的能量,哪些地方會出現多余能量?

在激光器運行過程中,多余能量的出現是不可避免的物理現象,其根源在于能量轉換與傳輸過程中的非理想特性。以下從能量來源、產生位置及具體機制三方面進行詳細說明:一、多余能量的主要來源泵浦源效率限制泵浦源(如激光二極管、閃光…

Arxiv-Daily

Daily Paper Report - 2025-07-24 12:53 Today’s Recommended Papers 1. Multi-modal Multi-task Pre-training for Improved Point Cloud Understanding Authors: Liwen Liu, Weidong Yang, Lipeng Ma, Ben Fei Deep-Dive Summary: 多模態多任務預訓練以改善點云理解 預…