Python關于pandas的基礎知識

一.掃盲

(一)、pandas 是什么

pandas 是 Python 的一個第三方數據處理庫,它提供了高效、靈活的數據結構(如 Series 和 DataFrame),能方便地對結構化數據進行清洗、轉換、分析和處理。

(二)、pandas 與 NumPy 的關系

NumPy 是 Python 中用于科學計算的基礎庫,主要用于存儲和處理數值型數組。但它有一個局限,就是不能直接存儲和處理字符串等非數值類型的數據

而 pandas 是在 NumPy 的基礎上構建的,它不僅繼承了 NumPy 對數值型數據的處理能力,還擴展了對字符串、日期等多種數據類型的支持,能更好地應對復雜的結構化數據處理場景。

(三)、為何需要用 pandas 處理 Excel 文件

在日常辦公中,Excel 文件是非常常用的數據存儲和處理格式。但如果僅依靠 Excel 軟件本身進行大量數據的復雜處理,效率往往較低。

這時候就需要用到 pandas,它可以輕松讀取和寫入 Excel 文件,并且能通過簡潔的代碼實現數據篩選、排序、分組、計算等操作,大幅提升數據處理效率。

(四)、哪些行業常用 Excel 且適合用 pandas

很多行業在工作中頻繁使用 Excel,其中金融行業、投行尤為典型。這些行業需要對大量的財務數據、交易數據、市場數據等進行編排、統計和分析計算,借助 pandas 能快速完成復雜的數據處理任務,提高工作效率和準確性。

(五)、openpyxl 庫

除了 pandas,還有一個名為openpyxl的 Python 庫,它可以直接讀取和寫入 Excel 文件。同時,openpyxl 還能模擬 pandas 的部分功能,在一些特定場景下為 Excel 文件處理提供更多選擇。

(六).安裝

  1. 點擊頂部菜單欄?“File”(文件)→ “Settings”(設置)(或直接按?Ctrl + Alt + S?快捷鍵打開設置)。
  2. 在設置左側列表,找到并點擊?“Project: [你的項目名稱]” → “Python Interpreter”(Python 解釋器)?。
  3. 在右側 “Python Interpreter” 界面,點?+?號(“Add” 按鈕),打開包搜索安裝窗口,搜索你需要的第三方庫(如?pandas?numpy?等 ),再點擊 “Install Package” 安裝即可。

二.代碼演示

"""
DataFrame(數據框)
就是excel表(多個Series的拼接)
"""
import pandas as pddf_1 = pd.DataFrame({'age':[10,11,12],'name':['tim', 'tom', 'rose'],'income':[100,200,300]},index=['person1', 'person2', 'person3'])
print(df_1)"""
dataframe的屬性
"""
#行索引
df_1.index
#列名
df_1.columns
#值
df_1.valuesdf_1 = pd.DataFrame({'age':[10,11,12],'name':['tim', 'tom', 'rose'],'income':[100,200,300]})
print(df_1)
print(df_1.name)

在這個代碼里面我們可以看到在6行 pandas 數據類型是dataframe numpy的數據類型是ndnarry

?其中

df_1 = pd.DataFrame({'age':[10,11,12],'name':['tim', 'tom', 'rose'],'income':[100,200,300]},index=['person1', 'person2', 'person3'])

在DataFrame后面的數據是可以全部強制轉化表格數據的類型,

#效果展示:

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/89991.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/89991.shtml
英文地址,請注明出處:http://en.pswp.cn/web/89991.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

React 英語單詞補全游戲——一個寓教于樂的英語單詞記憶游戲

預覽:英語單詞補全 📖 產品概述 英語單詞大冒險是一款專為 7-12 歲兒童設計的互動式英語學習游戲。通過聽音頻、補全單詞的游戲方式,讓孩子在輕松愉快的環境中提升英語詞匯能力和聽力水平。 🎯 核心價值主張 寓教于樂: 將枯燥…

我的第一個開源項目 -- 實時語音識別工具

這是我的第一個開源項目,是我一直想做的一個小工具: 端到端實時語音轉文字系統。 通過小程序和H5頁面,用戶可以實時采錄音頻,通過ws上傳到java的netty server。 Java在經過權限驗證、流量控制等操作之后,通過gRPC流…

AG32 mcu+cpld 聯合編程(概念及流程)

在使用mcucpld聯合編程之前,請確認已經熟練掌握mcu的使用方法,并且對cpld編程(verilog語言)有一定的基礎。 另外,對AHB總線也需要有一定的了解。 這個章節分為兩部分: 第一部分,展示聯合編程…

Hadoop調度器深度解析:FairScheduler與CapacityScheduler的優化策略

Hadoop調度器概述在大數據處理的生態系統中,Hadoop作為分布式計算框架的核心,其資源調度機制直接決定了集群的吞吐效率和作業執行公平性。調度器作為Hadoop資源管理的中樞神經,通過協調計算資源與任務需求之間的動態平衡,成為支撐…

怎么自己搭建云手機

用閑置電腦搭建云手機 確保電腦安裝 Ubuntu 20.04(或其他支持Docker的Linux系統)。 安裝 Docker(運行云手機的核心工具)安裝Redroid(安卓容器)運行安卓容器就歐克啦。 用云服務器搭建(適合長…

網關:數據翻譯、中轉、協議轉換與邊緣計算

網關(Gateway)詳解:翻譯與中轉站的核心作用 在計算機網絡中,網關(Gateway)是一個非常重要的概念。它本質上是一個“翻譯中轉站”,其主要作用是將不同網絡之間的數據進行“翻譯”,并確…

UE5多人MOBA+GAS 番外篇:使用ECC(UGameplayEffectExecutionCalculation)制作傷害計算的流程

文章目錄定義一些屬性用于作為傷害基礎還有獲取要打出去的傷害創建一個ECC(里面執行傷害的計算)在執行ECC的GE之前需要修改ECC需要調用的值,也可以不改直接計算在屬性中監聽ECC輸出的那個值然后處理扣血定義一些屬性用于作為傷害基礎還有獲取…

SpringBoot實戰0-5

接口文檔:通俗的講,接口文檔能告訴開發者接口能返回的數據,以及為了獲取這些數據,開發者需要輸入什么樣的數據,請求哪個接口(即規范)為什么使用接口文檔:1、項目開發過程中前后端工程…

二、SpringBoot-REST開發

rest開發(表現形式轉換): 1、優點:隱藏訪問資源的行為,無法通過地址得知對資源是何種操作,書寫簡化 2、GET查詢 POST 新增/保存 PUT(修改/更新) DELETE(刪除)…

大數據之路:阿里巴巴大數據實踐——離線數據開發

數據開發平臺 統一計算平臺MaxCompute:主要服務于海量數據的存儲和計算 ,提供完善的數據導入方案, 以及多種經典的分布式計算模型,提供海量數據倉庫的解決方案,能夠更快速地解決用戶的海量數據計算問題,有效…

我的網頁聊天室設計

一、需求分析1.用戶管理模塊注冊功能實現一個注冊頁面。注冊頁面上包含了一個輸入框,輸入用戶名和密碼. 注冊成功后可以跳轉到登錄頁面.登錄功能實現一個登錄頁面。登錄頁面上包含一個輸入框。輸入用戶名和密碼. 登錄成功后可以跳轉到主頁面.2.主界面用戶信息左上角…

數據結構自學Days10 -- 二叉樹的常用實現

? 一、為什么要學習二叉樹? 1. 📦 組織數據的高效方式 二叉樹可以快速插入、刪除、查找數據,尤其在平衡時,時間復雜度為 $O(\log n)$。 適合表示分層結構(如組織結構、文件系統、語法樹)。 2. &#x…

Java注解家族--`@ResponseBody`

ResponseBody ResponseBody是 Spring 框架中的一個注解,在基于 Spring 的 Web 開發中扮演著重要角色,以下是對它的詳細總結: 1.定義與基本功能 定義:ResponseBody注解用于將 Controller 方法的返回值,通過適當的 HttpM…

react-window 大數據列表和表格數據渲染組件之虛擬滾動

簡介 React Window 是一個高效的 React 組件庫,專為渲染大數據列表和表格數據而設計。它通過”虛擬化”技術(也稱為”窗口化”或”列表虛擬化”)解決了在 React 應用中渲染大量數據時的性能問題。與傳統方法不同,React Window 只…

Eltable tree形式,序號列實現左對齊,并且每下一層都跟上一層的錯位距離拉大

要的是如圖所示效果序號加個class-name寫樣式然后給eltable加indent屬性就可以了,我設置的25

FOC算法中SIMULINK一些常用模塊(2)-Permanent Magnet Synchronous Machine模塊

一,介紹這三個模塊一起介紹了,由左到右,分別是電源模塊,驅動模塊和電機模塊。主要介紹一下電機模塊二,DC Voltage SourceDC Voltage Source 模塊是用于表示直流電壓源的基本組件,可以提供恒流直壓&#xff…

RPG62.制作敵人攻擊波數二:攻擊ui

1。經典創建userwidget,使用xmbtextblock,結構如下。然后設置動畫與音頻,上下的參數是一樣的,轉到圖表打開BP_SurvialGameMode2.再創建一個widget,結構如下新添的動畫打開XMBGameModeBase,創建構造函數AXMB…

DL00691-基于深度學習的軸承表面缺陷目標檢測含源碼python

DL00691-基于深度學習的軸承表面缺陷目標檢測含源碼python

Word 中為什么我的圖片一拖就亂跑,怎么精確定位?

核心原因:文字環繞方式 (Text Wrapping) 問題的根源在于圖片的**“文字環繞”**設置。 默認狀態:“嵌入型” (In Line with Text) 當您插入一張圖片時,Word默認會把它當作一個巨大的文字字符來處理。這就是為什么您拖動它時,它會像…

Linux物理地址空間入門:從硬件到內核內存的基石

目錄 一、物理地址空間是什么? 二、物理地址空間的構成:不僅僅是內存 三、Linux內核如何管理物理地址空間 (1)物理內存的碎片化問題 (2)物理地址的分區管理 (3)物理地址與內核…