Python常用的第三方模塊之數據分析【pdfplumber庫、Numpy庫、Pandas庫、Matplotlib庫】

【pdfplumber庫】從PDF文件中讀取內容?

import pdfplumber
#打開PDF文件
with pdfplumber.open('DeepSeek從入門到精通(20250204).pdf') as pdf:for i in pdf.pages: #遍歷頁print(i.extract_text()) #extract_text()方法提取內容print(f'----------------第{i.page_number}頁結束')

【Numpy庫】數據分析處理數據、矩陣等數據

示例:圖像的灰度處理

import numpy as np
import matplotlib.pyplot as plt
#讀取圖片
n1=plt.imread('Google.jpg')
print(type(n1),n1) #數組,三位數組,最高緯度表示的是圖像的高,次高緯度表示的是圖像的寬,最低緯度[R,G,B]顏色
plt.imshow(n1)#編寫一個灰度的公式
n2=np.array([0.299,0.587,0.114]) #創建數組
#將數組n1(RGB)顏色值與數組n2(灰度公式固定值),進行點乘運算
x=np.dot(n1,n2)
#傳入數組,顯示灰度
plt.imshow(x,cmap='gray')
#顯示圖像
plt.show()

【Pandas庫】數據分析、讀取Excel

示例:利用Pandas庫讀取Excel

import pandas as pd
import matplotlib.pyplot as plt#Pandas庫:數據分析、讀取Excel;Matplotlib庫:數據可視化,繪制餅圖、柱形圖、折線圖等#讀取Excel文件
df=pd.read_excel('商品商品_20241212115850.xls', dtype=object)  #dtype指定類型,解決pandas“讀取整數帶小數點”問題
print('讀取Excel文件如下:')
print(df)

控制臺Exce文件顯示不全問題

解決方案:讀取Excel文件前,添加以下代碼

#pd.set_option()進行設置解決顯示不全問題
# 顯示全部列
pd.set_option('display.max_columns', None)
# 顯示全部行
pd.set_option('display.max_row', None)
# 設置數據的顯示長度(解決自動換行)
pd.set_option('display.width', None)

??

?【Matplotlib庫】數據可視化,繪制餅圖、柱形圖、折線圖等

示例:利用Matplotlib庫繪制餅圖

import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
# Pandas庫:數據分析、讀取Excel;Matplotlib庫:數據可視化,繪制餅圖、柱形圖、折線圖等
#pd.set_option()進行設置解決顯示不全問題
# 顯示全部列
pd.set_option('display.max_columns', None)
# 顯示全部行
pd.set_option('display.max_row', None)
# 設置數據的顯示長度(解決自動換行)
pd.set_option('display.width', None)#讀取Excel文件
df=pd.read_excel('商品商品_20241212115850.xls', dtype=object)  #dtype指定類型,解決pandas“讀取整數帶小數點”問題
print('讀取Excel文件如下:')
print(df)#設置畫布的大小
plt.figure(figsize=(10,6))
goodsName=df['商品名稱']
stock=df['實際可銷售庫存數']
print(goodsName)
print(stock)#繪制餅圖
plt.pie(stock,labels=goodsName,autopct='%1.1f%%',startangle=90) #labels就是扇形當中所的標簽,autopct是設置餅圖每個部分所占比例,%1.1f%%保留一位小數的百分比格式,角度startangle(可提供可不提供,提供了餅圖會比較漂亮)#設置x,y軸刻度
plt.axis('equal')
plt.title('4月份商品剩余庫存占比圖')#顯示出來
plt.show()

中文亂碼問題?

解決方案:讀取Excel文件后,添加以下代碼:

#解決matplotlib畫圖中文亂碼問題
#1.下載中文字體SimHei,下載鏈接:http://139.199.170.86/downloads/SimHei.ttf
#2.安裝SimHei字體到macOS,雙擊下載的字體文件,然后點擊“安裝字體”按鈕。
#3.找到Matplotlib的字體目錄
print('Matplotlib的字體目錄:',mpl.get_data_path())
#4.找到Matplotlib的緩存目錄
print('Matplotlib的緩存目錄:',mpl.get_cachedir()) #/Users/用戶名/.matplotlib
#5.終端刪除這個緩存文件夾:rm -rf rm -rf /Users/用戶名/.matplotlib/*#6.Python腳本中配置Matplotlib使用新字體
plt.rcParams['font.sans-serif'] = ['SimHei']  # 設置字體為SimHei
plt.rcParams['axes.unicode_minus'] = False  # 解決負號顯示問題

最終展示情況:

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/78361.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/78361.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/78361.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

長短板理論——AI與思維模型【83】

一、定義 長短板理論思維模型,也被稱為木桶原理,是指一只木桶能盛多少水,并不取決于最長的那塊木板,而是取決于最短的那塊木板。該理論將木桶視為一個整體系統,各個木板代表著系統的不同組成部分或要素,強…

2025藍橋省賽c++B組第二場題解

前言 這場的題目非常的簡單啊,至于為什么有第二場,因為當時河北正在刮大風被迫停止了QwQ,個人感覺是歷年來最簡單的一場,如果有什么不足之處,還望補充。 試題 A: 密密擺放 【問題描述】 小藍有一個大箱子&#xff0…

【數據結構與算法】從完全二叉樹到堆再到優先隊列

完全二叉樹 CBT 設二叉樹的深度為 h , 若非最底層的其他各層的節點數都達到最大個數 , 最底層 h 的所有節點都連續集中在左側的二叉樹叫做 完全二叉樹 . 特點 對任意節點 , 其右分支下的葉子節點的最底層為 L , 則其左分支下的葉子節點的最低層一定是 L 或 L 1 .完全二叉樹…

Leetcode:1. 兩數之和

題目 給定一個整數數組 nums 和一個整數目標值 target,請你在該數組中找出 和為目標值 target 的那 兩個 整數,并返回它們的數組下標。 你可以假設每種輸入只會對應一個答案,并且你不能使用兩次相同的元素。 你可以按任意順序返回答案。 示…

flume整合kafka

需求一: 啟動flume 啟動kafka消費者,驗證數據寫入成功 新增測試數據 需求二: 啟動Kafka生產者 啟動Flume 在生產者中寫入數據

Hbase集群管理與實踐

一、HBase集群搭建實戰 1.1 環境規劃建議 硬件配置基準(以10節點集群為例): 角色CPU內存磁盤網絡HMaster4核16GBSSD 200GB(系統盤)10GbpsRegionServer16核64GB124TB HDD(JBOD)25GbpsZooKeeper4核8GBSSD 500GB10Gbps1.2 關鍵配置項示例(hbase-site.xml) <configu…

STM32 開發 - stm32f10x.h 頭文件(內存映射、寄存器結構體與宏、寄存器位定義、實現點燈案例)

概述 STM32F10x.h 是 STM32F1 系列微控制器的核心頭文件&#xff0c;提供了所有外設寄存器的定義和內存映射 一、內存映射 #define PERIPH_BASE ((uint32_t)0x40000000)#define APB1PERIPH_BASE PERIPH_BASE #define APB2PERIPH_BASE (PERIPH_BASE 0x…

QEMU源碼全解析 —— 塊設備虛擬化(23)

接前一篇文章:QEMU源碼全解析 —— 塊設備虛擬化(22) 本文內容參考: 《趣談Linux操作系統》 —— 劉超,極客時間 《QEMU/KVM源碼解析與應用》 —— 李強,機械工業出版社 特此致謝! QEMU啟動過程中的塊設備虛擬化 上一回解析了qcow2格式對應的qcow2_open函數,本回解…

【PCB工藝】推挽電路及交越失真

推挽電路(Push-Pull Circuit) 推挽電路(Push-Pull Circuit) 是一種常用于功率放大、電機驅動、音頻放大等場合的電路結構,具有輸出對稱、效率高、失真小等優點。 什么是推挽電路? 推挽是指:由兩種極性相反的器件(如 NPN 和 PNP、NMOS 和 PMOS)交替導通,一個“推”電…

RD電子實驗記錄本選用貼士A-B-C

傳統的實驗記錄本&#xff0c;令人又愛又恨本 如何挑選電子實驗室記錄本&#xff08;ELN&#xff09;的品牌/服務商/供應商&#xff1f; 電子實驗記錄本&#xff0c;又名為ELN&#xff0c;Electronic lab notebook&#xff0c;enotebook&#xff0c;研發電子管理系統&#xf…

Qt實戰之將自定義插件(minGW)顯示到Qt Creator列表的方法

Qt以其強大的跨平臺特性和豐富的功能&#xff0c;成為眾多開發者構建圖形用戶界面&#xff08;GUI&#xff09;應用程序的首選框架。而在Qt開發的過程中&#xff0c;自定義插件能夠極大地拓展應用程序的功能邊界&#xff0c;讓開發者實現各種獨特的、個性化的交互效果。想象一下…

java基礎之枚舉和注解

枚舉 簡介 枚舉&#xff1a;enumeration&#xff0c;jdk1.5中引入的新特性&#xff0c;用于管理和使用常量 入門案例 第一步&#xff1a;定義枚舉&#xff0c;這里定義一個動物類&#xff0c;里面枚舉了多種動物 public enum AnimalEnum {CAT, // 貓DOG, // 狗PIG // …

2.3java運算符

運算符 1. 算術運算符 算術運算符用于執行基本的數學運算&#xff0c;像加、減、乘、除等。 運算符描述示例加法int a 5 3; // a 的值為 8-減法int b 5 - 3; // b 的值為 2*乘法int c 5 * 3; // c 的值為 15/除法int d 6 / 3; // d 的值為 2%取模&#xff08;取余&…

升級 Spring Boot CLI

&#x1f31f; 升級 Spring Boot CLI 1?? &#x1f504; 通過包管理器升級 使用對應包管理器命令&#xff08;如 brew upgrade&#xff09; 2?? &#x1f4e5; 手動安裝升級 遵循 標準安裝說明 注意更新 PATH 環境變量移除舊版本路徑 &#x1f517; 鏈接原文&#xff1a…

如何輕松將RS232轉為Profibus DP,提升PLC效率?

如何輕松將RS232轉為Profibus DP&#xff0c;提升PLC效率&#xff1f; 今天&#xff0c;我們就來聊聊一個工業自動化中常見的應用場景&#xff1a;如何通過興達易控RS232轉Profibus DP網關&#xff0c;實現流量泵與PLC&#xff08;可編程邏輯控制器&#xff09;的通信。這個話…

QT 連接數據庫操作(15)

文章目錄 一、本章說明二、QT連接云端數據庫實現2.1 ODBC軟件安裝及參數設置2.2 軟件代碼實現三、項目源碼文件一、本章說明 注:本節為【基于STM的環境監測系統(節點+云服務器存儲+QT界面設計)】項目第15篇文章,前面已經創建了監測軟件的登錄窗口,接下來我們將在主窗口實…

linux系統之----命令行參數和環境變量

一、命令行參數 1.main()函數的參數 在C語言中&#xff0c;main函數可以接收命令行參數&#xff0c;其標準形式為&#xff1a; int main(int argc, char *argv[]) {// 程序代碼return 0; } 這里我們解釋一下&#xff1a; argc&#xff1a;參數個數計數器&#xff08;Argum…

解析excel中的圖片

解析excel中的圖片 前言一、pom依賴二、使用步驟1.示例數據2.代碼如下&#xff08;示例&#xff09;&#xff1a; 總結 前言 初始化數據是&#xff0c;需要將excel中的數據解析并插入數據庫。 但是某幾列存放的是圖片&#xff0c;這時候怎么辦呢。 主要解決的是&#xff1a;獲…

Unity任務系統筆記

數據結構設計 任務基類包括的字段&#xff1a; string 任務內容&#xff1b; Transform 任務目的地&#xff1b; MyCharacter 任務開啟后要更新對話的NPC&#xff1b; MyTalkData 任務開啟后相關NPC要說的對話數據&#xff1b; 共同方法&#xff1a;開啟任務、完成任務。…

STM32的開發環境介紹

目錄 STM32軟件環境 Keil軟件在線安裝 其他軟件環境安裝 STM32開發的幾種方式 STM32寄存器版本和庫函數版本 標準外設庫的作用&#xff1a; STM32軟件環境 STM32 的集成開發環境&#xff08;IDE&#xff09;&#xff1a;編輯編譯軟件 常見的環境&#xff1a; (1)KEIL&a…