python數據分析與可視化一

公共部分

```

# 引入數據分析工具 Pandas

import pandas as pd

# 引入數據可視化工具 Matplotlib

import matplotlib.pyplot as plt

# 引入數據可視化工具 Seaborn (基于matplotlib)

import seaborn as sns

# 解決輸出時的列名對齊問題

pd.set_option('display.unicode.east_asian_width', True)

# 解決輸出中文亂碼問題

plt.rcParams['font.sans-serif'] = ['SimHei'] ?# 設置顯示中文字體

plt.rcParams['axes.unicode_minus'] = False ?# 設置正常顯示符號


?

# 讀取CSV文件

data = pd.read_csv('E:\\practiceCode\\pythonCode\\source\\DataAnalyst.csv',encoding='gbk')

# 顯示前5行數據

# print(df.head())

# 清洗薪水數據

data['薪水'] = data['薪水'].str.replace('k','000') # k替換為000

data['薪水'] = data['薪水'].str.replace('以上','') # 去除以上

data['薪水'] = data['薪水'].str.split('-') # 根據'-'分割字符串 [1000,2000]

# 定義 計算平均薪水函數

def calculate_salary(x):

? ? try:

? ? ? ? if len(x) > 1:

? ? ? ? ?return (int(x[0]) + int(x[1])) / 2

? ? ? ? else:

? ? ? ? ? ? return int(x[0])

? ? except:

? ? ? ? return None

# 應用函數到薪水列 ? 計算平均薪水

data['薪水'] = data['薪水'].apply(calculate_salary)

```

柱狀圖

```

# 1. 數據分析師平均薪水

avg_salary = data[data['職位名稱'] == '數據分析師']['薪水'].mean()

print('數據分析師平均薪水:',avg_salary)

# 2. 數據分析師不同城市薪資狀態 (條形圖)

plt.figure(figsize=(10,6)) # 設置畫布大小

plt.title("數據分析師薪資分布(按城市)") # 設置標題

sns.barplot(x='城市',y='薪水',data=data[data['職位名稱'] == '數據分析師'])

plt.show() # 展示

# 3. 數據分析師不同學歷的薪資狀態

plt.figure(figsize=(10,6)) # 設置畫布大小

plt.title("數據分析師薪資分布(按學歷)") # 設置標題

sns.barplot(x='教育要求',y='薪水',data=data[data['職位名稱'] == '數據分析師'])

plt.show() # 展示

```

條形圖

```

# 計算不同公司數據分析師的數量 并生成柱狀圖

company_count = data[data['職位名稱'] == '數據分析師']['公司簡稱'].value_counts()

# 取前10個元素

company_count = company_count[:10]

# 繪制柱狀圖

plt.figure(figsize=(10,6))

sns.barplot(x=company_count.index, y=company_count.values)

plt.title('不同公司數據分析師數量(10)')

plt.xlabel('公司')

plt.ylabel('數量') ?

plt.show()

```


```

# 不同學歷的數據分析師 數量

degree_count = data[data['職位名稱'] == '數據分析師']['教育要求'].value_counts()

#生成柱狀圖

plt.figure(figsize=(10,6))

sns.barplot(x=degree_count.index, y=degree_count.values)

plt.title('不同學歷的數據分析師數量')

plt.xlabel('學歷要求')

plt.ylabel('數量')

plt.show()

```

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/37018.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/37018.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/37018.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python多線程編程詳解

Python多線程編程詳解 大家好,我是免費搭建查券返利機器人省錢賺傭金就用微賺淘客系統3.0的小編,也是冬天不穿秋褲,天冷也要風度的程序猿! 多線程編程是利用計算機多核心和多線程處理器的優勢,提高程序并發性能的重要…

如何申請免費SSL證書以消除訪問網站顯示連接不安全提醒

在當今互聯網時代,網絡安全已成為一個不可忽視的問題。當用戶瀏覽一些網站時,有時會看到瀏覽器地址欄出現“不安全”的提示,這意味著該網站沒有安裝SSL證書,數據傳輸可能存在風險。那么,如何消除這種不安全提醒&#x…

2024年6月,Altair被Gartner魔力象限評為數據科學與機器學習平臺領導者

Altair 因其愿景完整性和執行能力被評為領導者 2024 年 6 月 20 日,Altair(納斯達克股票代碼:ALTR)宣布,Altair RapidMiner 被 Gartner Magic Quadrant?(魔力象限)評為數據科學與機器學習平臺領…

SpringBoot配置參數獲取

1、使用Value注解 import org.springframework.beans.factory.annotation.Value; import org.springframework.stereotype.Component;Component public class MyBean {Value("${myapp.name}") private String appName;public void printAppName() {System.out.print…

冪等生產者和事務生產者

Kafka消息交付 Kafka消息交付可靠性保障以及精確處理一次語義的實現。 所謂的消息交付可靠性保障,是指Kafka對Producer和Consumer要處理的消息提供什么樣的承諾。常見的承諾有以下三種: 最多一次(atmost once):消息…

SpringBoot:SpringBoot 調用第三方接口的幾種方式

一、前言 在項目中調用第三方接口時,確實需要根據項目的技術棧、架構規范以及具體的業務需求來選擇最適合的調用方式。比如:RESTful API調用、Feign聲明式HTTP客戶端、Apache HttpClient等調用方式,每種方式都有其適用場景和優勢。下面我們就…

倉庫管理系統16--入庫管理

原創不易&#xff0c;打字不易&#xff0c;截圖不易&#xff0c;多多點贊&#xff0c;送人玫瑰&#xff0c;留有余香&#xff0c;財務自由明日實現。 1、創建物資入庫用戶控件 <UserControl x:Class"West.StoreMgr.View.InStoreView"xmlns"http://schema…

CAS自旋解析

CAS全稱CompareAndSwap(比較并交換)&#xff0c;是cpu的指令&#xff0c;調用時不涉及上下文的切換。Java中屬于樂觀鎖的一種&#xff0c;具體流程如下圖&#xff1a; 具體的實現使用的是Unsafe類去調用native修飾的compareAndSwap方法&#xff0c;4個字段分別是對象實例&#…

PTA—C語言期末復習(判斷題)

1. C語言程序是從源文件的第一條語句開始執行的 &#xff08;F&#xff09; 在 C 語言中&#xff0c;程序是從 main 函數開始執行的&#xff0c;而不是從源文件的第一條語句開始執行 2. 若變量定義為double x;&#xff0c;則x % 2是符合C語言語法的表達式 &#xff08;F&#…

通過nginx去除 api url前綴 并保持后面剩余的url不變向后臺請求

如 我前臺瀏覽器向后臺請求的接口是 http://127.0.0.1:5099/api/sample/sample/getbuttonlist 實際的請求接口傳向 http://192.168.3.71:5099/sample/sample/getbuttonlist 方法是向config中加入下面這樣一個server server {listen 5099;location /api/ {rewrite ^/a…

HTML流星雨

目錄 寫在前面 完整代碼 代碼分析 系列文章 寫在最后 寫在前面 歲月如梭&#xff0c;光陰似箭&#xff0c;不知不覺暑假就要來嘍&#xff0c;本期小編用HTML給大家手搓了一個炫酷的流星雨動畫&#xff0c;一起來看看吧。 完整代碼 <!DOCTYPE html> <html lang…

項目風險管理系統有哪些?分享11款主流項目管理系統

本文將分享11款主流項目管理系統&#xff1a;PingCode、Worktile、StandardFusion、MasterControl、ClickUp、SAI360、Netwrix Auditor、MetricStream、Wrike、Celoxis、Zoho Projects。 在項目管理中&#xff0c;風險管理不僅是一個挑戰&#xff0c;也是保證項目順利進行的關鍵…

探索Vim的文本處理能力:精通查找與替換

探索Vim的文本處理能力&#xff1a;精通查找與替換 Vim&#xff0c;作為Linux終端下的王牌文本編輯器&#xff0c;以其強大的功能和靈活性深受開發者和系統管理員的喜愛。在Vim中進行查找和替換是文本編輯中的一項基礎且重要的操作。本文將詳細解釋如何在Vim中執行查找和替換文…

Linux Redis 服務設置開機自啟動

文章目錄 前言一、準備工作二、操作步驟2.1 修改redis.conf文件2.2 創建啟動腳本2.3 設置redis 腳本權限2.4 設置開機啟動2.5 驗證 總結 前言 請各大網友尊重本人原創知識分享&#xff0c;謹記本人博客&#xff1a;南國以南i、 提示&#xff1a;以下是本篇文章正文內容&#x…

編程的難點在哪?是邏輯、算法,還是模塊、框架的掌握?

&#x1f446;點擊關注 回復『新人禮』獲取學習禮包&#x1f446; 很多新手程序員在一開始都是滿懷熱情地投入到編程的學習&#xff0c;但卻在學習過程中處處碰壁&#xff0c;導致放棄。 編程的難點在于邏輯、數學、算法&#xff0c;還是模塊、框架、接口的掌握&#xff1f;但…

idea Error running ‘Application‘

1、Error running ‘Application’ Error running ApplicationError running Application. Command line is too long.Shorten the command line via JAR manifest or via a classpath file and rerun.找到 .idea/libraies/workspace.xml 中的 PropertiesComponent 屬性&#…

Android InputDispatcher分發輸入事件

派發循環是指 InputDispatcher 不斷地派發隊列取出事件&#xff0c;尋找合適的窗口并進行發送的過程&#xff0c;是 InputDispatcher 線程的主要工作 事件發送循環是 InputDispatcher 通過 Connection 對象將事件發送給窗口&#xff0c;并接受其反饋的過程 InputDispatcher —…

Spring Boot跨域請求關鍵處理技術解析

Spring Boot跨域請求關鍵處理技術解析 在Web開發中&#xff0c;跨域請求是一個常見問題&#xff0c;尤其在微服務架構和前后端分離的開發模式中更為突出。Spring Boot作為一種流行的Java Web框架&#xff0c;提供了多種解決跨域請求的方法。本文將詳細解析Spring Boot中跨域請…

在 Qt 中設置 QMainWindow 的大小

問題描述 一位 Qt 新手提問&#xff0c;是否有辦法將 QMainWindow 的大小設置為用戶桌面大小的 70%。他嘗試過使用伸縮因子&#xff0c;但未成功。QWidget::setFixedSize 可以工作&#xff0c;但只能使用像素值。 解決方案 方案一&#xff1a;使用 QDesktopWidget 在 QMain…

大模型賦能全鏈路可觀測性:運維效能的革新之旅

目錄 全鏈路可觀測工程與大模型結合---提升運維效能 可觀測性&#xff08;Observability&#xff09;在IT系統中的應用及其重要性 統一建設可觀測數據 統一建設可觀測數據的策略與流程 全鏈路的構成和監控形態 云上的全鏈路可視方案 為什么一定是Copilot 大模型的Copilo…