【利用二手車數據進行可視化分析】

利用二手車數據進行可視化分析

  • 查看原始數據
  • 去除重復數據
  • 需求分析
    • 1.統計全國總共有多少量二手車,用KPI圖進行展示
    • 2.統計安徽總共有多少量二手車,用KPI圖進行展示
    • 3.統計合肥總共有多少量二手車,用KPI圖進行展示
    • 4.取最貴的10輛二手車信息,用列表圖展示
    • 5.各品牌二手車數量,取Top10用餅圖展示
    • 6.各品牌價格最貴的二手車
    • 7.各品牌價格最低的二手車
    • 8.各城市二手車數量,取Top10用餅圖展示
    • 9.幾幾年款的二手車平均價格走勢,取最近10年的數據用折線圖展示
    • 10.統計每座城市二手車數量,并通過地圖展示
  • 利用生成的表在FineBI中繪圖
    • 鏈接數據庫
    • 傳入數據庫中的表
    • 新建分析進行繪圖

查看原始數據

查看MySQL中爬取完成的數據發現有十萬多條,接下來清理一下這些數據看看有沒有重復的數據將這些數據剔除
在這里插入圖片描述

select car_id from car_info group by car_id

可以看到不重復的數據有七萬多條,有將近三萬條的重復數據,接下來就去除這些重復數據
在這里插入圖片描述

去除重復數據

先查看一下重復的數據是什么樣的
查看一下重復車型的car_id 有好多重復10次以上 復制一些看看這些車的信息

select car_id,count(*) cnt 
from car_info 
group by car_id
having cnt>2
order by cnt descc6a6fa03344447c1
d6d5b6c63184f41cselect * from car_info where car_id = 'c6a6fa03344447c1'

在這里插入圖片描述
在這里插入圖片描述
可以看到一些一樣的車不止掛在一個地方而是掛在離一個城市周邊的地區都會掛牌,導致重復的數據很高,現在我們根據車輛的一些信息分類然后將數據進行清洗。
按照車型,公里數,首付,總價這些車子定量不變的信息進行分類,可以看到清洗出來了8萬條數據,這些數據都是不相同的,因為有些車子雖然car_id相等 但是車子的型號等信息不相等。

# 去除重復數據
select car_id,car_info,car_year,car_mile,car_price_total,car_price_pyment
from car_info 
group by car_id,car_info,car_year,car_mile,car_price_total,car_price_pyment

在這里插入圖片描述
接著將清洗好的數據保存到另一張表下,避免修改源數據,

# 將清洗好的數據保存在另外一張表下 因為使用group分組 所以用max就可以很容易取到city
create table if not exists car_detail as
(select car_id,car_info,car_year,car_mile,car_price_total,car_price_pyment,max(city_name) as city,max(city_code) as city_code,max(created_at) as creat_time,max(updated_at) as update_time
from car_info 
group by car_id,car_info,car_year,car_mile,car_price_total,car_price_pyment)

在這里插入圖片描述

需求分析

畫圖需要使用python繪圖或者使用專用軟件繪圖
使用python繪圖可以使用pyecharts
這里我使用軟件fineBI繪圖

1.統計全國總共有多少量二手車,用KPI圖進行展示

create table if not exists ques1 as 
(select count(distinct car_id) as all_car
from car_detail)

2.統計安徽總共有多少量二手車,用KPI圖進行展示

create table if not exists ques2 as 
(select count(distinct car_id) as anhui_car 
from car_detail
where city_code in ('hf','wuhu','bengbu','bozhou','hn','mas','huaibei'
,'tongling','anqing',"huangshan",'chuzhou','chizhou','fy','suzhou','la','xuancheng'))

3.統計合肥總共有多少量二手車,用KPI圖進行展示

create table if not exists ques3 as 
(select count(distinct car_id) as hf_car
from car_detail
where city_code = 'hf') 

4.取最貴的10輛二手車信息,用列表圖展示

create table if not exists ques4 as 
(select city,car_info,car_id,car_mile,car_price_total
from car_detail
order by car_price_total desc
limit 10)

5.各品牌二手車數量,取Top10用餅圖展示

create table if not exists ques5 as
(select bend,count(*) as cont
from 
(# SUBSTRING_INDEX(str,delim,count) 類似與split的函數
select SUBSTRING_INDEX(t1.car_info,'-',1) as bend
from car_detail as t1) as tt1
group by bend
order by cont desc
limit 10)

6.各品牌價格最貴的二手車

create table if not exists ques6 as
(select bend,ROUND(max(tt1.car_price_total),2) as max_price
from (select SUBSTRING_INDEX(t1.car_info,'-',1) as bend,t1.car_price_total
from car_detail as t1) as tt1
group by tt1.bend
order by max_price desc)

7.各品牌價格最低的二手車

create table if not exists ques7 as
(select bend,ROUND(min(tt1.car_price_total),2) as min_price
from (select SUBSTRING_INDEX(t1.car_info,'-',1) as bend,t1.car_price_total
from car_detail as t1) as tt1
group by tt1.bend
order by min_price)

8.各城市二手車數量,取Top10用餅圖展示

create table if not exists ques8 as
(select city,count(*) as cont
from car_detail 
group by city
order by cont desc)

9.幾幾年款的二手車平均價格走勢,取最近10年的數據用折線圖展示

create table if not exists ques9 as
(select t1.car_first_year as car_year,round(avg(t1.car_price_total),2) as price 
from 
(select year(car_year) as car_first_year,car_price_total
from car_detail) as t1
group by t1.car_first_year
order by car_year desc)

10.統計每座城市二手車數量,并通過地圖展示

create table if not exists ques10 as
(select city,count(*) as car_number
from car_detail
group by city
order by car_number desc)

利用生成的表在FineBI中繪圖

鏈接數據庫

在這里插入圖片描述

傳入數據庫中的表

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

新建分析進行繪圖

在這里插入圖片描述
繪圖完成
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/212563.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/212563.shtml
英文地址,請注明出處:http://en.pswp.cn/news/212563.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

web,Apache簡述

一.HTTP請求訪問的完整過程 1.建立連接 2.接收請求 3.處理請求 4.訪問資源 服務器獲取請求報文中請求的資源web服務器,即存放了web資源的服務器,負責向請求者提供對方請求的靜態資源,或動態運行后生成的資源 靜態資源:不需要…

C語言 內聯函數 + 遞歸函數

函數分類 內聯函數 1)內聯函數在編譯時將函數的代碼直接插入到調用它的地方,而不是通過函數調用的方式執行,從而減少了函數調用的開銷,提高了代碼的執行速度 2)使用 inline 關鍵字來聲明 3)將函數聲明為內聯…

小目標檢測模型設計的一點思考

1. 小目標的特性 目標之間的交疊概率比較低,即使有交疊,其IoU多數情況下也是比較小的 AI-TOD Tiny Person Dateset 小目標自身的紋理顯著度有強弱區別,但是總體來說紋理特征都較弱,很多時候需要借助一定的圖像上下文來幫助確認 …

Java解決島嶼周長問題

Java解決島嶼周長問題 01 題目 給定一個 row x col 的二維網格地圖 grid ,其中:grid[i][j] 1 表示陸地, grid[i][j] 0 表示水域。 網格中的格子 水平和垂直 方向相連(對角線方向不相連)。整個網格被水完全包圍&am…

ssm校園論壇管理系統項目分享

校園論壇管理系統是基于java編程語言,mysql數據庫,ssm框架和idea工具開發,本系統主要分為學生用戶,管理員兩個角色,其中用戶可以注冊登陸系統,在線發帖,查看欄目帖子,回復帖子&#…

某音上很火的圣誕樹分享

前些天發現了一個巨牛的人工智能學習網站&#xff0c;通俗易懂&#xff0c;風趣幽默&#xff0c;忍不住分享一下給大家。點擊跳轉到網站。 效果截圖&#xff08;這里不給動態了&#xff0c;某音到處都是了&#xff09;&#xff1a; 源代碼&#xff1a; <script src"…

Spring Boot 3 集成 MyBatis詳解

MyBatis是一款開源的持久層框架&#xff0c;它極大地簡化了與數據庫的交互流程。與類似Hibernate的ORM框架不同&#xff0c;MyBatis更具靈活性&#xff0c;允許開發者直接使用SQL語句與數據庫進行交互。Spring Boot和MyBatis分別是兩個功能強大的框架&#xff0c;它們的協同使用…

Linux shell編程學習筆記34:eval 命令

0 前言 在JavaScript語言中&#xff0c;有一個很特別的函數eval&#xff0c;eval函數可以將字符串當做 JavaScript 代碼執行&#xff0c;返回表達式或值。 在Linux Shell 中也提供了內建命令eval&#xff0c;它是否具有JavaScript語言中eval函數的功能呢&#xff1f; 1 eval命…

GPIO的使用--USART串口通信--傳感器控制數據

目錄 一、串口通信 1、概念 2、原理圖 3、使用步驟 &#xff08;1&#xff09;尋找串口位置 &#xff08;2&#xff09;確定引腳編號 &#xff08;3&#xff09;編寫代碼 4、實驗結果 實驗代碼 main.c usart.c usart.h 一、串口通信 1、概念 串行接口是一種可以將…

DiffiT

本文首發于AIWalker&#xff0c;歡迎關注。 https://arxiv.org/abs/2312.02139 https://github.com/NVlabs/DiffiT 擴散模型以其強大的表達能力和高樣本質量在許多領域得到了新的應用。對于樣本生成&#xff0c;這些模型依賴于通過迭代去噪生成圖像的去噪神經網絡。然而&#x…

SAP UI5 walkthrough step8 Translatable Texts

在這個章節&#xff0c;我們會將一些文本常量獨立出一個資源文件 這樣的話&#xff0c;可以方便這些文本常量被翻譯成任意的語言 這種國際化的操作&#xff0c;我們一般命名為i18n 新建一個文件i18n.properties webapp/i18n/i18n.properties (New) showHelloButtonTextSay …

vue3項目實現文檔 JSON 格式和 Excel 表格的在線預覽,(智能搜索,未驗證)

若要實現文檔 JSON 格式和 Excel 表格的在線預覽&#xff0c;你可以使用第三方庫來實現。對于文檔 JSON 格式&#xff0c;你可以使用 vue-json-pretty 庫來展示美觀的 JSON 數據&#xff1b;對于 Excel 表格&#xff0c;你可以使用 vue-excel-viewer 庫來完成在線預覽。下面是一…

Java、Spring Boot和事務管理

引言 在現代應用程序開發中&#xff0c;確保數據的一致性和可靠性是至關重要的。Java作為一種強大的編程語言&#xff0c;通過其廣泛的生態系統和強大的庫支持&#xff0c;為開發人員提供了構建高性能應用程序的豐富工具。Spring Boot是一個基于Spring框架的項目&#xff0c;它…

圖像的均方差和信噪比計算

圖像的均方差和信噪比計算 一、均方差1、公式2、代碼 二、信噪比1、公式2、代碼 圖像的均方差和信噪比公式及代碼&#xff0c;代碼基于opencv和C實現。 一、均方差 均方誤差&#xff0c;英文簡稱&#xff1a;MSE&#xff0c;英文全稱&#xff1a;“Mean Square Error”。 衡量…

接口測試-Jmeter使用

一、線程組 1.1 作用 線程組就是控制Jmeter用于執行測試的一組用戶 1.2 位置 右鍵點擊‘測試計劃’-->添加-->線程(用戶)-->線程組 1.3 特點 模擬多人操作線程組可以添加多個&#xff0c;多個線程組可以并行或者串行取樣器(請求)和邏輯控制器必須依賴線程組才能…

「Verilog學習筆記」多bit MUX同步器

專欄前言 本專欄的內容主要是記錄本人學習Verilog過程中的一些知識點&#xff0c;刷題網站用的是牛客網 輸入數據暫存在data_reg中&#xff0c;使能信號data_en用打兩拍的方式跨時鐘域傳輸到時鐘域B&#xff0c;最后data_out根據使能信號更新數據。data_en信號在A時鐘域用一個D…

Redis | Redis入門學習介紹及常見原理剖析

關注wx&#xff1a;CodingTechWork Redis介紹 概述 Redis是NoSQL&#xff0c;是key-value分布式內存數據庫。 緩存 緩存是將數據從慢的介質換到快的介質上&#xff0c;提高讀寫效率和性能&#xff0c;并降低數據庫的讀寫成本。內存的速度一般都遠遠大于硬盤的速度&#xf…

三個臭皮匠(ctr,nerdctl,crictl)頂一個諸葛亮(docker)

文章目錄 containerd簡介 nerdctl簡介安裝精簡 Minimal 安裝完整Full 安裝啟動服務 命令參數容器運行容器列出容器詳情容器日志容器進入容器停止容器刪除鏡像列表鏡像拉取鏡像標簽鏡像導出鏡像導入鏡像刪除鏡像構建配置tab鍵配置加速配置倉庫http方式https方式 ctr簡介命令參數…

12、虛函數的應用、虛析構函數

12、虛函數的應用、虛析構函數 運行時類型信息(RTTI)動態類型轉換(dynamic_cast)typeid操作符 虛 析構函數空虛析構函數 一個類中&#xff0c;除了構造函數和靜態成員函數外&#xff0c;任何函數都可以被聲明為虛函數 運行時類型信息(RTTI) 動態類型轉換(dynamic_cast) 用于…

AMC8美國數學競賽歷年真題集在線練習操作指南和2024年備考建議

今天是2023年12月10日&#xff0c;距離2024年的AMC8美國數學競賽的舉辦還有40天時間。據六分成長了解&#xff0c;有一些孩子報名參加了AMC8的機構培訓班系統學習&#xff0c;也有一些孩子選擇了自己自學備考。 有家長問AMC8的培訓是否一定要參加機構的培訓班學習&#xff1f;…