【45 Pandas+Pyecharts | 去哪兒海南旅游攻略數據分析可視化】

文章目錄

  • 🏳??🌈 1. 導入模塊
  • 🏳??🌈 2. Pandas數據處理
    • 2.1 讀取數據
    • 2.2 查看數據信息
    • 2.3 日期處理,提取年份、月份
    • 2.4 經費處理
    • 2.5 天數處理
  • 🏳??🌈 3. Pyecharts數據可視化
    • 3.1 出發日期_年份分布
    • 3.2 出發日期_月份分布
    • 3.3 出行天數分布
    • 3.4 旅游途經點分布
    • 3.5 出行團體占比
    • 3.6 人均消費區間占比
    • 3.7 出行類型標簽統計
    • 3.8 旅游行程景點詞云
  • 🏳??🌈 4. 可視化項目源碼+數據

大家好,我是 👉【Python當打之年(點擊跳轉)】

本期利用 python 分析一下「去哪網海南旅游攻略數據」 ,看看海南哪些旅游景點最受大家喜愛,哪個時間段旅游的朋友比較多,最受大家歡迎的旅行方式有哪些,以及旅行目的 等,希望對大家有所幫助,如有疑問或者需要改進的地方可以聯系小編。

涉及到的庫:

  • Pandas — 數據處理
  • Pyecharts — 數據可視化

🏳??🌈 1. 導入模塊

import pandas as pd
from pyecharts.charts import Line
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts.charts import Scatter
from pyecharts.charts import WordCloud
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')

🏳??🌈 2. Pandas數據處理

2.1 讀取數據

df = pd.read_excel("./去哪網海南攻略數據.xlsx")

在這里插入圖片描述

2.2 查看數據信息

df.info()

在這里插入圖片描述

2.3 日期處理,提取年份、月份

df['出發日期_年'] = [int(i.split('-')[0]) for i in df['出發日期'].tolist()]
df['出發日期_月'] = [int(i.split('-')[1]) for i in df['出發日期'].tolist()]

在這里插入圖片描述

2.4 經費處理

fee = [int(i.replace('人均','').replace('元','')) for i in df_fee['人均消費'].tolist()]
df_fee['人均消費'] = fee

在這里插入圖片描述

2.5 天數處理

df['天數'] = df['天數'].str[1:-1]
df['天數'] = df['天數'].astype('int')

在這里插入圖片描述

🏳??🌈 3. Pyecharts數據可視化

3.1 出發日期_年份分布

def get_chart1():chart = (Bar().add_xaxis(x_data).add_yaxis("", y_data).set_global_opts(title_opts=opts.TitleOpts(title="1-出發日期_年",pos_top='2%',pos_left="center",),legend_opts=opts.LegendOpts(is_show=False),xaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=False)),yaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=False)),visualmap_opts=opts.VisualMapOpts(is_show=False,),))return chart

在這里插入圖片描述

  • 2014、2015、2016年的攻略數量相較于其他年份明顯較多、2017-2021年趨于平穩。

  • 近三年時間大概由于時間比較近,加之疫情原因,所以攻略數量較少。

3.2 出發日期_月份分布

def get_chart2():chart = (Line().add_xaxis(x_data).add_yaxis("", y_data).set_global_opts(title_opts=opts.TitleOpts(title="2-每月攻略數量",pos_top='2%',pos_left="center",),visualmap_opts=opts.VisualMapOpts(is_show=False),legend_opts=opts.LegendOpts(is_show=False),))return chart

在這里插入圖片描述

  • 1月、12月的攻略數比較高,大概占到了總數量的20%,反而6月、7月、8月的數量相對低一些。

3.3 出行天數分布

在這里插入圖片描述

  • 從出行天數上來看,大多集中在一周(5天)左右,也有少量半個月、一個月的旅游時間。

3.4 旅游途經點分布

在這里插入圖片描述

  • 首當其沖當然是三亞(1853)啦!遠超排在第二的海口(182),基本是10倍之多,緊隨其后的是陵水(108)、萬寧(60)、文昌(46)等地。

3.5 出行團體占比

def get_chart3():chart = (Pie().add("", [list(z) for z in zip(x_data, y_data)]).set_global_opts(title_opts=opts.TitleOpts(title="5-出行團體占比",pos_top='2%',pos_left="center"),legend_opts=opts.LegendOpts(is_show=False),visualmap_opts=opts.VisualMapOpts(is_show=False,),).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%")))return chart

  • 出行團體方面大多以好友(22%)、情侶(21%)和家庭(20%)團體居多。

3.6 人均消費區間占比

在這里插入圖片描述

  • 人均消費3000-5000元居多,占比46%,1000-3000元占比28%。

3.7 出行類型標簽統計

在這里插入圖片描述

3.8 旅游行程景點詞云

def get_chart4():chart = (WordCloud().add("",words,word_size_range=[10,50]).set_global_opts(title_opts=opts.TitleOpts(title='8-旅游行程景點詞云',pos_top='2%',pos_left="center",),legend_opts=opts.LegendOpts(is_show=False),visualmap_opts=opts.VisualMapOpts(is_show=False),))return chart

在這里插入圖片描述

  • 亞龍灣、三亞灣、蜈支洲島、大東海、天涯海角、海棠灣等景點更受驢友的喜愛。

🏳??🌈 4. 可視化項目源碼+數據

點擊跳轉:【全部可視化項目源碼+數據】


以上就是本期為大家整理的全部內容了,趕快練習起來吧,原創不易,喜歡的朋友可以點贊、收藏也可以分享注明出處)讓更多人知道。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/43601.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/43601.shtml
英文地址,請注明出處:http://en.pswp.cn/web/43601.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

華南師范大學“大學生校外實踐教學基地”授牌儀式暨見習參觀活動圓滿結束

為促進校企合作的深入發展,培育出具有實際應用技能的人才,7月9日,華南師范大學數學科學院與廣東泰迪智能科技股份有限公司聯合開展“大學生校外實踐教學基地”授牌儀式暨見習參觀活動。華南師范大學數學科學院數據科學系主任陳艷男、副主任陳…

深入理解model.eval()與torch.no_grad()

model.eval() 使用model.eval()切換到測試模式,不會更新模型的w(權重),b(偏置)參數通知dropout層和batchnorm層在train和val中間進行切換: 在train模式,dropout層會按照設定的參數p…

Idea 2023 使用GitLab提交代碼提示輸入Token

項目場景: 今天電腦換硬盤了,安裝了 IDEA2023 款的社區版開發工具,下載代碼后,提交并推送代碼到遠程服務器的時候,提示輸入Token,并不是用戶名和密碼。 問題描述 推送代碼到遠程GitLab本地倉庫的時候&…

單鏈表--續(C語言詳細版)

2.6 在指定位置之前插入數據 // 在指定位置之前插入數據 void SLTInsert(SLTNode** pphead, SLTNode* pos, SLTDataType x); 分為兩種情況:1. 插入的數據在鏈表中間;2. 插入的數據在鏈表的前面。 // 在指定位置之前插入數據 void SLTInsert(SLTNode** …

AI繪畫何以突飛猛進? 從歷史到技術突破, 一文讀懂火爆的AI繪畫發展史

前言 自從前段時間偶然間被當下AI繪畫的水平震住之后(超越一切的AI作畫神器,和它創作的234個盔甲美女未來戰士) ,作者深感當今AI繪畫的飛速進展或許已遠超所有人的預期。 而這里的前因后果,包括AI繪畫的歷史&#xff…

十九.升職加薪系列-JVM優化-解決JVM性能瓶頸的JIT即時編譯器

前言 在很多年以前,做C或者C的程序員經常說Java語言的運行速度不如C或C,Java運行速度慢主要是因為它是解釋執行的,而C或C是編譯執行的,解釋執行需要通過JVM虛擬機將字節碼實時翻譯成機器碼(邊翻譯邊執行)&…

Rust 版本升級:rustup update stable 報錯

Rust 版本升級 rustup update stable 報錯 一、報錯內容 error: could not download file from ‘https://static.rust-lang.org/dist/channel-rust-stable.toml.sha256’ to ‘/Users/xxx/.rustup/tmp/rv6vdfu3eupwo64m_file’: failed to make network request: error sendi…

【實戰場景】@Transactional中使用for update的注意點

【實戰場景】Transactional中使用for update的注意點 開篇詞:干貨篇:知識回顧注意點1.鎖的范圍和粒度:2.事務的隔離級別:3.死鎖:4.性能影響:5.事務的邊界:6.異常處理:7. 數據庫和存儲…

【漏洞復現】網神 SecGate 3600 防火墻 sys_export_conf_local_save 任意文件讀取

免責聲明: 本文內容旨在提供有關特定漏洞或安全漏洞的信息,以幫助用戶更好地了解可能存在的風險。公布此類信息的目的在于促進網絡安全意識和技術進步,并非出于任何惡意目的。閱讀者應該明白,在利用本文提到的漏洞信息或進行相關測…

javaweb學習day5--《HTML篇》Springboot的模塊創建、HTML的相關知識點詳解

一、前言 從今天開始,就要啟動后端的學習了,Springboot會貫穿到底,一定要跟著小編嚴謹的去搭建Springboot環境,依賴添加的過程可能需要2分鐘左右,讀者們要耐心等待一下,搭建好Springboot之后才算正式的開始…

算力革命:彈性租賃,解鎖無限可能

華為創始人任正非曾在一場程序設計競賽中說道,我們即將進入第四次工業革命,基礎就是大算力。事實上,隨著5G、人工智能等信息技術的迅猛發展,算力需求持續增長,但高昂的成本和快速的技術迭代讓許多中小企業和個人開發者…

Covalent Network(CXT)通過社區投票將代幣遷移并更名為 CXT,以推動人工智能更深層次的創新

專注于人工智能和 Web3 的模塊化數據基礎設施 Covalent Network(CXT)宣布,其治理提案已通過社區投票并順利實施,即將原生代幣 CQT 遷移為新的 CXT 代幣,并部署至新的合約。這一關鍵性轉變標志著 Covalent Network&…

git刪除提交記錄,并使用idea將代碼重新提交到gitee倉庫

git 新建分支將之前的記錄刪除重新提交 轉載鏈接 https://blog.csdn.net/qq_37142541/article/details/139860956

03-NoSQL之Redis配置與優化

一、redis與memcache總體對比 1.性能 Redis:只使用單核,平均每一個核上Redis在存儲小數據時比Memcached性能更高。 Memcached:可以使用多核,而在100k以上的數據中,Memcached性能要高于Redis。 2.內存使用效率 MemC…

springboot文達辦公物資管理系統-計算機畢業設計源碼51191

摘要 本文介紹了一種名為"文達辦公物資管理系統"的基于JAVA語言、基于Springboot框架和MYSQL數據庫開發的管理系統。該系統主要分為管理員和員工用戶兩個角色,以滿足不同用戶的需求。 對于管理員用戶,系統提供了儀器設備管理、設備借用管理、設…

【大數據技術】換新電腦了,如何快速遷移MySQL到新電腦上(含程序+數據),這樣既快速又高效,省去了“各種安裝+各種配置+各種遷移數據”帶來的麻煩和時間

【大數據技術】換新電腦了,如何快速遷移MySQL到新電腦上(含程序數據 背景步驟總結 背景 很久沒有寫博文了哦,最近我換了新的筆記本,于是需要在新筆記本電腦上搭建MySQL環境,因為我原電腦上是安裝的MySQL解壓版,故我想偷偷懶&…

可理解性評估:使用Google Gemini優化語音識別的意義保留

每周跟蹤AI熱點新聞動向和震撼發展 想要探索生成式人工智能的前沿進展嗎?訂閱我們的簡報,深入解析最新的技術突破、實際應用案例和未來的趨勢。與全球數同行一同,從行業內部的深度分析和實用指南中受益。不要錯過這個機會,成為AI領…

nftables(5)表達式(3)PAYLOAD EXPRESSIONS

PAYLOAD EXPRESSIONS Payload expressions在nftables中扮演著重要的角色,因為它們允許用戶定義復雜的規則,這些規則可以基于數據包的內容(即有效載荷)來過濾、修改或允許數據包通過。這些表達式可以執行諸如數據拷貝、比較、位操…

實驗1 —— 安全策略的練習

實驗拓撲圖 實驗要求 1.DMZ區內的服務器,辦公區僅能在辦公時間內(9:00-18:00)可以訪問,生產區的設備全天可以訪問; 2.生產區不允許訪問互聯網,辦公區和游客區允許訪問互聯網 3.辦公區…

RabbitMQ保證消息被成功發送和消費

一 : 在使用 RabbitMQ 作為消息隊列時,保證消息被成功發送和消費是一個非常重要的問題。以下是一些關鍵點和最佳實踐,以確保消息的可靠傳輸和處理。* 配置方式: 保證消息被成功發送 確認模式(Confirm Mode):生產者可以…