【63 Pandas+Pyecharts | 泡泡瑪特微博熱搜評論數據分析可視化】

文章目錄

  • 🏳??🌈 1. 導入模塊
  • 🏳??🌈 2. Pandas數據處理
    • 2.1 讀取數據
    • 2.2 數據信息
    • 2.3 數據去重
    • 2.4 數據去空
    • 2.5 時間處理
    • 2.6 性別處理
    • 2.7 評論內容處理
  • 🏳??🌈 3. Pyecharts數據可視化
    • 3.1 用戶評論IP分布
    • 3.2 話題點贊熱度趨勢
    • 3.3 話題評論熱度趨勢
    • 3.4 各個時間段評論數量
    • 3.5 評論點贊量分布
    • 3.6 輿論情感分布
    • 3.7 用戶性別占比
    • 3.8 用戶性別占比
  • 🏳??🌈 4. 可視化項目源碼+數據

大家好,我是 👉 【Python當打之年(點擊跳轉)】

本期我們利用Python分析「微博泡泡瑪特熱搜評論數據集」,看看:各用戶評論IP地圖分布、話題點贊熱度趨勢、話題評論熱度趨勢、各個時間段評論數量、輿論情感分布、用戶性別占比、評論內容詞云等等,希望對大家有所幫助,如有疑問或者需要改進的地方可以聯系小編。

在這里插入圖片描述

涉及到的庫:

  • Pandas— 數據處理
  • Pyecharts— 數據可視化

🏳??🌈 1. 導入模塊

import jieba
import pandas as pd
from snownlp import SnowNLP
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')

🏳??🌈 2. Pandas數據處理

2.1 讀取數據

df = pd.read_excel('微博泡泡瑪特數據.xlsx')

在這里插入圖片描述

2.2 數據信息

df.info()

在這里插入圖片描述

2.3 數據去重

df1 = df.drop_duplicates()

2.4 數據去空

df1 = df1.dropna()

2.5 時間處理

df1['發布時間_s'] = df1['時間'].str[:10]
df1['時間_d'] = pd.to_datetime(df1['時間']).dt.day
df1['時間_h'] = pd.to_datetime(df1['時間']).dt.hour

2.6 性別處理

df1['性別'] = df1['性別'].replace({'f':'女性','m':'男性'})

2.7 評論內容處理

score = []
for comm in comments:s = SnowNLP(comm)score.append(round(s.sentiments,4))
df1['情感評分'] = score
df1['情感評分區間'] = pd.cut(df1['情感評分'],bins=[0,0.3,0.7,1],labels=['消極','中性','積極'])

在這里插入圖片描述

🏳??🌈 3. Pyecharts數據可視化

3.1 用戶評論IP分布

def get_chart():chart = (Map().add('', data, 'china').set_global_opts(title_opts=opts.TitleOpts(title='1-用戶評論IP分布',subtitle=subtitle,pos_top='2%',pos_left='center',title_textstyle_opts=opts.TextStyleOpts(font_size=20)),visualmap_opts=opts.VisualMapOpts(is_show=True,pos_left='15%',pos_bottom='10%',range_color=range_color),legend_opts=opts.LegendOpts(is_show=False)))

在這里插入圖片描述

  • 東部地區評論數量要明顯高于中西部地區,沿海地區更為明顯,也從側面反映了當地的經濟情況。

3.2 話題點贊熱度趨勢

在這里插入圖片描述

  • 話題熱度在06-08當天最高,后續持續下降,符合一般的輿情趨勢。

3.3 話題評論熱度趨勢

def get_chart():chart = (Line().add_xaxis(x_data).add_yaxis('', y_data).set_colors(range_color[1]).set_global_opts(title_opts=opts.TitleOpts(title='3-話題評論熱度趨勢',subtitle=subtitle,pos_top='2%',pos_left='center',title_textstyle_opts=opts.TextStyleOpts(font_size=20)),legend_opts=opts.LegendOpts(is_show=False)))

在這里插入圖片描述

3.4 各個時間段評論數量

在這里插入圖片描述

  • 從評論時間上來看,在晚上的19:00-21:00期間評論量達到頂峰,其他時間較平緩,在早上的07:00-09:00出現次高峰,這個時間也是上班高峰時間。

3.5 評論點贊量分布

def get_chart():chart = (Scatter().add_xaxis(x_data).add_yaxis('', y_data,label_opts=opts.LabelOpts(is_show=False)).set_global_opts(title_opts=opts.TitleOpts(title='5-評論點贊量分布',subtitle=subtitle,pos_top='2%',pos_left='center',title_textstyle_opts=opts.TextStyleOpts(font_size=20)),visualmap_opts=opts.VisualMapOpts(is_show=False,range_color=range_color),legend_opts=opts.LegendOpts(is_show=False)))

在這里插入圖片描述

3.6 輿論情感分布

在這里插入圖片描述

  • 輿情方面在,大眾的積極情緒占比還是最多的,但是和中性情緒相差不是很明顯,說明正向反向輿情存在一定波動。

3.7 用戶性別占比

def get_chart():chart = (Pie().add('',datas,center=['50%', '50%'],).set_global_opts(title_opts=opts.TitleOpts(title='7-用戶性別占比',subtitle=subtitle,pos_top='2%',pos_left='center',title_textstyle_opts=opts.TextStyleOpts(font_size=20)),legend_opts=opts.LegendOpts(is_show=True,pos_top='12%')))

在這里插入圖片描述

  • 用戶性別占比,男女基本持平,說明此輿情和性別關系不大。

3.8 用戶性別占比

def get_chart():chart = (WordCloud().add('', words, word_size_range=[20, 50]).set_global_opts(title_opts=opts.TitleOpts(title='8-評論內容詞云',pos_top='2%', pos_left='center',title_textstyle_opts=opts.TextStyleOpts(font_size=20)),visualmap_opts=opts.VisualMapOpts(is_show=False,range_color=range_color),))

在這里插入圖片描述

🏳??🌈 4. 可視化項目源碼+數據

點擊跳轉:【全部可視化項目源碼+數據】


以上就是本期為大家整理的全部內容了,趕快練習起來吧,原創不易,喜歡的朋友可以點贊、收藏也可以分享注明出處)讓更多人知道。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/909891.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/909891.shtml
英文地址,請注明出處:http://en.pswp.cn/news/909891.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python-最長無重復子數組

最長無重復子數組 描述代碼實現 描述 給定一個長度為n的數組arr,返回arr的最長無重復元素子數組的長度,無重復指的是所有數字都不相同。 子數組是連續的,比如[1,3,5,7,9]的子數組有[1,3],[3,5,7]等等,但是[1,3,7]不是…

探索 MySQL 緩存機制:提升數據庫讀取性能的有效策略

在現代應用中,數據庫的讀取性能是影響用戶體驗和系統響應速度的關鍵因素。當應用程序面臨高并發讀請求時,直接訪問磁盤的開銷會成為瓶頸。為了應對這一挑戰,MySQL 引入了多種緩存機制,旨在減少磁盤 I/O,加快數據檢索速度。 理解并合理利用這些緩存機制,是提升 MySQL 數據…

深度學習-164-MCP技術之開發本地MCP服務器和異步客戶端

文章目錄 1 概念1.1 MCP1.2 準備數據接口2 開發MCP服務器2.1 server.py2.1.1 @mcp.resource2.1.2 @mcp.tool()2.1.3 @mcp.prompt()2.2 調試模式啟動mcp-server2.2.1 資源2.2.2 工具2.2.3 提示詞3 開發MCP客戶端3.1 調用工具client_tool3.2 獲取提示client_prompt3.3 讀取資源cl…

第八十一篇 大數據開發基礎:隊列數據結構詳解與實戰應用(附生活化案例)

在大數據開發的龐大體系中,隊列(Queue) 作為基礎數據結構之一,其重要性不言而喻。它不僅是構建高效數據管道的核心組件,更是實現異步處理、流量削峰、任務調度的關鍵技術。本文將深入解析隊列的原理,結合生…

linux操作命令(最常用)

一、文件與目錄操作 命令作用常用參數示例ls列出目錄內容ls -l(詳細列表) ls -a(顯示隱藏文件)cd切換目錄cd ~(回家目錄) cd ..(返回上級)pwd顯示當前路徑-cp復制文件/目錄cp -r di…

22.react和next.js、SSR與CSR的比較

SSR 和 CSR 的區別 🔸 示例說明 SSR 流程(Next.js 支持): 1. 用戶請求頁面 2. 服務端生成 HTML(含內容) 3. 瀏覽器收到渲染好的頁面 // SSR 頁面(默認行為) - app/page.tsx export…

全棧加速:FrankenPHP 架構原理與實戰案例

在當今云原生與微服務大行其道的時代,PHP 應用面臨著「冷啟動延遲高」「進程管理復雜」「性能瓶頸難以突破」等痛點。 FrankenPHP 正是為了解決這些問題而生:它將 Caddy 服務器與 PHP 運行時深度融合,內嵌 Let’s Encrypt 自動 HTTPS、支持 …

Android開發中的適配

目錄 一:分辨率適配 1.1概念 1.2關鍵策略 二:多尺寸適配 2.1概念 2.2關鍵策略 三:多平臺多版本適配 3.1Android系統版本迭代 3.2 關鍵策略 Android開發中的屏幕適配與多版本適配 在Android開發中,屏幕適配和多版本適配是確保應用在各種設備上都能良好運行和顯示的關鍵。這不…

【MySQL基礎篇】MySQL中的算術運算符和比較運算符

精選專欄鏈接 🔗 MySQL技術筆記專欄Redis技術筆記專欄大模型搭建專欄Python學習筆記專欄深度學習算法專欄 歡迎訂閱,點贊+關注,每日精進1%,共攀技術高峰 更多內容持續更新中!希望能給大家帶來幫助~ &…

FFmpeg推流實戰30秒速成

FFmpeg windows 7.1.1下載地址 FFmpeg 推流方法 FFmpeg 是一個強大的多媒體處理工具,支持將視頻和音頻推流到各種流媒體服務器(如 RTMP、RTSP、HLS 等)。以下是幾種常見的推流方法。 推流到 RTMP 服務器 RTMP(Real-Time Messa…

74HC595功能介紹及代碼驅動

一、引腳描述 QA~QH(15,1~7腳):數據輸出引腳 QH1(9腳):移位寄存器串行數據輸出腳,當移位寄存器中的數據多余8位時,最先進入的那位被擠出去,一般級聯使用,接下一個74HC595 G(13腳):輸出使能引腳,低電平使能 RCK(12腳):存儲寄存器輸入數據使能引腳,上升沿時…

AntV G 入門教程

下面是 AntV?G(以下簡稱 G)的中文入門與核心 API 教程,涵蓋從畫布創建、圖形繪制到事件與動畫等常用方法,每個 API 均附帶完整示例代碼。示例引用自官方“Getting Started”指南 ([g.antv.antgroup.com][1])。 一、安裝與引入 #…

短視頻矩陣什么意思?

短視頻矩陣是指通過布局多個短視頻賬號,形成協同運營的賬號體系,以實現流量聚合、品牌曝光或商業變現的策略。其核心邏輯是利用不同賬號的定位、內容風格或受眾群體,構建互補的流量網絡,而非單一賬號的獨立運營。 核心特點與作用&…

Linux 日志查看和分析

Linux 日志是系統運行狀態的重要記錄,包含了系統啟動、服務運行、用戶操作、安全事件等關鍵信息,對于故障排查、安全審計和系統維護至關重要。 故障排查:定位系統崩潰、服務異常的根本原因(如服務啟動失敗、硬件故障)…

一篇文章快速學會HTML

一篇文章快速學會HTML 注:適合有一定編程基礎的來快速掌握HTML 超文本標記語言 超文本:文本,聲音,圖片,視頻,表格,鏈接 標記:許多的標簽組成 HTML頁面是運行到瀏覽器上的 HTML…

智能混合檢索DeepSearch

智能混合檢索 DeepSearch 是一款自主研發的大規模分布式搜索引擎,提供一站式智能搜索解決方案。系統內置多種行業專屬的查詢語義理解能力,融合語義 ORC 模型、文本向量模型、圖像/視頻向量模型、大語言模型(LLM)、分詞器以及機器學…

【Docker基礎】Docker鏡像管理:docker tag詳解

目錄 1 Docker鏡像標簽基礎概念 1.1 什么是Docker鏡像標簽 1.2 鏡像標識的三要素 2 docker tag命令詳解 2.1 命令基本語法 2.2 命令工作原理 2.3 常用操作示例 3 標簽管理的實踐示例 3.1 標簽命名規范 3.2 多標簽策略 3.3 latest標簽的合理使用 4 標簽與鏡像倉庫的…

AI時代個人IP的重塑與機遇 | 創客匠人

2025年作為AI應用爆發元年,正悄然改寫個人IP的打造邏輯。AI不會取代IP,卻會淘汰不懂得與AI共生的創作者。 AI重構IP運營的三大機遇 內容生產效率提升:傳統模式下需2-3天打磨的深度文章,AI輸入關鍵詞后半小時即可完成初稿&#xf…

[5-03-01].第14節:集群搭建 - 在Linux系統中搭建

SpringCloud學習大綱 三、集群環境搭建: 3.1.集群規劃 1.nacos規劃: hadoop103hadoop104hadoop105192.168.148.3192.168.148.4192.168.148.5nacosnacosnacos 2.MYSQL規劃 :192.168.148.3 3306 5.7.27

ESP32-CH3+MicroPython+INMP441 測試麥克風通過音量閾值控制小燈

測試功能描述: 程序會先測量 2 秒環境音量作為基準,然后開始實時顯示音量柱狀圖,并在 30 秒后自動結束,當檢測到音量超過閾值時會顯示提示并打開led燈 一,硬件準備: 1.ESP32 CH3 USB開發板1塊 2.INMP44…