【爬蟲】網易云音樂評論數據爬取

文章目錄

🍖 前言
🎶一、抓取要求
?二、代碼展示
🏀三、運行結果
🏆四、知識點提示

🍖 前言

【爬蟲】網易云音樂歌詞/評論數據爬取

🎶一、抓取要求

描述:
輸入歌曲的id，獲取對應歌曲的用戶評論信息

?二、代碼展示

代碼如下：

from collections import OrderedDict
import requests as rq
import logging
import subprocess
import relogging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - 網易音樂歌詞Spider - %(message)s')# url記得脫密
url = 'aHR0cHM6Ly9tdXNpYy4xNjMuY29tL3dlYXBpL2NvbW1lbnQvcmVzb3VyY2UvY29tbWVudHMvZ2V0' headers = OrderedDict()
headers['user-agent'] = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Safari/537.36 Edg/134.0.0.0"data = {"params": "","encSecKey": ""
}time_ = ''
for page in range(1, 10):print(['node', './js/comment.js', "2689097846", str(time_), str(page)])result = subprocess.run(['node', './js/comment.js', "2689097846", time_, str(page)], encoding='utf-8', capture_output=True, text=True, check=True)# 獲取腳本的輸出結果output = result.stdoutpattern = re.compile(r"encText.*?'(.*?)'.*?encSecKey.*?'(.*?)'", re.S)result = re.findall(pattern, output)data['params'] = result[0][0]data['encSecKey'] = result[0][1]res = rq.post(url, headers=headers, data=data, verify=False)logging.info("歌詞獲取成功：：：")# logging.info(res.json()['data']['comments'])for item in res.json()['data']['comments']:logging.info("評論用戶：：：" + item['user']['nickname'] + "  評論時間：：：" + item['timeStr'] + "    評論內容：：："+item['content'])time_ = str(res.json()['data']['comments'][-1]['time'])

🏀三、運行結果

控制臺輸出展示:
![在這里插入圖片描述](https://i-blog.csdnimg.cn/blog_migrate/8a774bf5ae5d69b7dce87bcd13b9c88f.png)

🏆四、知識點提示

知識點1：

關鍵詞:扣代碼/補環境
需要源碼的留言，球球：二三六九四三三零八四
本文章中所有內容僅供學習交流使用，不用于其他任何目的，不提供完整代碼，抓包內容、敏感網址、數據接口等均已做脫敏處理，嚴禁用于商業用途和非法用途，否則由此產生的一切后果均與作者無關！本文章未經許可禁止轉載，禁止任何修改后二次傳播，擅自使用本文講解的技術而導致的任何意外，作者均不負責，若有侵權，請聯系作者立即刪除！！！

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/900372.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/900372.shtml
英文地址，請注明出處：http://en.pswp.cn/news/900372.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！