不用寫代碼,批量下載今日頭條文章導出excel和pdf

前幾天有人問我怎么批量抓取今日頭條某個號的所有文章數據,需要文章鏈接,標題和時間,但是不會寫代碼,于是我寫了個簡單的教程

圖片

這里以渤海小吏為例?

圖片

首先用edge瀏覽器安裝web-scraper瀏覽器擴展

圖片

然后打開瀏覽器控制臺,找到web-scraper, import sitemap,復制以下代碼:

 

圖片

點擊scrape開始抓取 。

圖片

導出excel效果如圖,包含文章鏈接,文章標題,文章閱讀數,文章評論數,文章發布時間,效果見網盤?https://pan.quark.cn/s/949ca3387267

圖片

如果要抓取其他號的文章,修改edit metadata里的鏈接,你學會了嗎?

圖片

后續可以將所有文章下載合并成一個pdf文件,大小97MB,左側是文章目錄,點擊可跳轉到對應文章,效果見網盤?https://pan.quark.cn/s/949ca3387267

圖片

圖片

圖片

當然web-scraper也支持抓取其他網站的數據,掌握點網頁知識就可以。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/71358.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/71358.shtml
英文地址,請注明出處:http://en.pswp.cn/web/71358.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Starrocks 寫入報錯 primary key memory usage exceeds the limit

背景 本文基于 StarRocks 3.3.5 單個Starrocks BE配置是 16CU 32GB 在Flink Yaml CDC 任務往 Starrocks寫數據的過程中,突然遇到了primary key memory usage exceeds the limit 問題,具體如下: java.lang.RuntimeException: com.starrocks.…

Django:文件上傳時報錯in a frame because it set ‘X-Frame-Options‘ to ‘deny‘.

即:使用Content-Security-Policy 1.安裝Django CSP中間件: pip install django-csp 2.更改項目配置: # settings.py MIDDLEWARE [...csp.middleware.CSPMiddleware,... ]CSP_DEFAULT_SRC ("self",) CSP_FRAME_ANCESTORS (&q…

利用Adobe Acrobat 實現PPT中圖片分辨率的提升

1. 下載適用于 Windows 的 64 位 Acrobat 注冊方式參考:https://ca.whu.edu.cn/knowledge.html?type1 2. 將ppt中需要提高分辨率的圖片復制粘貼到新建的pptx問價中,然后執行“文件—>導出---->創建PDF、XPS文檔” 3. 我們會發現保存下來的distrib…

【Python爬蟲】爬取公共交通路網數據

程序來自于Github,以下這篇博客作為完整的學習記錄,也callback上一篇爬取公共交通站點的博文。 Bardbo/get_bus_lines_and_stations_data_from_gaode: 這個項目是基于高德開放平臺和公交網獲取公交線路及站點數據,并生成shp文件,…

Stable Diffusion模型高清算法模型類詳解

Stable Diffusion模型高清算法模型類詳細對比表 模型名稱核心原理適用場景參數建議顯存消耗細節增強度優缺點4x-UltraSharp殘差密集塊(RDB)結構優化紋理生成真實人像/建筑攝影重繪幅度0.3-0.4,分塊尺寸768px★★★★★☆皮膚紋理細膩,但高對比場景易出現…

VUE_使用Vite構建vue項目

創建項目 // 安裝vite npm install vite// 創建名為vite-app的項目 npm create vite vite-app --template vue// 到項目目錄 cd vite-app// 安裝依賴 npm install// 運行項目 npm run dev// 打包 npm run build// 打包預覽 npm run serve 增加路由 // 安裝路由 npm add vue-r…

ctf網絡安全賽題

CTF簡介 CTF(Capture The Flag)中文一般譯作奪旗賽,在網絡安全領域中指的是網絡安全技術人員之間進行技術競技的一種比賽形式。CTF起源于1996年DEFCON全球黑客大會,以代替之前黑客們通過互相發起真實攻擊進行技術比拼的方式。發展…

【朝夕教育】《鴻蒙原生應用開發從零基礎到多實戰》004-TypeScript 中的泛型

標題詳情作者簡介愚公搬代碼頭銜華為云特約編輯,華為云云享專家,華為開發者專家,華為產品云測專家,CSDN博客專家,CSDN商業化專家,阿里云專家博主,阿里云簽約作者,騰訊云優秀博主&…

性能測試監控工具jmeter+grafana

1、什么是性能測試監控體系? 為什么要有監控體系? 原因: 1、項目-日益復雜(內部除了代碼外,還有中間件,數據庫) 2、一個系統,背后可能有多個軟/硬件組合支撐,影響性能的因…

互聯網時代如何保證數字足跡的安全,以防個人信息泄露?

用戶在網絡上所做的幾乎所有事情,包括瀏覽、社交媒體活動、搜索查詢、在線訂閱,甚至購物,都會留下一條數據線索,這些數據可用于創建用戶在線身份的詳細檔案。如果這些信息暴露,惡意行為者可能會利用它們將用戶置于各種…

C# IEquatable<T> 使用詳解

總目錄 前言 在 C# 開發中&#xff0c;IEquatable<T> 是一個泛型接口&#xff0c;用于定義類型的相等性比較邏輯。通過實現 IEquatable<T>&#xff0c;可以為自定義類型提供高效的、類型安全的相等性比較方法。本文將詳細介紹 IEquatable<T> 的使用方法、應…

web第四天

Dom操作元素 innerText、innerHTML、value(input and textarea用到) 更改屬性&#xff0c;樣式 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-wid…

LabVIEW基于IMAQ實現直線邊緣檢測

本程序基于 NI Vision Development 模塊&#xff0c;通過 IMAQ Find Straight Edges 函數&#xff0c;在指定 ROI&#xff08;感興趣區域&#xff09; 內檢測多條直線邊緣。用戶可 動態調整檢測參數 或 自定義ROI&#xff0c;實時觀察識別效果&#xff0c;適用于 高精度視覺檢測…

費曼學習法13 - 數據表格的魔法:Python Pandas DataFrame 詳解 (Pandas 基礎篇)

第二篇&#xff1a;數據表格的魔法&#xff1a;Python Pandas DataFrame 詳解 (Pandas 基礎篇) 開篇提問&#xff1a; 回憶一下&#xff0c;我們上一篇文章學習了 Pandas 的一維數據結構 Series&#xff0c;它可以看作是帶 “標簽” 的列表。 但現實世界中的數據&#xff0c;…

一周學會Flask3 Python Web開發-在模板中渲染WTForms表單視圖函數里獲取表單數據

鋒哥原創的Flask3 Python Web開發 Flask3視頻教程&#xff1a; 2025版 Flask3 Python web開發 視頻教程(無廢話版) 玩命更新中~_嗶哩嗶哩_bilibili 為了能夠在模板中渲染表單&#xff0c;我們需要把表單類實例傳入模板。首先在視圖函數里實例化表單類LoginForm&#xff0c;然…

小紅書湖倉架構的躍遷之路

作者&#xff1a;李鵬霖(丁典)&#xff0c;小紅書-研發工程師&#xff0c;StarRocks Contributor & Apache Impala Committer 本文整理自小紅書工程師在 StarRocks 年度峰會上的分享&#xff0c;介紹了小紅書自助分析平臺中&#xff0c;StarRocks 與 Iceberg 結合后&#x…

數據結構第五節:排序

1.常見的排序算法 插入排序&#xff1a;直接插入排序、希爾排序 選擇排序&#xff1a;直接選擇排序、堆排序 交換排序&#xff1a;冒泡排序、快速排序 歸并排序&#xff1a;歸并排序 排序的接口實現&#xff1a; // 1. 直接插入排序 void InsertSort(int* a, int n); // 2. 希…

BambuStudio學習筆記:FaceDetector類

面檢測器類解析 這段代碼定義了一個名為 FaceDetector 的 C 類&#xff0c;用于處理三維模型中的面檢測。以下是該類的具體說明&#xff1a; 頭文件保護 #ifndef slic3r_FaceDetector_hpp_ #define slic3r_FaceDetector_hpp_這部分代碼防止頭文件被多次包含。 命名空間聲明…

C++發展

目錄 ?編輯C 的發展總結&#xff1a;?編輯 1. C 的早期發展&#xff08;1979-1985&#xff09; 2. C 標準化過程&#xff08;1985-1998&#xff09; 3. C 標準演化&#xff08;2003-2011&#xff09; 4. C11&#xff08;2011年&#xff09; 5. C14&#xff08;2014年&a…

LeetCode 21. 合并兩個有序鏈表(Python)

將兩個升序鏈表合并為一個新的 升序 鏈表并返回。新鏈表是通過拼接給定的兩個鏈表的所有節點組成的。 輸入&#xff1a;l1 [1,2,4], l2 [1,3,4] 輸出&#xff1a;[1,1,2,3,4,4] 示例 2&#xff1a; 輸入&#xff1a;l1 [], l2 [] 輸出&#xff1a;[] 示例 3&#xff1a; 輸…