知網論文批量下載pdf格式論文,油猴腳本

任務描述

今天收到一個任務,在知網上,把一位專家所有的論文全都下載下來,要保存為PDF格式。

知網不支持批量導出PDF格式論文。一個一個下載PDF,太繁瑣了。

解決方案:找到一個油猴腳本,這個腳本可以從知網批量導出論文。

腳本安裝

首先,使用 chrome 瀏覽器安裝油猴,https://www.tampermonkey.net/。

點擊導航欄的 用戶腳本,在下面的搜索框輸入 “知網”。
在這里插入圖片描述

在這里插入圖片描述

下圖是這個腳本的介紹,最后更新日期是24年12月。該腳本支持了PDF的批量下載。
腳本地址

在這里插入圖片描述

若你下載了不需要的腳本,在這里刪除:
在這里插入圖片描述

瀏覽器的設置

批量下載論文的PDF格式的時候,會頻繁彈出窗口,所以要運行瀏覽器彈出窗口。
在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

瀏覽器更改默認下載路徑,記得后面再改回來:

這樣就可以把論文直接下載到一個文件夾里面。
在這里插入圖片描述

批量導出PDF過程

在搜索作者的時候,可能有作者會同名,要為作者選擇正確單位。

腳本安裝后,在知網的右側,會出現一個批量下載的按鈕
在這里插入圖片描述

點擊右側批量下載的按鈕之后,會彈出下述界面。

  • 獲取鏈接:捕獲知網當前界面的全部論文
  • 全選:選中全部論文
  • 下載:下載選中的論文
  • 清除數據:在下一次獲取鏈接的時候,需要先清除數據
    在這里插入圖片描述

在使用的過程中,下載達到40篇以上的論文的時候,知網就會頻繁的彈出驗證碼。然后要求重新登錄。這個驗證的過程會難受一些。

【優化方案】:拼多多,淘寶 花個幾塊錢,可以買個他們自己搭建的知網鏡像網站賬號,他們的網站不會有這么多的驗證碼

論文下載篇數驗證

論文如果重復下載了,文件會重命名,重復的文件會以括號加數字結尾,直接刪除就行。

下述的Python腳本,輔助用戶找出漏掉的論文。
知網可以批量導出論文的BibTex格式的參考文獻的引用格式。

在這里插入圖片描述

bib格式的導出文件的論文名字為:title = {xxx}。可以使用正則表達式匹配到論文的標題。與下載文件夾的論文對比,就可以找出哪些論文還沒下載了。

實現代碼如下:

import re
import osfile_bib = "BibTex批量導出的參考格式.bib"
source_dir = "論文下載的文件夾"with open(file_bib, "r") as f:text = f.read()data = re.findall("title = {(.*?)}", text)# 已下載的論文
down_papers = [name.split("_")[0] for name in os.listdir(source_dir)]for idx, paper_name in enumerate(data):if paper_name not in down_papers:page = idx // 20 + 1print(paper_name, page)

輸出結果是論文名和對應的頁碼數。知網一頁20篇論文,用bib的下標數量除以20,就知道該論文所在的頁碼數了。這樣方便后續手動下載。
在這里插入圖片描述

參考資料

  • https://blog.csdn.net/qq_43210428/article/details/144588820

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/91755.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/91755.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/91755.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

低代碼平臺:驅動項目管理敏捷開發新范式

隨著企業數字化轉型加速,項目管理系統已從單一任務跟蹤工具到集成流程自動化、資源調度、跨團隊協作與風險監控的綜合平臺,項目管理系統的功能復雜度持續提升。然而,根據Gartner 2024年研究報告顯示,約60%的項目管理系統因未能有效…

圖機器學習(11)——鏈接預測

圖機器學習(11)——鏈接預測0. 鏈接預測1. 基于相似性的方法1.1 基于指標的方法1.2 基于社區的方法2. 基于嵌入的方法0. 鏈接預測 鏈接預測 (link prediction),也稱為圖補全,是處理圖時常見的問題。具體而言,給定一個…

簡單2步配置CadenceSkill開發編輯器,支持關鍵字高亮

Cadence 使用過程中難免會與skill打交道,有時候網上找到的開源skill,想要查看或者編輯一下,常規的txt編輯器沒有關鍵字高亮,看起來極為不方便。 利用Sublime Text可以很快速配置出支持skill關鍵字高亮的編輯器。 一、安裝 Sublime…

Leetcode刷題營第三十三題:對稱二叉樹

101. 對稱二叉樹 給你一個二叉樹的根節點 root , 檢查它是否軸對稱。 示例 1: 輸入:root [1,2,2,3,4,4,3] 輸出:true示例 2: 輸入:root [1,2,2,null,3,null,3] 輸出:false 提示:…

day055-Dockerfile與常用指令

文章目錄0. 老男孩思想-女性的第一需求1. Dockerfile1.1 Dockerfile的基本結構1.2 案例-制作小鳥飛飛鏡像1.2.1 編寫Dockerfile文件1.2.2 構建鏡像1.2.3 啟動容器1.3 Dockerfile常用指令1.4 面試題:Dockerfile中CMD和ENTRYPOINT的區別?1.5 案例-制作zrlo…

Spring Boot 應用優雅停機與資源清理:深入理解關閉鉤子

在開發和部署 Spring Boot 應用程序時,除了關注其啟動和運行,理解如何實現**優雅停機(Graceful Shutdown)**也同樣至關重要。優雅停機意味著在應用程序關閉時,能夠有序地釋放資源、完成正在進行的任務,并避…

淘寶扭蛋機小程序開發:重構電商娛樂化體驗的新范式

在電商行業同質化競爭加劇的當下,消費者對購物體驗的期待已從“功能滿足”轉向“情感共鳴”。淘寶扭蛋機小程序憑借“盲盒式隨機獎勵游戲化交互”的創新模式,成為撬動年輕用戶消費力的新支點。其開發邏輯不僅是對傳統電商的升級,更是對“娛樂…

YOLO演變史(一)

在YOLOV1發布后,作者并沒有滿足于此,而是持續對YOLO進行了改進。 YOLOV2:Better, Faster, Stronger YOLOv2(又稱YOLO9000)發表于2017年CVPR,是YOLO系列的第二代版本。其論文標題“Better, Faster, Stronger…

專題:2025智能體研究報告|附70份報告PDF、原數據表匯總下載

原文鏈接:https://tecdat.cn/?p43035 智能體正在改寫商業規則:某城商行的智能客服用公有云部署,把單筆交互成本從5.7元砍到1.2元,投訴率直降42%(《賽迪智庫:2025全球智能體進展報告》P24)&…

Axios 完整功能介紹和完整示例演示

Axios 是一個基于 Promise 的現代化 HTTP 客戶端庫,用于瀏覽器和 Node.js 環境。它提供了簡潔的 API 和強大的功能,是前端開發中最常用的網絡請求工具之一。核心功能 瀏覽器 & Node.js 雙平臺支持 瀏覽器中使用 XMLHttpRequestNode.js 中使用 http 模…

math.h函數

math.c函數作用 1. 基本三角函數(參數為弧度) sin(double x):計算正弦值。cos(double x):計算余弦值。tan(double x):計算正切值。asin(double x):反正弦(返回值范圍:[-π/2, π/2]&…

在Next.js里玩轉pdf預覽

1.背景在項目開發中,pdf預覽是一個很常見的業務。各大公司為了保護自己的知識產權,也會對pdf預覽進行限制,比如:不允許下載、打印,不允許提取文字等等。要想在實現預覽功能的基礎上還要附加這些限制,有很多…

算法競賽備賽——【圖論】求最短路徑——Floyd算法

floyd算法 基于動態規劃 應用:求多源最短路 時間復雜度:n^3 dijkstra:不能解決負邊權 floyd:能解決負邊權 不能解決負邊權回路問題 求最短路徑:dijkstra bfs floyd 思路 1.讓任意兩點之間的距離變短:引入…

雙指針(滑動窗口)相關算法題

雙指針算法有時候也叫尺取法或者滑動窗口,是?種優化暴力枚舉策略的手段:當我們發現在兩層 for 循環的暴力枚舉過程中,兩個指針是可以不回退的,此時我們就可以利用兩個指針不回退的性質來優化時間復雜度。因為雙指針算法中&#x…

ScratchCard刮刮卡交互元素的實現

效果展示 刮刮卡是?種常見的網頁交互元素,通過模擬物理世界的刮涂層來揭示下方的內容。這種效果主要依賴于HTML5的 元素來實現。以下是?個基于TypeScript的刮刮卡實現示例,包括配置項、初始化方法和核心的刮開邏輯。下面是展示的效果部分刮開效果&…

【Python LeetCode 專題】熱題 100,重在思路

哈希1. 兩數之和49. 字母異位詞分組128. 最長連續序列雙指針283. 移動零11. 盛最多水的容器15. 三數之和42. 接雨水滑動窗口3. 無重復字符的最長子串438. 找到字符串中所有字母異位詞子串560. 和為 K 的子數組239. 滑動窗口最大值普通數組53. 最大子數組和56. 合并區間189. 輪轉…

openEuler 22.03 LTS Rootless Docker 安裝指南

openEuler 22.03 LTS Rootless Docker 安裝指南 1.創建普通用戶(用于無根模式) sudo useradd -m docker-user sudo passwd docker-user # 設置密碼 sudo usermod --add-subuids 100000-165535 docker-user sudo usermod --add-subgids 100000-165535 do…

CMake指令:常見內置命令行工具( CMake -E )

目錄 1.簡介 2.核心作用 3.常用命令介紹 3.1.文件操作命令 3.2.系統命令執行 3.3.校驗與哈希 3.4.流程控制與等待 3.5.路徑與文件處理 3.6.歸檔與壓縮 3.7.網絡與下載 3.8.實用工具 4.使用示例 5.與 shell 命令的對比 6.在 CMake 腳本中使用 7.總結 相關鏈接 1…

YOLO融合CAF-YOLO中的ACFM模塊

YOLOv11v10v8使用教程: YOLOv11入門到入土使用教程 YOLOv11改進匯總貼:YOLOv11及自研模型更新匯總 《CAF-YOLO: A Robust Framework for Multi-Scale Lesion Detection in Biomedical Imagery》 一、 模塊介紹 論文鏈接:https://arxiv.org…

Webpack 項目構建優化詳解

1. 相關面試題 1.1. 做過哪些Webpack打包構建優化? 代碼分割:使用 Webpack 的 SplitChunksPlugin 進行代碼分割,將第三方庫、公共代碼與業務代碼分離,提高緩存利用率和加載速度。 Tree Shaking:通過配置 mode: production 或使用 TerserPlugin,移除未引用的代碼,減少…