CSDN文章質量分查詢系統【贈python爬蟲、提分攻略】

CSDN文章質量分查詢系統

https://www.csdn.net/qc

點擊鏈接----->? ?CSDN文章質量分查詢系統? ? ?<------點擊鏈接

點擊鏈接----->? ?https://www.csdn.net/qc? ? ?<------點擊鏈接

點擊鏈接----->? ?CSDN文章質量分查詢系統? ? ?<------點擊鏈接?

點擊鏈接----->? ?https://www.csdn.net/qc? ? ?<------點擊鏈接

說明:一定要是CSDN站內博文鏈接

效果舉例展示

作者以自己這編文章展示效果

java機器學習計算指標動態閾值-CSDN博客

CSDN個人博客平均質量分查詢

內容管理---》數據---》作品數據---》博客數據(默認頁簽)---》博客統計數據(默認頁簽)

獲取CSDN個人博客鏈接地址

方式一

文章瀏覽頁面---》復制地址欄的地址

方式二

文章瀏覽頁面(底部)---》分享---》復制鏈接

Python爬蟲應用【爬質量分】

Python爬蟲爬csdn個人所有文章質量分

這里以MacOS為例,Windows和Linux類似

安裝python3

安裝過的跳過,如果有python(python2)也行

brew install python3

安裝pip3

安裝過的跳過,如果有python(python2)也行

brew install pip3

安裝所需的庫

  • requests:用于發送HTTP請求
  • MultipartEncoder:用于構造POST請求的請求體
# windows或是沒有裝homebrew的操作系統可以不帶--break-system-packages
pip3 install requests --break-system-packages
pip3 install requests_toolbelt --break-system-packages
pip3 install openpyxl --break-system-packages
pip3 install pandas --break-system-packages

獲取所需的請求 URL 和請求標頭

第一步:打開目標網頁

第二步:使用開發者工具

?

第三步:獲取請求 URL 和請求標頭

點擊負載找到請求參數

第四步:分析請求url,構造參數字典

url = "https://bizapi.csdn.net/blog/phoenix/console/v1/article/list"
參數:
pageSize: 20

第五步:整代碼

調整下面的代碼(不同時候由于csdn官方可能有更新,地址可能會有調整)

編輯文件:csdnArticleScore.py

# pip3 install pandas --break-system-packages
import json
import pandas as pd
from openpyxl import Workbook, load_workbook
from openpyxl.utils.dataframe import dataframe_to_rows
import math
import requests# 批量獲取文章信息并保存到excel
class CSDNArticleExporter:def __init__(self, username, cookies, Referer, page, size, filename):self.username = usernameself.cookies = cookiesself.Referer = Refererself.size = sizeself.filename = filenameself.page = pagedef get_articles(self):url = "https://blog.csdn.net/community/home-api/v1/get-business-list"params = {"page": {self.page},"size": {self.size},"businessType": "blog","username": {self.username}}headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3','Cookie': self.cookies,  # Setting the cookies string directly in headers'Referer': self.Referer}try:response = requests.get(url, params=params, headers=headers)response.raise_for_status()  # Raises an HTTPError if the response status code is 4XX or 5XXdata = response.json()return data.get('data', {}).get('list', [])except requests.exceptions.HTTPError as e:print(f"HTTP錯誤: {e.response.status_code} {e.response.reason}")except requests.exceptions.RequestException as e:print(f"請求異常: {e}")except json.JSONDecodeError:print("解析JSON失敗")return []def export_to_excel(self):df = pd.DataFrame(self.get_articles())df = df[['title', 'url', 'postTime', 'viewCount', 'collectCount', 'diggCount', 'commentCount']]df.columns = ['文章標題', 'URL', '發布時間', '閱讀量', '收藏量', '點贊量', '評論量']# df.to_excel(self.filename)# 下面的代碼會讓excel每列都是合適的列寬,如達到最佳閱讀效果# 你只用上面的保存也是可以的# Create a new workbook and select the active sheetwb = Workbook()sheet = wb.active# Write DataFrame to sheetfor r in dataframe_to_rows(df, index=False, header=True):sheet.append(r)# Iterate over the columns and set column width to the max length in each columnfor column in sheet.columns:max_length = 0column = [cell for cell in column]for cell in column:try:if len(str(cell.value)) > max_length:max_length = len(cell.value)except:passadjusted_width = (max_length + 5)sheet.column_dimensions[column[0].column_letter].width = adjusted_width# Save the workbookwb.save(self.filename)class ArticleScores:def __init__(self, filepath):self.filepath = filepath@staticmethoddef get_article_score(article_url):url = "https://bizapi.csdn.net/trends/api/v1/get-article-score"# TODO: Replace with your actual headersheaders = {"Accept": "application/json, text/plain, */*","X-Ca-Key": "203930474","X-Ca-Nonce": "7e4ece49-5b7d-41e0-b548-30972a3e3989","X-Ca-Signature": "mXV5P9OGdBpKyv7v+OfuSmtbN66OwLg3ujL2kwGk5mw=","X-Ca-Signature-Headers": "x-ca-key,x-ca-nonce","X-Ca-Signed-Content-Type": "multipart/form-data",}data = {"url": article_url}try:response = requests.post(url, headers=headers, data=data)response.raise_for_status()  # This will raise an error for bad responsesreturn response.json().get('data', {}).get('score', 'Score not found')except requests.RequestException as e:print(f"Request failed: {e}")return "Error fetching score"def get_scores_from_excel(self):df = pd.read_excel(self.filepath)urls = df['URL'].tolist()scores = [self.get_article_score(url) for url in urls]return scoresdef write_scores_to_excel(self):df = pd.read_excel(self.filepath)df['質量分'] = self.get_scores_from_excel()df.to_excel(self.filepath, index=False)if __name__ == '__main__':total = 10     #已發文章總數量# TODO:調整為你自己的cookies,Referer,CSDNid, headerscookies = 'UN=jjk_02027; fi_id=default; log_Id_pv=******。。。'  # Simplified for brevityReferer = 'https://blog.csdn.net/jjk_02027?type=blog'CSDNid = 'jjk_02027't_index = math.ceil(total/100)+1 #向上取整,半閉半開區間,開區間+1。# 獲取文章信息# CSDNArticleExporter("待查詢用戶名", 2(分頁數量,按總文章數量/100所得的分頁數),總文章數量僅為設置為全部可見的文章總數。# 100(最大單次查詢文章數量不大于100), 'score1.xlsx'(待保存數據的文件,需要和下面的一致))for index in range(1,t_index): #文章總數filename = "score"+str(index)+".xlsx"exporter = CSDNArticleExporter(CSDNid, cookies, Referer, index, 100, filename)  # Replace with your usernameexporter.export_to_excel()# 批量獲取質量分score = ArticleScores(filename)score.write_scores_to_excel()

第六步:運行Python爬蟲

python3 csdnArticleScore.py  

第七步:查詢質量分文件

運行Python爬蟲后會在當前目錄生成excel文件:

文件示例:

我從事了10多年的java工作,是個python新手,真正被python的強大驚訝到了,從性能、便捷性方面不輸java,雖然我用java也寫過,性能也相差無幾,但是這里還是覺得python更好用~

附件一:Python官網及教程

Python官網? ? ?https://www.python.org/

Python3教程? ?Python3 教程 | 菜鳥教程

附件二:Python抓分常見問題

1、macOS python3安裝requests庫 報error: externally-managed-environment

使用Homebrew來安裝requests庫,而不是直接使用pip(跳過,裝python庫用pip3,非python庫才用brew

brew install python-requests

2、macOS pip3安裝pipx報error: externally-managed-environment

pip3 install pipx --break-system-packages

3、macOS pip3安裝requests報error: externally-managed-environment

pip3 install requests --break-system-packages

附件三:CSDN提高博客質量分攻略

在提高CSDN博客質量分(即提高博客的排名和曝光度)時,有幾個關鍵的策略可以幫助你優化你的內容,從而吸引更多的讀者和搜索引擎的關注。以下是一些實用的建議:

1. 內容質量

  • 原創性:確保你的文章是原創的,避免抄襲。

  • 深度和廣度:提供有價值的信息,不僅限于表面,而是深入探討話題。

  • 準確性:確保所有信息都是準確無誤的,避免誤導讀者。

2. 文章結構

  • 清晰的標題:使用吸引人的標題,同時包含關鍵詞。

  • 良好的段落劃分:合理使用標題(H2, H3等),使文章結構清晰。

  • 列表和子標題:使用列表和子標題來增強可讀性。

3. 關鍵詞優化

  • 關鍵詞研究:使用工具如Google Keyword Planner或SEMrush來找到相關的關鍵詞。

  • 關鍵詞密度:在文章中合理分布關鍵詞,但避免過度堆砌。

  • 元標簽優化:優化文章的元描述和關鍵詞標簽。

4. 多媒體內容

  • 圖片和視頻:合理使用圖片和視頻,增強內容的吸引力。

  • ALT標簽:為圖片添加描述性的ALT標簽,這有助于SEO。

5. 外部鏈接

  • 高質量鏈接:提供有價值的外部鏈接,增加文章的可信度和深度。

  • 內部鏈接:鏈接到你的其他相關博客文章,提高頁面瀏覽量和SEO價值。

6. 社交媒體分享

  • 易于分享:在文章中添加社交分享按鈕,鼓勵讀者分享你的內容。

  • 社交媒體互動:在社交媒體上宣傳你的文章,增加曝光率。

7. 定期更新和維護

  • 定期更新:保持博客的活躍狀態,定期發布新內容。

  • 評論管理:及時回復評論,與讀者互動,建立良好的社區氛圍。

8. 使用SEO插件和工具

  • 使用SEO插件:如Yoast SEO(對于WordPress用戶),它可以幫助你優化內容。

  • 分析工具:使用Google Analytics和Google Search Console來監控你的博客表現,并根據數據進行調整。

9. 用戶體驗優化

  • 快速加載速度:優化圖片和其他媒體文件的大小,確保網站快速加載。

  • 移動友好性:確保你的博客在移動設備上也能良好顯示。

通過實施上述策略,你可以顯著提高CSDN博客的質量分,從而增加你的博客的訪問量和影響力。記住,持續的努力和改進是關鍵。

總結?

本文講述:

1、如何查文章質量分

2、如何獲取文章鏈接

3、使用爬蟲一次性爬所有文章質量分

4、附CSDN提高博客質量分攻略

小伙伴們,快快點贊、關注、收藏吧~

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/70346.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/70346.shtml
英文地址,請注明出處:http://en.pswp.cn/web/70346.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

HTML應用指南:利用GET請求獲取全國瀘溪河門店位置信息

隨著新零售業態的快速發展,門店位置信息的獲取變得越來越重要。作為新興烘焙品牌之一,瀘溪河自2013年在南京創立以來,一直堅持“健康美味,香飄世界”的企業使命,以匠人精神打造新中式糕點。為了更好地理解和利用這些數據,本篇文章將深入探討GET請求的實際應用,并展示如何…

如何在 React 中測試高階組件?

在 React 中測試高階組件可以采用多種策略&#xff0c;以下是常見的測試方法&#xff1a; 1. 測試高階組件返回的組件 高階組件本身是一個函數&#xff0c;它返回一個新的組件。因此&#xff0c;可以通過測試這個返回的組件來間接測試高階組件的功能。通常使用 Jest 作為測試…

R語言Stan貝葉斯空間條件自回歸CAR模型分析死亡率多維度數據可視化

全文鏈接&#xff1a;https://tecdat.cn/?p40424 在空間數據分析領域&#xff0c;準確的模型和有效的工具對于研究人員至關重要。本文為區域數據的貝葉斯模型分析提供了一套完整的工作流程&#xff0c;基于Stan這一先進的貝葉斯建模平臺構建&#xff0c;幫助客戶為空間分析帶來…

Casbin 權限管理介紹及在 Go 語言中的使用入門

引言 在現代軟件開發過程中&#xff0c;權限管理是一個至關重要的環節&#xff0c;它關系到系統的安全性和用戶體驗。Casbin 是一個強大的訪問控制庫&#xff0c;支持多種訪問控制模型&#xff0c;如 ACL&#xff08;訪問控制列表&#xff09;、RBAC&#xff08;基于角色的訪問…

快速入門——第三方組件element-ui

學習自嗶哩嗶哩上的“劉老師教編程”&#xff0c;具體學習的網站為&#xff1a;10.第三方組件element-ui_嗶哩嗶哩_bilibili&#xff0c;以下是看課后做的筆記&#xff0c;僅供參考。 第一節 組件間的傳值 組件可以有內部Data提供數據&#xff0c;也可由父組件通過prop方式傳…

【算法通關村 Day7】遞歸與二叉樹遍歷

遞歸與二叉樹遍歷青銅挑戰 理解遞歸 遞歸算法是指一個方法在其執行過程中調用自身。它通常用于將一個問題分解為更小的子問題&#xff0c;通過重復調用相同的方法來解決這些子問題&#xff0c;直到達到基準情況&#xff08;終止條件&#xff09;。 遞歸算法通常包括兩個主要…

樸素貝葉斯法

文章目錄 貝葉斯定理樸素貝葉斯法的學習與分類條件獨立假設樸素貝葉斯的后驗概率最大化準則樸素貝葉斯的基本公式 樸素貝葉斯法的參數估計極大似然估計 貝葉斯定理 前置知識&#xff1a;條件概率、全概率、貝葉斯公式 推薦視頻&#xff0c;看完視頻后搜索博客了解先驗概率、后…

《A++ 敏捷開發》- 20 從 AI 到最佳設計

“我們現在推行AIGC&#xff0c;服務端不需要UI交互設計的用AI自動產出代碼&#xff0c;你建議的結對編程、TDD等是否還適用&#xff1f;” 這兩年AI確實很火&#xff0c;是報紙、雜志的熱門話題。例如&#xff0c;HBR雜志從2024年9月至2025年二月份3期&#xff0c;里面有接近一…

GO系列-IO 文件操作

os io 判斷文件是否存在 func fileExist(filePath string) (bool, error) {_, err : os.Stat(filePath)if err nil {return true, nil}if os.IsNotExist(err) {return false, nil}return false, &CheckFileExistError{filePath} } 讀取文件內容 func readFileContext(…

rs485協議、電路詳解(保姆級)

起源 RS-485即Recommended Standard 485 協議的簡寫。1983年被電子工業協會(EIA)批準為一種通訊接口標準. 數據在通信雙方之間傳輸&#xff0c;本質是傳輸物理的電平&#xff0c;比方說傳輸5V的電壓 -1V的電壓信號&#xff0c;這些物理信號在傳輸過程中會受到很多干擾&#x…

JavaWeb-Tomcat服務器

文章目錄 Web服務器存在的意義關于Web服務器軟件Tomcat服務器簡介安裝Tomcat服務器Tomcat服務器源文件解析配置Tomcat的環境變量啟動Tomcat服務器一個最簡單的webapp(不涉及Java) Web服務器存在的意義 我們之前介紹過Web服務器進行通信的原理, 但是我們當時忘記了一點, 服務器…

【愚公系列】《Python網絡爬蟲從入門到精通》008-正則表達式基礎

標題詳情作者簡介愚公搬代碼頭銜華為云特約編輯,華為云云享專家,華為開發者專家,華為產品云測專家,CSDN博客專家,CSDN商業化專家,阿里云專家博主,阿里云簽約作者,騰訊云優秀博主,騰訊云內容共創官,掘金優秀博主,亞馬遜技領云博主,51CTO博客專家等。近期榮譽2022年度…

視覺分析之邊緣檢測算法

9.1 Roberts算子 Roberts算子又稱為交叉微分算法&#xff0c;是基于交叉差分的梯度算法&#xff0c;通過局部差分計算檢測邊緣線條。 常用來處理具有陡峭的低噪聲圖像&#xff0c;當圖像邊緣接近于正45度或負45度時&#xff0c;該算法處理效果更理想。 其缺點是對邊緣的定位…

DuodooBMS源碼解讀之 sale_change模塊

銷售變更模塊用戶使用手冊 一、模塊概述 本擴展模塊主要包含兩個主要的 Python 文件&#xff1a;sale_change/report/sale_change_report.py 和 sale_change/wizard/sale_change_download.py&#xff0c;提供了銷售變更報表查看和銷售變更單下載的功能。以下是詳細的使用說明…

OpenCV形態學操作

1.1. 形態學操作介紹 初識&#xff1a; 形態學操作是一種基于圖像形狀的處理方法&#xff0c;主要用于分析和處理圖像中的幾何結構。其核心是通過結構元素&#xff08;卷積核&#xff09;對圖像進行掃描和操作&#xff0c;從而改變圖像的形狀和特征。例如&#xff1a; 腐蝕&…

力扣算法-1

力扣算法 1 兩數之和 給定一個整數數組nums和一個整數目標值target&#xff0c;請你在數組中找出和為目標值target的那兩個整數&#xff0c;返回他們的數組下標。 &#xff08;1&#xff09;暴力枚舉 &#xff08;枚舉數組每一個數x&#xff0c;再尋找數組中是否存在 targe…

pyside6學習專欄(三):自定義QLabel標簽擴展類QLabelEx

標簽是界面設計中最常用的控件&#xff0c;本文演示了如何基于PySide6的QLabex控件類擴展定義QLabelEX類&#xff0c;以實現更少的編碼完成各種圖像、彩色文本、動畫的加載和顯示&#xff0c;豐富界面顯示 本示例演示了QLabel和其擴展類QLabelEx分別顯示文本、圖像、動畫的使用…

從0到1:固件分析

固件分析 0x01 固件提取 1、從廠商官網下載 例如D-link的固件&#xff1a; https://support.dlink.com/resource/products/ 2、代理或鏡像設備更新時的流量 發起中間人攻擊MITM #啟用IP轉發功能 echo 1 > /proc/sys/net/ipv4/ip_forward#配置iptables&#xff0c;將目…

使用 Spring Boot 和 Canal 實現 MySQL 數據庫同步

文章目錄 前言一、背景二、Canal 簡介三、主庫數據庫配置1.主庫配置2.創建 Canal 用戶并授予權限 四.配置 Canal Server1.Canal Server 配置文件2.啟動 Canal Server 五.開發 Spring Boot 客戶端1. 引入依賴2. 配置 Canal 客戶端3. 實現數據同步邏輯 六.啟動并測試七.注意事項八…

Linux系統配置阿里云yum源,安裝docker

配置阿里云yum源 需要保證能夠訪問阿里云網站 可以先ping一下看看&#xff08;阿里云可能禁ping&#xff0c;只要能夠解析為正常的ip地址即可&#xff09; ping mirrors.aliyun.com腳本 #!/bin/bash mkdir /etc/yum.repos.d/bak mv /etc/yum.repos.d/*.repo /etc/yum.repos…