逆向分析貝殼網人機驗證JS加密邏輯

引言

在數據爬取和自動化測試過程中,人機驗證(如滑塊、點選、短信驗證等)是常見的反爬手段。貝殼網(ke.com)作為國內領先的房產平臺,其人機驗證機制較為復雜,涉及前端JS加密、動態Token、行為檢測等技術。本文將通過逆向分析貝殼網的人機驗證JS加密邏輯,并給出Python實現方案,幫助開發者繞過驗證機制,實現高效數據采集。

1. 貝殼網人機驗證機制概述

貝殼網的人機驗證通常包括以下幾種形式:

  1. 滑塊驗證:用戶需拖動滑塊完成拼圖。
  2. 點選驗證:要求用戶點擊符合要求的圖片區域。
  3. 動態Token驗證:前端生成加密參數,提交至后端校驗。

本文重點分析動態Token加密邏輯,即前端如何生成加密參數(如 **<font style="color:rgb(64, 64, 64);background-color:rgb(236, 236, 236);">token</font>****<font style="color:rgb(64, 64, 64);background-color:rgb(236, 236, 236);">signature</font>** 等),并模擬該過程實現自動化繞過。

2. 逆向分析流程

2.1 目標定位

  1. 抓包分析
    使用瀏覽器開發者工具(F12)或抓包工具(Charles/Fiddler)觀察驗證請求,找到關鍵API(如 **<font style="color:rgb(64, 64, 64);background-color:rgb(236, 236, 236);">/api/captcha/verify</font>**)。

關鍵參數識別
通常包含以下字段:

{"token": "xxxxxx","signature": "yyyyyy","timestamp": 1234567890,"behavior_data": "{...}"
}

這些參數由前端JS生成,需逆向其加密邏輯。

2.2 JS代碼逆向

(1)查找加密入口
  1. 在瀏覽器中搜索關鍵詞(如 **<font style="color:rgb(64, 64, 64);background-color:rgb(236, 236, 236);">token</font>****<font style="color:rgb(64, 64, 64);background-color:rgb(236, 236, 236);">signature</font>****<font style="color:rgb(64, 64, 64);background-color:rgb(236, 236, 236);">encrypt</font>**)。
  2. 通過調用堆棧(Call Stack)定位生成參數的函數。
(2)調試關鍵函數

假設發現以下關鍵函數:

function generateToken() {var e = Date.now();var t = encryptAES(e + "|" + Math.random());return t;
}

說明 **<font style="color:rgb(64, 64, 64);background-color:rgb(236, 236, 236);">token</font>****<font style="color:rgb(64, 64, 64);background-color:rgb(236, 236, 236);">AES加密(時間戳|隨機數)</font>** 生成。

(3)提取加密算法
  • 使用 Chrome DevToolsSources 面板,格式化混淆的JS代碼。
  • 找到 **<font style="color:rgb(64, 64, 64);background-color:rgb(236, 236, 236);">encryptAES</font>** 函數,提取密鑰和加密模式(如 **<font style="color:rgb(64, 64, 64);background-color:rgb(236, 236, 236);">CBC</font>****<font style="color:rgb(64, 64, 64);background-color:rgb(236, 236, 236);">PKCS7Padding</font>**)。

2.3 Python模擬加密

逆向完成后,用Python實現相同的加密邏輯。以下是一個示例:

(1)安裝依賴
(2)Python實現AES加密
from Crypto.Cipher import AES
from Crypto.Util.Padding import pad
import base64
import time
import randomdef encrypt_aes(data, key, iv):cipher = AES.new(key.encode(), AES.MODE_CBC, iv.encode())padded_data = pad(data.encode(), AES.block_size)encrypted = cipher.encrypt(padded_data)return base64.b64encode(encrypted).decode()# 貝殼網AES加密參數(需根據實際逆向結果調整)
KEY = "xxxxxx"  # 替換為實際密鑰
IV = "yyyyyy"   # 替換為實際IVdef generate_token():timestamp = int(time.time() * 1000)rand_num = random.random()raw_data = f"{timestamp}|{rand_num}"token = encrypt_aes(raw_data, KEY, IV)return token

3. 完整爬蟲實現

3.1 獲取驗證參數

import requestsdef get_captcha_params():url = "https://ke.com/api/captcha/get"headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"}response = requests.get(url, headers=headers)return response.json()def submit_captcha(token, signature):url = "https://ke.com/api/captcha/verify"data = {"token": token,"signature": signature,"timestamp": int(time.time() * 1000)}response = requests.post(url, json=data, headers=headers)return response.json()

3.2 模擬驗證流程

# 1. 獲取驗證參數
captcha_data = get_captcha_params()# 2. 生成加密Token
token = generate_token()# 3. 計算簽名(假設signature由HMAC-SHA256生成)
import hmac
import hashlibdef generate_signature(token, secret_key):return hmac.new(secret_key.encode(), token.encode(), hashlib.sha256).hexdigest()SECRET_KEY = "zzzzzz"  # 替換為實際密鑰
signature = generate_signature(token, SECRET_KEY)# 4. 提交驗證
result = submit_captcha(token, signature)
print("驗證結果:", result)

4. 反反爬策略

  1. IP代理池:避免IP被封。
  2. 請求頭偽裝:模擬瀏覽器行為。
  3. 瀏覽器自動化(Playwright/Selenium):用于復雜交互驗證。

5. 結論

本文通過逆向分析貝殼網人機驗證的JS加密邏輯,提取了AES加密和HMAC簽名算法,并用Python模擬生成合法參數。該方法適用于需要繞過動態Token驗證的爬蟲場景,但需注意:

  • 貝殼網可能更新加密邏輯,需定期維護。
  • 高頻請求可能觸發風控,建議控制采集頻率。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/87466.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/87466.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/87466.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Vue3 + Element Plus中el-table加載狀態分析

在 Vue 3 中&#xff0c;當 onMounted 鉤子被觸發時&#xff0c;父組件的 DOM 已經掛載完成&#xff0c;但子組件&#xff08;如 el-table&#xff09;可能尚未完成其內部渲染。具體分析如下&#xff1a; 1. onMounted 的執行時機 父組件掛載完成&#xff1a;onMounted 表示當前…

OpenCV圖像拼接技術詳解:從特征匹配到全景合成

本文將詳細介紹如何使用OpenCV實現兩幅圖像的自動拼接&#xff0c;涵蓋特征提取、單應性矩陣計算和圖像融合等關鍵技術。 一、圖像拼接概述 圖像拼接是將多張有重疊區域的圖像合并成一幅全景圖的技術&#xff0c;廣泛應用于全景攝影、衛星圖像處理、醫學影像等領域。其核心技術…

如何通過 5 種方式向 Android 手機添加音樂

想把音樂添加到你的安卓手機&#xff0c;然后隨時隨地無需網絡連接就能欣賞你喜愛的音樂嗎&#xff1f;這不再是麻煩。現在&#xff0c;你可以按照本指南中的有效方法&#xff0c;將音樂添加到你的安卓手機上。讓我們在安卓手機上聆聽我們美妙的歌曲吧。 第 1 部分&#xff1a;…

VS Code 項目中的 .vscode 目錄詳解

VS Code 項目中的 .vscode 目錄詳解 .vscode 目錄是 VS Code 項目的核心配置中心&#xff0c;它包含特定于當前項目的配置&#xff0c;這些配置覆蓋全局設置&#xff0c;確保團隊成員獲得一致的開發環境體驗。 .vscode 目錄中的核心文件 文件名作用是否應納入版本控制settin…

Ubuntu22.04安裝opengauss并配置遠程訪問、JDBC連接

內容概括 最近在研究怎么在ubuntu服務器環境下使用opengauss&#xff0c;看了下官方下載地址沒有適配ubuntu的安裝包。仔細翻了下官方文檔&#xff0c;發現安裝指南里有提供一個deb包安裝方案&#xff0c;有適配ubuntu&#xff0c;經過實踐可行&#xff0c;于是記錄下來給有需要…

國產智能體“雙子星”:實在Agent vs Manus(核心架構與技術實現路徑對比)

2025年&#xff0c;人工智能領域迎來重要轉折點——大模型的光環逐漸消散&#xff0c;落地應用成為行業焦點。 正如業內人士所言&#xff1a;“2023年&#xff0c;大家普遍覺得要買一個大模型&#xff0c;但訓練完了怎么用起來&#xff0c;大家一頭霧水。” 在這一背景下&…

pgAdmin 4 連接 postgreSQL

環境如下&#xff1a; 宿主機為Windows 11postgreSQL安裝在宿主機上的Linux虛機中&#xff0c;Hypervisor是VirtualBoxpgAdmin 4 已安裝在宿主機上 本文講述&#xff1a;如何通過宿主機上的pgAdmin 連接到虛擬機中的PG。 設置監聽 默認的PG監聽主機為localhost&#xff0c;…

HTTP 緩存策略:強緩存與協商緩存的深入解析

在HTTP緩存策略中&#xff0c;強緩存和協商緩存是兩種常用的機制&#xff0c;用于減少數據傳輸和提高網頁加載速度。它們通過在客戶端和服務器之間建立緩存來避免不必要的網絡請求&#xff0c;從而優化性能并提高用戶體驗。本文將詳細介紹這兩種緩存策略的原理、優勢和適用場景…

Node.js 中的 Token 認證機制詳解

文章目錄 Node.js 中的 Token 認證機制詳解1. Token 認證基礎1.1 什么是 Token 認證&#xff1f;1.2 Token 認證流程 2. JWT (JSON Web Token) 實現2.1 安裝依賴2.2 生成 Token2.3 驗證 Token 中間件 3. 完整實現示例3.1 登錄接口3.2 受保護的路由 4. Token 安全最佳實踐5. Tok…

23 - HaLoAttention模塊

論文《Scaling Local Self-Attention for Parameter Efficient Visual Backbones》 1、作用 HaloNet通過引入Haloing機制和高效的注意力實現&#xff0c;在圖像識別任務中達到了最先進的準確性。這些模型通過局部自注意力機制&#xff0c;有效地捕獲像素間的全局交互&#xf…

2025Mybatis最新教程(五)

第5章 ORM映射 5.1 MyBatis自動ORM失效 MyBatis只能自動維護庫表”列名“與”屬性名“相同時的對應關系,二者不同時,無法自動ORM。 自動ORM失效建表 create table t_managers(mgr_id int primary key auto_increment,mgr_name varchar(50),mgr_pwd varchar(50) ); 添加數據…

解決lombok注解失效問題

Lombok 注解失效是 Java 開發中的常見問題&#xff0c;通常由依賴配置、IDE 支持或構建工具設置引起。最近在拉取別人springboot3jdk21版本的項目時遇到了lombok注解失效&#xff0c;導致項目無法啟動的問題&#xff0c;以下是我的解決方案&#xff1a; 首先檢查idea 的lombok…

3分鐘搭建LarkXR實時云渲染PaaS平臺,實現各類3D/XR應用的一鍵推流

LarkXR是由Paraverse平行云自主研發的去中心化實時云渲染平臺&#xff0c;以其卓越的性能和豐富完備的功能插件&#xff0c;引領3D/XR云化行業風向標。LarkXR適用于3D/XR開發者、設計師、終端用戶等創新用戶&#xff0c;可以在零硬件負擔下&#xff0c;輕松實現超高清低時延的3…

vue3 watch監視詳解

watch監視 一 &#xff1a;watch監視{ref}定義的基本類型結構 <template><div class"person"><h1>情況一:watch監視{ref}定義的基本類型結構</h1><h1>當前的和為{{ sum }}</h1><button click"changeSum">點我…

TensorFlow Serving學習筆記2: 模型服務

本文深入剖析 TensorFlow Serving 的核心架構與實現機制&#xff0c;結合源碼分析揭示其如何實現高可用、動態更新的生產級模型服務。 一、TensorFlow Serving 核心架構 1.1 分層架構設計 TensorFlow Serving 采用模塊化分層設計&#xff0c;各組件職責分明&#xff1a; 組件…

共享云桌面為什么能打敗傳統電腦

近年來&#xff0c;隨著云桌面技術的快速發展&#xff0c;共享云桌面作為一種新型的計算模式&#xff0c;正在逐步改變人們的工作和生活方式。它憑借其獨特的優勢&#xff0c;正在逐步取代傳統電腦&#xff0c;成為企業和個人用戶的新選擇。之所以在部分場景中展現出替代傳統電…

B站PWN教程筆記-12

完結撒花。 今天還是以做題為主。 fmtstruaf 格式化字符串USER AFTER FREE 首先補充一個背景知識&#xff0c;指針也是有數據類型的&#xff0c;不同數據類型的指針xx&#xff0c;所加的字節數也不一樣&#xff0c;其實是指針指的項目的下一項。如int a[20]&#xff0c;a是…

零基礎設計模式——總結與進階 - 3. 學習資源與下一步

第五部分&#xff1a;總結與進階 - 3. 學習資源與下一步 到這里&#xff0c;你已經完成了設計模式主要內容的學習。但這僅僅是一個開始&#xff0c;設計模式的精髓在于實踐和持續學習。本節將為你提供一些優質的學習資源和后續學習的建議&#xff0c;幫助你在這條道路上走得更…

多模態大語言模型arxiv論文略讀(125)

Uni-Med: A Unified Medical Generalist Foundation Model For Multi-Task Learning Via Connector-MoE ?? 論文標題&#xff1a;Uni-Med: A Unified Medical Generalist Foundation Model For Multi-Task Learning Via Connector-MoE ?? 論文作者&#xff1a;Xun Zhu, Yi…

【學習筆記】NLP 基礎概念

1.1 什么是 NLP 定義&#xff1a; 自然語言處理&#xff08;NLP&#xff09;**是一種讓計算機理解、解釋和生成人類語言的技術。它是人工智能領域中極為活躍且重要的研究方向&#xff0c;旨在模擬人類對語言的認知和使用過程 特點&#xff1a; 多學科交叉&#xff1a;結合計…