《Password Guessing Using Random Forest》論文解讀

論文填補了傳統統計方法(如 PCFG、Markov)與深度學習方法(如 LSTM、GAN)之間的研究空白,提出基于隨機森林的口令猜測框架 RFGuess,覆蓋三種核心猜測場景,為口令安全研究提供了全新技術路線。

一、研究背景

????????口令面臨的核心威脅是猜測攻擊。目前猜測攻擊存在局限:傳統方法存在過擬合和數據稀疏的問題;而深度學習需要大規模訓練數據,訓練時間長,調參復雜等問題。

二、本文研究

? ? ? ??可概括為 “1 條技術路線 + 3 個模型 + 1 套優化算法 + 大規模驗證”

? ? ? ? 技術路線:通過口令字符的多維度重新編碼,將機器學習應用于口令猜測

? ? ? ? 三個模型:

? ? ? ? ①RFGuess:針對 “漫步猜測”(無目標信息,追求破解數量);

? ? ? ?② RFGuess-PII:針對 “基于個人信息(PII)的定向猜測”(利用姓名、生日等,快速破解指定用戶);

? ? ? ? ③RFGuess-Reuse:針對 “基于口令重用的定向猜測”(利用用戶舊口令,破解新口令)

? ? ? ? 一套算法:近似最優 PII 匹配算法:改進傳統 “左最長匹配” (優先匹配左側最長 PII 片段)的局限,通過信息熵最小化選擇全局最優 PII 表示,提升定向猜測成功率 7%~13%。

????????大規模驗證:基于 13 個真實口令數據集(共 2.41 億條口令,含中 / 英文、普通用戶 / 安全意識較高用戶),驗證模型在不同場景下的有效性。

三、具體實現

3.1 口令字符的多維度編碼(特征工程)

????????設計6 階前綴 + 26 維特征向量(4×6+2)

????????單字符 4 維特征:字符類型,類型內序號,鍵盤行號,鍵盤列號。

????????額外2維長度特征:字符在整個口令中的位置,字符在當前字段的位置

3.2 場景一:漫步猜測模型:RFGuess

核心邏輯:將口令生成視為 “多分類問題”

輸入:6 階前綴的 26 維特征向量;輸出:下一個字符的類別;模型:隨機森林(由 30 棵 CART 決策樹組成,通過 “特征隨機選擇 + 樣本隨機抽樣” 避免過擬合)

步驟:

????????1.訓練階段:將訓練集中的每個口令拆分為 “6 階前綴 - 下一個字符” 對(Bs作為開始符);用前綴的 26 維特征向量作為輸入,下一個字符的序號作為標簽,訓練隨機森林。

? ? ? ? 2.生成階段:從初始前綴(Bs×6)開始,通過隨機森林預測下一個字符的概率分布;對未獲投票的字符采用 “add-δ 平滑”(δ=0.001),避免概率為 0;按概率降序生成猜測,直至生成終止符 Es 或達到預設猜測數。

優勢:

  • 解決 Markov 模型的數據稀疏問題:決策樹會將 “相似特征的前綴” 歸為同一葉節點,即使前綴未在訓練集中出現,也能通過相似樣本預測;
  • 自動特征篩選:隨機森林通過 “Gini impurity” 選擇重要特征(如字符序號、鍵盤列號更重要),剔除冗余特征(如鍵盤行號),提升訓練效率。

3.3 場景2:基于PII的定向猜測模型 RFGuess-PII

本文提出通過 “信息熵最小化” 選擇全局最優 PII?

步驟:

? ? ? ? 1.?PII 標簽數字化:將 PII 類型(姓名、生日、用戶名等)用數字標簽表示

? ? ? ? 2.枚舉所有可能表示:對每個口令,列出所有可能的 PII 標簽組合

? ? ? ? 3.按頻次排序與迭代選擇:按表示的頻次降序排序,用 R?表示所有可匹配的口令,剩余表示的頻次減 1;重復上述步驟,直至所有表示頻次≤1,未匹配口令用 “最短結構” 表示;

????????4.理論驗證:該算法能最小化口令集的信息熵

RFGuess-PII模型

????????特征適配:PII 標簽用(PII 類型、PII 序號、0、0)編碼

????????訓練:用含 PII 標簽的口令集訓練隨機森林;

????????生成:將生成的含 PII 標簽的猜測,替換為目標用戶的真實 PII

3.4 場景 3:基于口令重用的定向猜測模型 RFGuess-Reuse

核心邏輯:用戶重用口令時,通常會進行 “結構級”和 “字段級”修改

????????結構級變換:統計訓練集中口令對的結構轉換概率(如 “尾部插入 D?” 的概率);

????????字段級變換:用隨機森林預測字段內的原子修改(插入、刪除、替換)概率。

eg:舊口令 “password!!”(結構 L?S?)生成新口令 “p@sswor123”(結構 L?D?)

四、實驗驗證

?4.1數據集

????????基礎數據集:13 個真實數據集(8 個英文、5 個中文),共 2.41 億條口令

????????PII 數據集:6 個含個人信息的數據集

????????口令重用數據集:8 個跨平臺口令對數據集

4.2 對比方法

????????漫步猜測:PCFG、3/4 階 Markov、FLA(LSTM)、Min-auto(理想攻擊,取各方法最優結果)

????????定向 PII 猜測:TarGuess-I(PCFG-based)、Targeted-Markov(Markov-based)、FLA-PII(改進 FLA)

????????口令重用猜測:TarGuess-II(PCFG-based)、Pass2Path(Seq2Seq-based)

通過實驗證明RFGuess 框架在三種核心場景下均表現優異。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/94982.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/94982.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/94982.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

項目一系列-第9章 集成AI千帆大模型

第9章 集成AI千帆大模型 學習目標 能夠說清楚健康評估模塊在項目中的作用能夠掌握千帆大模型的開通和對接能夠掌握健康評估模塊中的prompt提示詞編寫能夠自主完成健康評估模塊的接口開發 分析設計 需求說明 健康評估是指老人辦理入住前需上傳體檢報告,由AI自動…

vben admin5組件文檔(豆包版)---VbenTree

VbenTree 用法說明 VbenTree 是 Vben5 中基于 radix-vue 實現的樹形組件,支持單選、多選、展開/折疊、權限控制等功能。以下是其核心用法說明: 1. 基礎引入 import { VbenTree } from vben-core/shadcn-ui;2. 核心屬性(Props)屬性…

postman常用快捷鍵

作為一名IT程序猿,不懂一些工具的快捷方式,應該會被鄙視的吧。收集了一些Postman的快捷方式,大家一起動手操作~ 1小時postman接口測試從入門到精通教程簡單操作 操作mac系統windows系統 打開新標簽 ?TCtrl T關閉標簽?WCtrl W強制關閉標簽…

【物聯網】什么是 DHT11(數字溫濕度傳感器)?

正面照片(藍色傳感器朝上,針腳朝下) 絲印標注非常清晰: 左邊 → S 👉 信號 (DATA) 中間 → 👉 VCC (電源,3.3V 或 5V) 右邊 → - 👉 GND (地) ? 正確接法(Arduino Nano…

光譜相機在霧霾監測中有何優勢?

光譜相機在霧霾監測中的優勢主要體現在多維度數據采集和環境適應性方面,結合最新技術進展分析如下:一、核心優勢?穿透性監測能力? 短波紅外(SWIR)波段可穿透霧霾顆粒,結合可見光成像實現霧霾濃度與能見度的同步監測&…

【c++】超好玩游戲

#include <iostream> #include <vector> #include <conio.h> #include <windows.h> #include <time.h>using namespace std;// 游戲常量 const int WIDTH 40; const int HEIGHT 20; const int PADDLE_WIDTH 5;// 方向枚舉 enum Direction { S…

GitHub 熱榜項目 - 日榜(2025-08-27)

GitHub 熱榜項目 - 日榜(2025-08-27) 生成于&#xff1a;2025-08-27 統計摘要 共發現熱門項目&#xff1a;15 個 榜單類型&#xff1a;日榜 本期熱點趨勢總結 本期GitHub熱榜呈現出三大技術趨勢&#xff1a;1. AI生產力工具持續升溫&#xff1a;系統提示詞泄露庫、DeepCode…

基于Springboot + vue3實現的學校學報出版發行管理系統

項目描述本系統包含管理員和用戶兩個角色。管理員角色&#xff1a;用戶管理&#xff1a;管理系統中所有用戶的信息&#xff0c;包括添加、刪除和修改用戶。稿件分類管理&#xff1a;管理稿件分類信息&#xff0c;包括新增、查看、修改和刪除稿件分類。新聞資訊管理&#xff1a;…

【Keil5教程及技巧】耗時一周精心整理萬字全網最全Keil5(MDK-ARM)功能詳細介紹【建議收藏-細細品嘗】

&#x1f48c; 所屬專欄&#xff1a;【單片機開發軟件技巧】 &#x1f600; 作??者&#xff1a; 于曉超 &#x1f680; 個人簡介&#xff1a;嵌入式工程師&#xff0c;專注嵌入式領域基礎和實戰分享 &#xff0c;歡迎咨詢&#xff01; &#x1f496; 歡迎大家&#xff1…

國家育兒補貼政策遭利用,黑產組織借機竊取敏感數據

組織概況與作案手法近期網絡安全領域出現了一個高度組織化的犯罪集團UTG-Q-1000&#xff0c;該組織通過利用中國國家育兒補貼政策實施大規模金融詐騙和數據竊取活動。這個結構嚴密的犯罪網絡下設多個專業部門&#xff0c;包括財務組、新聞與色情組、設計與制造組以及黑市交易組…

Python Imaging Library (PIL) 全面指南:PIL高級圖像處理-分割與顏色空間轉換

高級圖像處理&#xff1a;PIL中的圖像分割與顏色空間轉換 學習目標 本課程將深入探討PIL&#xff08;Python Imaging Library&#xff09;中的一些高級功能&#xff0c;包括圖像分割和顏色空間轉換。通過本課程的學習&#xff0c;學員將能夠掌握如何使用PIL進行更復雜的圖像處理…

圖解 OAuth,為什么這樣設計?

OAuth 于 2007 年首次推出。它最初由 Twitter 創建&#xff0c;因為 Twitter 希望能夠允許第三方應用代表用戶發布推文。想象一下&#xff0c;如果今天設計類似的應用&#xff0c;你會怎么做&#xff1f;一種方法是直接要求用戶輸入用戶名和密碼。因此&#xff0c;你創建一個非…

WeakAuras Lua Script ICC (BarneyICC) Simplified Chinese [Mini]

WeakAuras Lua Script ICC &#xff08;BarneyICC&#xff09; Simplified Chinese [Mini] ICC 迷你版本會打了只需要團隊框體高亮提示即可&#xff0c;因為有DBM&#xff0c;就不需要那么多了 !WA:2!S3xc4XrXzI6wkSjzcVSyb4aoKWGaC04ijMdPrsoit0OdRXwxmsYgmWoNTup4rZ0UNr2sKL…

mcp學習

mcp學習 預算&#xff1a;5塊(半頓拼好飯嗚嗚嗚) 出問題試著開啟或者關閉代理。 文章目錄mcp學習1. 基本原理2. 環境配置1. cherryStudiodeepseekpython2. Clinedeepseek3. 常用mcp服務1. mcp-server-fetch2. mcp-playwright3. baidu-map4. filesystem5. mcp-mysql-server參考…

Rust:所有權

Rust&#xff1a;所有權拷貝 & 移動堆棧拷貝移動克隆所有權變量的初始權限指針的雙重權限權限的動態變化引用賦值重新借用函數調用時的權限移動拷貝借用不可變借用可變借用復合類型的權限結構體元組數組傳統語言的內存管理要么依賴程序員手動管理&#xff08;C/C&#xff0…

Elasticsearch數據遷移快照方案初探(二):快照創建與多節點存儲問題解決

快照倉庫創建成功 經過前面的配置修改&#xff0c;我們成功創建了快照倉庫&#xff1a; curl -X PUT "https://[ES_HOST]:9200/_snapshot/backup_repo" \-H "Content-Type: application/json" \-u "[USERNAME]:[PASSWORD]" \-k \-d {"type&…

DeepSeek大模型風靡云平臺,百度智能云、阿里云、騰訊云等多個平臺宣布上線DeepSeek模型

近日&#xff0c;百度智能云、華為云、阿里云、騰訊云、360數字安全、云軸科技等多個平臺紛紛宣布上線DeepSeek大模型&#xff0c;這一消息無疑為AI開發者和企業用戶帶來了全新的機遇和選擇。本文將探討DeepSeek大模型上線的背景、意義以及未來的發展趨勢。 首先&#xff0c;我…

position屬性

文章目錄Position屬性&#x1f9ed; 一、position 屬性的取值&#x1f4dd; 二、各屬性值詳解與示例1. static&#xff08;靜態定位&#xff09;2. relative&#xff08;相對定位&#xff09;3. absolute&#xff08;絕對定位&#xff09;4. fixed&#xff08;固定定位&#xf…

通信中間件 Fast DDS(二) :詳細介紹

目錄 1.引言 2.DDS的基本原理 3.FastDDS 的核心特性 4.FastDDS 的核心架構 5.典型應用場景 6.FastDDS 的安裝與快速上手 7.學習資源與社區 1.引言 FastDDS&#xff08;原稱 Fast RTPS&#xff09;是由西班牙公司 eProsima 開發的一款開源、高性能、實時性強的數據分發服…

【69頁PPT】智慧方案智慧校園解決方案(附下載方式)

篇幅所限&#xff0c;本文只提供部分資料內容&#xff0c;完整資料請看下面鏈接 https://download.csdn.net/download/2501_92808811/91776074 資料解讀&#xff1a;【69頁PPT】智慧方案智慧校園解決方案 詳細資料請看本解讀文章的最后內容 智慧校園的概念與背景 智慧校園是…