第77期 | GPTSecurity周報

圖片

GPTSecurity是一個涵蓋了前沿學術研究和實踐經驗分享的社區,集成了生成預訓練Transformer(GPT)、人工智能生成內容(AIGC)以及大語言模型(LLM)等安全領域應用的知識。在這里,您可以找到關于GPT/AIGC/LLM最新的研究論文、博客文章、實用的工具和預設指令(Prompts)。現為了更好地知悉近一周的貢獻內容,現總結如下。

Security Papers

1. 利用大語言模型在灰盒模糊測試中生成初始種子

簡介:灰盒模糊測試作為發現軟件漏洞的首選技術,成功在效率與探索深度之間達成平衡。盡管研究方向長期聚焦于模糊測試技術的改進,然而高質量初始種子的關鍵意義卻始終未得到應有的重視,常被研究人員所忽略。現有的種子生成方法確實存在諸多局限,對于那些具有非標準或自定義輸入格式的程序來說更是如此。

大語言模型(LLMs)在眾多領域掀起了變革浪潮,其在理解并生成跨各個知識領域復雜模式方面所展現出的能力堪稱史無前例。

本文向大家介紹一款新穎的系統 ——SeedMind。它借助大語言模型,以智能生成種子的方式強化灰盒模糊測試。與過往方法不同之處在于,SeedMind 利用大語言模型來創建測試用例生成器,而不是直接生成測試用例。研究者采用了一種迭代式、反饋驅動的方法,引導大語言模型逐步優化測試用例生成過程,目標是擴大代碼覆蓋的深度與廣度。

在 SeedMind 的開發進程中,研究者攻克了一系列關鍵難題,像是輸入格式受限、上下文窗口存在約束,以及保障行為的一致性與對進展的感知能力等問題。經過對實際應用的深入評估后發現,SeedMind 能夠高效運用大語言模型生成高質量測試用例,有力推動了漏洞發現方面的模糊測試工作。其成效與人工創建的種子不相上下,并且相較于現有的基于大語言模型的解決方案,具有顯著優勢。

鏈接:

https://arxiv.org/abs/2411.18143

2. InputSnatch:通過時序側信道攻擊竊取大語言模型服務中的輸入信息

簡介:大語言模型(LLMs)憑借其廣泛的知識儲備和強大的問答能力,在金融、醫療咨詢等對隱私高度敏感的領域得以廣泛應用。當大語言模型進行推理運算時,常常會運用緩存共享方法,通過對相同或相似的推理請求重復使用緩存狀態或響應,以此提升效率。

不過,研究者在研究過程中察覺到,這些緩存機制存在著隱私輸入信息泄露的隱患。由于緩存的存在,響應時間會產生可被觀測到的差異,這一差異恰好成為了基于時序攻擊的有力線索。

在本次研究里,研究者創新性地提出了一種基于時序的側信道攻擊手段,專門用于在大語言模型推理過程中竊取輸入信息。基于緩存的攻擊面臨著一個巨大挑戰,即在極為龐大的搜索空間里構建候選輸入,從而精準命中并成功竊取緩存中的用戶查詢信息。

為了有效應對這些挑戰,研究者設計了兩個核心組件。其中,輸入構造器運用機器學習技術以及基于大語言模型的方法來開展詞匯相關性學習,與此同時,實施經過優化的搜索機制以完成通用輸入構造。而時間分析器則借助帶有異常值剔除功能的統計時間擬合技術,來識別緩存命中模式,并持續提供反饋信息,以便進一步優化構造器的搜索策略。

研究者針對兩種緩存機制開展了實驗,實驗結果清晰地表明,研究者所提出的方法在各類應用場景中均能夠始終保持較高的攻擊成功率。研究者的這項工作充分揭示了與性能優化緊密相關的安全漏洞,著重強調在不斷提升大語言模型推理能力的進程中,務必將隱私和安全問題擺在優先考量的重要位置。

鏈接:

https://arxiv.org/abs/2411.18191

3. 評估并提高大語言模型生成的安全攻擊探測器的魯棒性

簡介:大語言模型(LLMs)在軟件開發領域的應用日益廣泛,常被用于生成諸如攻擊探測器這類實現安全需求的功能。但大語言模型在生成精確代碼方面存在困難,這使得在實際應用場景中,其生成的攻擊探測器會遺漏一些廣為人知的攻擊類型。究其原因,很可能是大語言模型對部分現有攻擊缺乏足夠認知,并且生成的代碼也未曾在實際使用情境下接受評估。

為此,研究者創新性地提出一種新方法,將檢索增強生成(RAG)技術與自排序技術整合到大語言模型的工作流程之中。檢索增強生成借助引入外部知識源的方式,強化輸出結果的魯棒性。而自排序技術受自洽性概念的啟發,能夠生成多條推理路徑,并對這些路徑進行排序篩選,進而確定最具魯棒性的探測器。

研究者開展了廣泛的實證研究,重點針對大語言模型生成的用于檢測網絡安全領域中兩種常見注入攻擊 —— 跨站腳本攻擊(XSS)和 SQL 注入攻擊(SQLi)的代碼。研究結果表明,與基線相比,檢測性能得到了顯著提升,在跨站腳本攻擊和 SQL 注入攻擊檢測的 F2 分數方面,分別提升了多達 71 個百分點和 37 個百分點。

鏈接:

https://arxiv.org/abs/2411.18216

4. RTL-Breaker:評估大語言模型在硬件描述語言(HDL)代碼生成中抵御后門攻擊的安全性

簡介:大語言模型(LLMs)在硬件設計的代碼生成與補全任務中彰顯出了非凡的潛力。實際上,基于大語言模型的硬件描述語言(HDL)代碼生成,已然助力該行業更為高效地達成復雜設計,極大地削減了開發周期中所耗費的時間與精力。然而,伴隨對這種自動化手段依賴程度的與日俱增,嚴峻的安全風險也隨之而來。

需要著重指出的是,鑒于大語言模型需在海量代碼數據集上展開訓練,而這些代碼又大多取自公開的代碼庫,且往往未經過全面細致的驗證,因而大語言模型極易遭受所謂的數據投毒或后門攻擊。具體而言,攻擊者會將惡意代碼注入訓練數據之中,而這些惡意代碼極有可能被嵌入大語言模型所生成的硬件描述語言(HDL)代碼里。如此一來,這一威脅因素便極有可能對整個硬件系統的安全與完整性造成損害。

在本項工作中,研究者精心打造了 RTL-Breaker,這是一款專門針對基于大語言模型的硬件描述語言(HDL)代碼生成的全新后門攻擊框架。RTL-Breaker 深入剖析了這一全新問題的關鍵要點:其一,深入探究各種觸發機制以及它們在插入惡意修改時的有效性;其二,全面考量一般情況下后門攻擊對代碼生成所產生的副作用,也就是對代碼質量造成的影響。RTL-Breaker 著重強調了當下迫切需要實施更為強有力的舉措,以有效防范此類攻擊。基于此,研究者將所構建的框架以及所有相關數據進行了開源處理。

鏈接:

https://arxiv.org/abs/2411.17569

5. PEFTGuard:檢測針對參數高效微調的后門攻擊

簡介:微調對于提升大語言模型(LLMs)在特定領域的性能而言,是極為關鍵的一個過程。在眾多微調方式里,參數高效微調(PEFT)憑借其借助集成低秩適配器來削減計算需求的獨特優勢,正變得愈發流行。像低秩適配器(LoRA)這類輕量級適配器,能夠在開源平臺上實現共享與使用。然而,攻擊者可能會利用這一機制向這些適配器中植入后門,進而引發諸如輸出錯誤信息或者產生有害結果等惡意行為,給相關群體帶來了極為嚴重的安全隱患。遺憾的是,當前專門針對分析這些適配器中的后門模式,或者檢測其中后門程序的研究寥寥無幾。

為了彌補這一研究領域的空白,研究者率先構建了(并且即將對外發布)PADBench。這是一套全面且系統的基準測試集,其中涵蓋了 13300 個適配器,這些適配器通過使用不同的數據集、攻擊策略、參數高效微調方法以及大語言模型進行微調,既有良性的,也有被植入后門的。不僅如此,研究者還創新性地提出了 PEFTGuard,這是全球首個專門針對基于參數高效微調的適配器所設計的后門檢測框架。在 PADBench 上開展的大量評估實驗結果清晰地表明,PEFTGuard 的性能表現顯著優于現有的各類檢測方法,在絕大多數情形下,其檢測準確率近乎完美,能夠達到 100%。尤其值得一提的是,PEFTGuard 在三個重要方面展現出了零樣本遷移能力,這三個方面分別是不同類型的攻擊、參數高效微調方法以及適配器的秩。此外,研究者還深入考量了各種自適應攻擊場景,以此充分證實 PEFTGuard 具備高度的魯棒性。研究者更進一步地探索了若干種可能用于緩解后門威脅的防御措施,最終發現精細混合是其中最為行之有效的方法。研究者由衷地期望,研究者所構建的基準測試集以及提出的檢測方法,能夠為未來大語言模型的后門檢測研究工作提供極具價值的思路與啟發。

鏈接:

https://arxiv.org/abs/2411.17453

6. CleanVul:利用大語言模型啟發式方法在代碼提交中進行自動的函數級漏洞檢測

簡介:對于系統完整性而言,準確識別軟件漏洞起著至關重要的作用。在訓練機器學習模型以檢測這些安全缺陷時,漏洞數據集是不可或缺的,其通常來源于美國國家漏洞數據庫(NVD)或者直接取自 GitHub。不過,這些數據集大多存在較高比例的噪聲,比例一般在 40% 到 75% 之間。這主要是由于在對漏洞修復提交(VFCs)里的所有變更進行標記時,采用了自動且無差別的方式,將其全部認定為與漏洞相關。而出現這種誤分類現象的原因在于,提交中用于修復漏洞的所有變更并非都與安全威脅存在關聯,其中許多變更僅僅是像錯誤修復或者測試改進這類常規性的更新。

本文首次提出了一種利用經過啟發式增強的大語言模型(LLM),從漏洞修復提交里自動識別出與修復漏洞相關變更的方法,該方法的 F1 分數達到了 0.82。研究者把名為 VulSifter 的工具應用于一項大規模研究當中,在這項研究里,研究者對 GitHub 上的 127,063 個存儲庫展開了爬取工作,最終收集到了 5,352,105 次提交。VulSifter 的運作原理是利用大語言模型來理解代碼語義以及上下文信息,同時借助啟發式方法將不相關的變更過濾掉。在此基礎上,研究者進一步開發出了 CleanVul,這是一個借助研究者的大語言模型啟發式增強方法構建而成的高質量數據集,其中包含 11,632 個函數,其準確性高達 90.6%,能夠與諸如 SVEN 和 PrimeVul 等現有的數據集相提并論。

為了對 CleanVul 數據集進行評估,研究者開展了一系列實驗,實驗重點是在 CleanVul 和其他高質量數據集上對多種大語言模型進行微調操作。評估結果表明,在 CleanVul 上經過微調的大語言模型不但具有更高的準確性,而且與在未清理數據集上訓練的模型相比,其泛化能力也更為出色。具體來講,在 CleanVul 上訓練后在 PrimeVul 上進行測試的模型所獲得的準確性,要高于僅在 PrimeVul 上訓練和測試的模型。

鏈接:

https://arxiv.org/abs/2411.17274

7. EnStack:一種用于增強源代碼漏洞檢測的大語言模型集成堆疊框架

簡介:軟件漏洞的自動檢測對提升安全性有著舉足輕重的地位,然而當下的既有方法在面對現代代碼庫的復雜性與多樣性時,常常顯得力不從心。在本文之中,研究者將向大家推介 EnStack,這是一個別出心裁的集成堆疊框架,其借助自然語言處理(NLP)技術來強化漏洞檢測的效能。

研究者的方法巧妙地整合了多個專為代碼理解而預訓練的大語言模型(LLMs),其中包括用于語義剖析的 CodeBERT、專注于結構呈現的 GraphCodeBERT,以及具備跨模態能力的 UniXcoder。在 Draper VDISC 數據集上對這些模型予以微調之后,再運用邏輯回歸、支持向量機(SVM)、隨機森林以及 XGBoost 等元分類器來整合它們的輸出結果,如此一來,EnStack 便能精準且高效地捕捉到那些單個模型可能疏忽遺漏的復雜代碼模式以及潛在漏洞。

這些元分類器將每個大語言模型的優勢加以匯聚融合,進而塑造出一個綜合性的模型,該模型在不同的編程環境下,針對那些細微且復雜的漏洞檢測工作展現出了卓越非凡的表現。實驗數據清晰地表明,EnStack 的性能相較于現有的方法有了極為顯著的提升,在準確率、精確率、召回率以及 F1 分數等關鍵指標上均取得了長足的進步。

這項研究工作充分彰顯了集成大語言模型方法在代碼分析任務里所蘊含的巨大潛力,同時也為運用自然語言處理技術來推動自動漏洞檢測工作的發展貢獻了極具價值的思路與見解。

鏈接:

https://arxiv.org/abs/2411.16561

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/62195.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/62195.shtml
英文地址,請注明出處:http://en.pswp.cn/web/62195.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

如何通過自學成長為一名后端開發工程師?

大家好,我是袁庭新。最近,有星友向我提出了一個很好的問題:如何通過自學成為一名后端開發工程師? 為了解答這個疑問,我特意制作了一個視頻來詳細分享我的看法和建議。 戳鏈接:如何通過自學成長為一名后端開…

Linux---對緩沖區的簡單理解--第一個系統程序

前序: 首先先理解一下什么是回車與換行;回車和換行是兩個概念,它們不是一個東西; 回車:光標回到開始;換行:換到下一行; 如下圖: 行緩沖區 如何理解緩沖區問題? 可以認為&#xff0…

力扣每日一題-999. 可以被一步捕獲的棋子數

題目 給定一個 8 x 8 的棋盤,只有一個 白色的車,用字符 R 表示。棋盤上還可能存在白色的象 B 以及黑色的卒 p。空方塊用字符 . 表示。車可以按水平或豎直方向(上,下,左,右)移動任意個方格直到它…

多模態大型語言模型MM-1.5采用數據驅動的方法,通過不斷優化數據組合提高模型性能

多模態大型語言模型MM-1.5采用數據驅動的方法,通過不斷優化數據組合提高模型性能 MM-1.5模型的設計核心在于其數據驅動的方法,這意味著模型的性能在很大程度上取決于所使用的數據類型和組合。這種方法的實施細節可以從以下幾個方面來展開: …

[Python學習日記-70] 元類

[Python學習日記-70] 元類 簡介 什么是元類 關鍵字 class 創建類的流程分析 自定義元類控制類的創建 自定義元類控制類的調用 自定義元類的屬性查找 自定義元類的應用與練習 簡介 在上一篇章當中我們已經了解了面向對象的各種內置函數了,本篇我們將講述“元類…

數據結構題庫11

第五章 樹和二叉樹 一、單項選擇題 1.關于二叉樹的下列說法正確的是 (1)。 (1):A.二叉樹的度為2 B.二叉樹的度可以小于2 C.每一個結點的度都為2 D.至少有一個結點的度為 2.設深度為h(h>0)的二…

【學習路線】Java

Java基礎 基礎 基礎語法 面向對象 集合框架 JCF 進階 并發編程 JVM 企業級開發 框架 Spring Boot Spring Cloud 分布式 高性能 高可用 安全 基建 Docker 實戰 數據庫 MySQL Redis 計算機基礎 計算機組成原理 操作系統 計算機網絡 數據結構與算法 設計模式 參考:…

學生公寓智能限電系統的功能和作用

學生公寓智能限電系統?是一種用于管理和限制學生公寓用電的設備和技術,旨在確保用電安全、防止火災事故,并促進節能減排。以下是關于學生公寓智能限電系統的詳細介紹: 1、功能和作用 智能限電系統通過以下功能來管理和限制用電&#xff1a…

【開發語言】層次狀態機(HSM)介紹

層次狀態機(Hierarchical State Machine, HSM),從基本原理、結構設計、實現方法以及如何結合 Qt 進行具體實現等方面進行分析。 1. 層次狀態機的基本原理 層次狀態機是一種用于管理復雜系統行為的狀態機模型,它通過將狀態組織成…

MYSQL PARTITIONING分區操作和性能測試

PARTITION OR NOT PARTITION IN MYSQl Bill Karwin says “In most circumstances, you’re better off using indexes instead of partitioning as your main method of query optimization.” According to RICK JAMES: “It is so tempting to believe that PARTITIONing wi…

深入解析 Loss 減少方式:mean和sum的區別及其在大語言模型中的應用 (中英雙語)

深入解析 Loss 減少方式:mean 和 sum 的區別及其在大語言模型中的應用 在訓練大語言模型(Large Language Models, LLM)時,損失函數(Loss Function)的處理方式對模型的性能和優化過程有顯著影響。本文以 re…

基于 AutoFlow 快速搭建基于 TiDB 向量搜索的本地知識庫問答機器人

導讀 本文將詳細介紹如何通過 PingCAP 開源項目 AutoFlow 實現快速搭建基于 TiDB 的本地知識庫問答機器人。如果提前準備好 Docker、TiDB 環境,整個搭建過程估計在 10 分鐘左右即可完成,無須開發任何代碼。 文中使用一篇 TiDB 文檔作為本地數據源作為示…

生信技能63 - 構建gnomAD變異位點的SQLite查詢數據庫

將數據量巨大的gnomAD數據庫,通過SQLite數據庫尋找gnomAD中存在的各種變異注釋信息(如等位基因計數,深度,次要等位基因頻率等),查詢300.000個變量的查詢需要大約40秒,通過染色體編號+位置+REF+ALT即可進行快速查詢。 1. gnomAD變異注釋VCF文件字段 gnomAD VCF各版本包…

【前端】將vue的方法掛載到window上供全局使用,也方便跟原生js做交互

【前端】將vue的方法掛載到window上供全局使用&#xff0c;也方便跟原生js做交互 <template><div><el-button click"start">調用方法</el-button></div> </template> <script> // import { JScallbackProc } from ./JScal…

基于XML的AOP開發

AOP 為 Aspect Oriented Programming 的縮寫&#xff0c;意思為面向切面編程。 AOP相關術語&#xff1a; 目標對象(Target)&#xff1a; 你要去代理的對象&#xff0c;可以理解為之前很單純的那個對象。 代理對象(Proxy)&#xff1a; 你把你那個單純的對象給我&#xff0c…

記錄blender學習過程中遇到的問題

物體發射的方向不對 被發射物體&#xff08;例如一棵樹&#xff09;n鍵看旋轉歸0 切換正視圖 將被發射物體的局部坐標的Z軸 指向 全局方向的X軸時 并且把粒子系統設置的物體旋轉勾選上 方向就對了 做倒角發現有問題 檢查縮放應用、面朝向、有沒有重合點&#xff08;融合點&am…

Ubuntu系統中Redis的安裝步驟及服務配置

目錄 內容概括 系統環境 安裝方式 1、apt包管理器安裝 &#xff08;1&#xff09;安裝redis服務 &#xff08;2&#xff09;安裝客戶端&#xff08;進入命令行操作使用&#xff0c;包含redis-cli&#xff09; &#xff08;3&#xff09;安裝檢驗 &#xff08;4&#xf…

半導體設備中的微型導軌應如何選擇合適的潤滑油?

微型導軌的潤滑對于保證其高精度和高穩定性至關重要&#xff0c;尤其是在半導體設備中&#xff0c;微型導軌的潤滑油選擇需要考慮多個因素&#xff0c;以確保設備的最佳性能和壽命。以下是一些關鍵點&#xff1a; 1、黏度&#xff1a;潤滑油的黏度是影響其流動性和潤滑效果的重…

RocketMq詳解:六、RocketMq的負載均衡機制

上一章&#xff1a;《SpringBootAop實現RocketMq的冪等》 文章目錄 1.背景1.1 什么是負載均衡1.2 負載均衡的意義 2.RocketMQ消息消費2.1 消息的流轉過程2.2 Consumer消費消息的流程 3.RocketMq的負載均衡策略3.1 Broker負載均衡3.2 Producer發送消息負載均衡3.3 消費端的負載均…