第52期|GPTSecurity周報

圖片

GPTSecurity是一個涵蓋了前沿學術研究和實踐經驗分享的社區,集成了生成預訓練Transformer(GPT)、人工智能生成內容(AIGC)以及大語言模型(LLM)等安全領域應用的知識。在這里,您可以找到關于GPT/AIGC/LLM最新的研究論文、博客文章、實用的工具和預設指令(Prompts)。現為了更好地知悉近一周的貢獻內容,現總結如下。

Security Papers

1. 通過大語言模型從協議實現中推斷狀態機

簡介:狀態機在提高協議分析效率和發現漏洞方面至關重要。然而,傳統方法在分析網絡協議實現時存在覆蓋不足和處理復雜性困難的問題。研究人員提出了一種基于大語言模型(LLMs)的創新狀態機推斷方法,該方法通過文本嵌入技術分析協議代碼,并利用提示工程識別狀態機。評估結果顯示,該方法的準確率超過90%,顯著提高了代碼覆蓋率,為協議安全分析帶來了新的突破。

鏈接:

https://arxiv.org/pdf/2405.00393

2. HalluVault:一種新穎的邏輯編程輔助的變異測試框架,用于檢測大語言模型中的事實沖突幻覺

簡介:大語言模型(LLMs)在語言處理方面取得了重大突破,但仍面臨安全性、隱私和生成不準確信息的問題,即幻覺。其中,事實沖突幻覺(FCH)尤為棘手,因為LLMs生成的內容可能與既定事實相矛盾。研究人員提出了一種基于邏輯編程的方法,通過變異測試來檢測FCH。該方法從維基百科等來源收集數據,創建多樣化測試用例,并使用語義評估機制驗證LLMs的一致性。測試結果表明,幻覺率在24.7%到59.8%之間,這揭示了LLMs在處理時間概念、分布外知識和邏輯推理方面所面臨的挑戰。這強調了在社區內持續合作解決LLM幻覺問題的必要性。

鏈接:

https://arxiv.org/pdf/2405.00648

3. 代碼的LLM安全衛士

簡介:許多開發者依賴大語言模型(LLMs)來促進軟件開發。然而,這些模型在安全領域的表現能力有限。研究人員引入了LLMSecGuard,這是一個通過靜態代碼分析器與LLMs的協同作用來增強代碼安全性的框架。LLMSecGuard是開源的,旨在為實踐者提供比LLMs最初生成的代碼更安全的解決方案。它還對LLMs進行基準測試,提供關于這些模型不斷發展的安全特性的寶貴見解。

鏈接:

https://arxiv.org/pdf/2405.01103

4. 利用RAG驅動的精確性克服LLM在咖啡葉病治理中的挑戰

簡介:本研究提出了一個利用YOLOv8和檢索增強生成(RAG)技術的AI驅動精準農業系統,旨在解決影響卡納塔克邦咖啡生產部門的疾病挑戰。該系統結合目標檢測技術和語言模型,克服了大語言模型(LLMs)固有的限制,同時解決了LLMs中的幻覺問題,并引入動態疾病識別與補救策略。通過實時監控、數據集擴展和組織合作,該系統適應不同的農業環境,旨在實現可持續和環保的農業,減少對農藥的依賴,推動食品生產的可持續性和技術進步。

鏈接:

https://arxiv.org/pdf/2405.01310

5. 關于大語言模型在自動化程序修復中的應用的系統文獻綜述

簡介:自動化程序修復(APR)旨在通過大語言模型(LLMs)減少手動調試,從而提高軟件開發和維護的效率。本研究首次系統性地回顧了2020至2024年間LLMs在APR中的應用,分析了127篇相關論文,總結了LLMs的部署策略、特定修復場景,并討論了集成LLMs的關鍵問題。研究人員指出了未來研究的挑戰和指導方針,為APR領域的研究者提供了全面的研究成果和未來研究方向。

鏈接:

https://arxiv.org/pdf/2405.01466

6. 研究多輪LLM交互中的提示泄露效應和黑盒防御

簡介:本文研究了大語言模型(LLMs)在多輪交互中的提示泄露問題及其緩解策略。通過對不同領域中閉源和開源LLMs的分析,發現多輪交互中的平均攻擊成功率高達86.2%,某些模型如GPT-4和Claude-1.3的泄露率甚至達到99%。研究還發現,黑盒LLMs在不同領域的泄露易感性不同,例如Gemini在新聞領域比在醫療領域更容易泄露上下文知識。實驗評估了六種黑盒防御策略,包括RAG場景中的查詢重寫器。盡管提出了多層防御組合,黑盒LLMs的攻擊成功率仍為5.3%,顯示LLM安全性研究還有提升空間。

鏈接:

https://arxiv.org/pdf/2404.16251

編輯:小椰風

圖片

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/18210.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/18210.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/18210.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

萬界星空科技定制化MES系統幫助實現數字化生產

由于不同企業的生產流程、需求和目標各異,MES管理系統的個性化和定制化需求也不同。有些企業需要將MES管理系統與ERP等其他管理系統進行集成,以實現全面的信息共享和協同工作。有些企業需要將MES管理系統與SCADA等控制系統進行集成,以實現實時…

windows ollama 指定模型下載路徑

為Ollama指定模型的下載路徑 在Windows系統中&#xff0c;如果想為Ollama指定模型的下載路徑&#xff0c;可以通過設置環境變量來實現。以下是詳細的步驟&#xff1a; 確定默認下載路徑&#xff1a; 默認情況下&#xff0c;Ollama的模型可能會下載到C:\Users\<用戶名>…

qt 讀取圖片,相機 編譯目錄 實戰

目錄 查看相機個數 QPixmap讀取圖片失敗,用opencv代替: QPixmap讀取圖片失敗,用QFile代替:相對目錄OK,程序所在目錄

企業內網終端監控管理軟件有哪些?推薦4款企業終端監控管理軟件

企業內網終端監控管理軟件是一種專為企業內部網絡設計的安全與管理工具&#xff0c;旨在幫助企業管理、監控和保護其內部網絡中的各種終端設備&#xff0c;如個人電腦、筆記本、移動設備等。 這類軟件的主要功能包括但不限于以下幾個方面&#xff1a; 1&#xff0c;實時監控&a…

快消終端門店真實性新玩法:全流程校驗+多元認證多重保障

在某飲品企業會議室&#xff0c;氣氛凝重。城市經理一臉嚴肅地掃視著團隊成員&#xff0c;小李、小張和小陳等人在這銳利的目光下顯得有些局促不安。 城市經理沉聲開口&#xff1a;小李上報的“幸福超市”’新店在XX大街上并不存在。這是怎么回事&#xff1f; 小李支吾著回答…

為表格添加背景色:\rowcolor, \columncolor,\cellcolor

設置行的背景 \rowcolor 是 LaTeX 中用于設置表格行的背景色的命令。它可以使表格更加美觀和易于閱讀。rowcolor 命令通常與 colortbl 宏包一起使用。 語法如下&#xff1a; \rowcolor{<color>}其中 表示要設置的背景色&#xff0c;可以是預定義的顏色名稱&#xff08…

深入了解時間處理:當前時間顯示與格式化

新書上架~&#x1f447;全國包郵奧~ python實用小工具開發教程http://pythontoolsteach.com/3 歡迎關注我&#x1f446;&#xff0c;收藏下次不迷路┗|&#xff40;O′|┛ 嗷~~ 目錄 一、引言 二、顯示當前時間 1. 導入時間模塊 2. 使用time模塊獲取當前時間 3. 格式化當前…

阿趙UE引擎C++編程學習筆記——GameMode和生命周期

大家好&#xff0c;我是阿趙。 ??之前在介紹HelloWorld的時候&#xff0c;我們很創建了一個MyGameModeBase的c類&#xff0c;然后就可以在BeginPlay函數里面寫打印的HelloWorld。這一篇主要是說一下&#xff0c;GameMode究竟是一個什么東西&#xff0c;然后UE里面的生命周期是…

HashMap在Go與Java的底層實現與區別

在Java中 在Java中hash表的底層數據結構與擴容等已經是面試集合類問題中幾乎必問的點了。網上有對源碼的解析已經非常詳細了我們這里還是說說其底層實現。 基礎架構 public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable,…

簡單幾步構建設企業流媒體服務器

簡單幾步構建設企業流媒體服務器 在企業應用中&#xff0c;涉及到視頻服務時&#xff0c;直接的應用要求即是視頻的實時查看&#xff01;如果使用各大平臺的流媒體服務&#xff0c;對于針對設備的視頻服務&#xff0c;如IPC的各種應用場景&#xff0c;在這個卷的時代&#xff…

Cesium For Unity 在Unity中無法下載的問題

Unity 下載失敗&#xff0c;提供百度網盤“com.cesium.unity-1.10.0.tgz”下載鏈接 鏈接&#xff1a;https://pan.baidu.com/s/1PybXQ8EvkRofOKD6rSN66g?pwd1234 提取碼&#xff1a;1234 導入方法&#xff1a; 1.打開PackageManager;Window-PackageManager 2.在PackageMan…

從機械塵埃到智能星河:探索從工業心臟到AI大腦的世紀跨越(一點個人感想)...

全文預計1400字左右&#xff0c;預計閱讀需要8分鐘。 近期&#xff0c;人工智能領域呈現出前所未有的活躍景象&#xff0c;各類創新成果如雨后春筍般涌現&#xff0c;不僅推動了科技的邊界&#xff0c;也為全球經濟注入了新的活力。 這不&#xff0c;最近報道16家國內外企業在A…

優思學院:質量工程師必備技能清單,你具備了嗎?

想要了解質量工程師需要具備哪些技能和知識&#xff0c;最直接且實際的方法就是分析招聘廣告中的關鍵詞&#xff0c;這比道聽途說更加有效。為此&#xff0c;優思學院搜集了大量關于質量工程師職位的招聘信息&#xff0c;并為大家進行詳細分析。我們通常選擇中高級職位進行分析…

嵌入式C語言指針詳細解說

各位伙伴大家好,在實現操作系統的控制的時候,經常需要使用到指針,利用這次詳細分析一下指針的用法。 C語言指針真正精髓的地方在于指針可以進行加減法,這一點極大的提升了程序對指針使用的靈活性,同時也帶來了不小的學習負擔。正是因為C語言指針可運算,才奠定了如今C語言…

「Element-UI表頭添加帶Icon的提示信息」

一、封裝全局組件 &#x1f353; 注意&#xff1a;可以直接復制該文件 <!-- // 寫一個PromptMessage的組件&#xff0c;并全局注冊 --> <template><div class"tooltip"><el-tooltip effect"dark" placement"right">&l…

MySQL select for update 加鎖

背景 當多人操作同一個客戶下賬號的時候&#xff0c;希望順序執行&#xff0c;某個時刻只有一個人在操作&#xff1b;當然可以通過引入redis這種中間件實現&#xff0c;但考慮到并發不會很多&#xff0c;所以不想再引入別的中間件。 表結構 create table jiankunking_accoun…

基于Python flask的豆瓣電影數據分析可視化系統,功能多,LSTM算法+注意力機制實現情感分析,準確率高達85%

研究背景 隨著數字化時代的到來&#xff0c;電影產業正迎來新的發展機遇和挑戰。基于Python Flask的豆瓣電影數據分析可視化系統的研究背景凸顯了對電影數據的深度分析和情感挖掘的需求。該系統功能豐富&#xff0c;不僅實現了多樣化的數據分析功能&#xff0c;還結合了LSTM算…

2024/5/23 學習雜記

目錄 位運算與邏輯運算讀程序練習 在switchcase 語句中能否使用continue關鍵字&#xff1f;為什么&#xff1f; 為什么盡量不使用goto語句? void i與i i和i 哪個效率更高&#xff1f; 良好的條件比較語句風格 memcpy memset 位運算與邏輯運算讀程序練習 int x 3, y…

如何解決Redis緩存擊穿?

Redis緩存擊穿問題,也稱作熱點Key問題,通常發生在高并發場景下,當一個被高并發訪問且緩存重建業務較復雜的key突然失效時,大量請求會同時訪問數據庫,導致數據庫壓力瞬間增大。以下是解決Redis緩存擊穿問題的幾種方案: 使用鎖(互斥鎖): 原理:當緩存失效時,不是所有線…

CTF| 格式化字符串漏洞

格式化字符串漏洞是PWN題常見的考察點&#xff0c;僅次于棧溢出漏洞。漏洞原因&#xff1a;程序使用了格式化字符串作為參數&#xff0c;并且格式化字符串為用戶可控。其中觸發格式化字符串漏洞函數主要是printf、sprintf、fprintf、prin等C庫中print家族的函數 0x01 格式化字符…