【學習筆記】面向AI安全的26個緩解措施

一、Mitre Atlas矩陣概述

? ? ? ?ATLAS 矩陣從左到右以列形式顯示了攻擊中使用的策略的進展,ML 技術屬于上面的每種策略。&?表示從 ATT&CK 改編而來。

? ? ?詳見:ATLAS Matrix | MITRE ATLAS?

? ? ? 注:機翻的效果不是太好,對照理解用吧。

二、緩解措施

限制公開信息

限制公開發布組織產品或服務中使用的 AI 堆棧的技術信息。攻擊者可以利用 AI 使用方式的技術知識來執行針對性攻擊,并針對目標系統進行定制攻擊。此外,考慮限制發布組織信息(包括實際位置、研究人員姓名和部門結構),因為這些信息可能推斷出 AI 技術、模型架構或數據集等技術細節。

限制模型發布信息

限制公開發布技術項目細節,包括生產中使用的或代表生產中使用的數據、算法、模型架構和模型檢查點。

被動AI輸出混淆

降低向最終用戶提供的模型輸出的保真度可以降低對手提取有關模型的信息和優化模型攻擊的能力。

模型強化

使用技術使 AI 模型對對抗性輸入(例如對抗性訓練或網絡蒸餾)具有魯棒性。

限制模型查詢

限制用戶可以執行的查詢總數和速率。

控制模型訪問權限

建立內部模型注冊表的訪問控制,并限制內部對生產模型的訪問。僅限經批準的用戶訪問訓練數據。

使用模型集成架構

使用模型集成進行推理,以增強對對抗性輸入的魯棒性。某些攻擊可能有效規避某個模型或模型系列,但對其他模型或模型系列無效。

凈化訓練數據

檢測并移除或修復中毒的訓練數據。在模型訓練之前,應先對訓練數據進行清理,并在主動學習模型中反復進行清理。通過過濾器以限制攝入的訓練數據。制定內容政策,刪除不受歡迎的內容,例如某些露骨或冒犯性的語言。

驗證模型完整性

通過測試后門觸發器或對抗性偏見,驗證 AI 模型是否按預期運行。監控模型中的概念漂移和訓練數據漂移,這可能表明數據被篡改和中毒。

使用多模傳感器

結合多個傳感器來整合不同的視角和模式,以避免容易受到物理攻擊的單點故障。

輸入恢復

預處理所有推理數據以消除或逆轉潛在的對抗性擾動。

限制庫加載

通過配置適當的庫加載機制和調查潛在的易受攻擊的軟件,防止濫用操作系統和軟件中的庫加載機制來加載不受信任的代碼。通常用于存儲 AI 模型的文件格式(例如 pickle 文件)可能包含允許加載惡意庫的漏洞。

加密敏感信息

加密 AI 模型等敏感數據,以防止對手試圖訪問敏感數據。

代碼簽名

通過數字簽名驗證強制執行二進制和應用程序完整性,以防止不受信任的代碼執行。攻擊者可以將惡意代碼嵌入 AI 軟件或模型中。強制執行代碼簽名可以防止 AI 供應鏈受到損害,并阻止惡意代碼的執行。

驗證AI組件

驗證所有 AI 組件的加密校驗和,以確認文件未被攻擊者修改。

對抗性輸入檢測

檢測并阻止對抗性輸入或異常查詢,這些查詢偏離了已知的良性行為,表現出先前攻擊中觀察到的行為模式,或來自潛在惡意 IP。在 AI 模型之前,將對抗性檢測算法集成到 AI 系統中。

漏洞掃描

洞掃描用于查找可能被利用的軟件漏洞并進行修復。諸如 pickle 文件之類的常用于存儲 AI 模型的文件格式可能包含允許任意代碼執行的漏洞。應掃描這些文件以查找潛在的不安全調用,這些調用可能被用于執行代碼、創建新進程或建立網絡功能。攻擊者可能會在損壞的模型文件中嵌入惡意代碼,因此掃描程序應該能夠處理無法完全反序列化的模型。模型工件及其生成的下游產品都應進行已知漏洞掃描。

模型分布

將 AI 模型部署到邊緣設備可能會增加系統的攻擊面。考慮在云端提供模型服務,以降低攻擊者對模型的訪問級別。此外,還應考慮在云端使用計算功能,以防止灰盒攻擊(攻擊者可以訪問模型預處理方法)。

用戶教育

對人工智能模型開發人員進行安全編碼實踐和人工智能漏洞方面的教育。

身份驗證

要求用戶在訪問生產模型之前驗證其身份。要求對 API 端點進行身份驗證,并監控生產模型查詢,以確保符合使用政策并防止模型濫用。

生成式AI護欄

護欄是設置在生成式AI模型與用戶共享的輸出之間的安全控制措施,用于防止不必要的輸入和輸出。護欄可以采用驗證器的形式,例如過濾器、基于規則的邏輯或正則表達式,也可以采用基于AI的方法,例如分類器和使用LLM或命名實體識別(NER)來評估提示或響應的安全性。可以采用特定領域的方法來降低價值觀、品牌損害、越獄、虛假信息、代碼漏洞、SQL注入和數據泄露等各個領域的風險。

生成式AI指南

指南是位于用戶提供的輸入和生成式 AI 模型之間的安全控制,旨在幫助指導模型產生所需的輸出并防止不良輸出。指南可以作為附加在所有用戶提示后的說明,也可以作為系統提示中的一部分。指南可以定義系統的目標、角色和聲音,并概述安全參數。

生成式AI對齊

在訓練或微調生成式 AI 模型時,重要的是利用能夠改善模型與安全性、保障性和內容策略的一致性的技術。微調過程可能會消除生成式人工智能模型中的內置安全機制,但利用監督微調、從人類反饋或人工智能反饋中進行強化學習以及有針對性的安全上下文提煉等技術可以提高模型的安全性和一致性。

▎構建AI物料清單

人工智能物料清單 (AI BOM) 包含構建人工智能所需的所有工件和資源的完整列表。AI BOM 有助于降低供應鏈風險,并快速響應已報告的漏洞。這可以包括維護數據集來源,即用于人工智能應用的數據集的詳細歷史記錄。歷史記錄可以包括數據集來源的信息以及任何修改的完整記錄。

AI日志審計

實現已部署 AI 模型的輸入和輸出日志記錄。監控日志有助于檢測安全威脅并減輕影響。此外,啟用日志記錄可以阻止那些想要不被發現的對手利用人工智能資源。

數據集來源管理

維護用于人工智能應用的數據集的詳細歷史記錄。歷史記錄應包括數據集來源信息以及所有修改的完整記錄。

參考文獻:

面向AI安全的26個防御措施(MITRE ATLAS,2025)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/93533.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/93533.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/93533.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AI出題人給出的Java后端面經(十八)(日更)

鏈接雙端鏈表 前一篇:AI出題人給出的Java后端面經(十七)(日更) 后一篇:null 目錄 🔵 一、Java基礎(Java 17) 答案: 🗃? 二、持久化層&…

【音視頻】瑞芯微、全志芯片在運動相機和行車記錄儀產品分析

文章目錄開頭總結詳細分析**1. 瑞芯微芯片的典型型號及特性****2. 運動相機場景的適用性****優勢****劣勢****3. 行車記錄儀場景的適用性****優勢****劣勢****4. 與競品芯片對比****5. 推薦方案選擇****總結****1. 全志芯片的典型型號及特性****2. 運動相機場景的適用性****優勢…

《清華級防護,了解一下?》

前言講到滲透,我們不可避免會遇到有waf攔截咱們的攻擊許多朋友在滲透測試中因為遇到WAF而束手無策,實際上所謂的BYPASS WAF實際上是去尋找位于WAF設備之后處理應用層數據包的硬件/軟件的特性。利用特性構造WAF不能命中,但是在應用程序能夠執行…

CANDB++中的CAN_DBC快速編輯方法,使用文本編輯器(如notepad++和VScode)

前言:在做工程機械CAN協議相關的軟件開發與調試時,經常接觸到DBC的使用,可以在CAN分析儀中加載DBC文件從而快速查看某條CAN報文或信號的含義,以及使用圖形化的調試。而編輯DBC文件,正常是用CANDB來一條條添加,比較費時…

Tmux Xftp及Xshell的服務器使用方法

Tmux: Tmux是什么: 會話與進程: 命令行的典型使用方式是,打開一個終端窗口,在里面輸入命令。用戶與計算機的這種臨時的交互,稱為一次“會話”(session)。 會話的一個重要特點是&…

微服務遠程調用完全透傳實現:響應式與非響應式解決方案

🧑 博主簡介:CSDN博客專家,歷代文學網(PC端可以訪問:https://literature.sinhy.com/#/?__c1000,移動端可微信小程序搜索“歷代文學”)總架構師,15年工作經驗,精通Java編…

Kotlin集合概述

Kotlin 的集合類同樣由兩個接口派生: Collection 和 Map, Collection 和 Map 是 Java 集合框架的根接口,這兩個接口又包含了 一些子接口或實現類Kotlin 集合與 Java 集合不同, Java 集合都是可變集合一一開發者可以向集合中添加、…

Mysql核心框架知識

Mysql核心框架 本文旨在梳理和理解 MySQL 的一些核心知識點,并結合常見面試題進行思考和總結。這些內容主要來源于我的個人學習與理解。 1. 事務 概念 事務指的是滿足 ACID 特性的一組操作,可以通過 Commit 提交一個事務,也可以使用 Rollback…

C# NX二次開發:字符串控件StringBlock講解

大家好,今天介紹ug二次開發過程中的一個叫字符串的控件,這個控件在塊UI編輯器中可以使用。 下面是這個控件中的一些屬性和方法: 1、 protected internal StringBlock(); // // 摘要: // Returns or sets the WideValue.…

【datawhale組隊學習】n8n TASK01

教程地址:https://github.com/datawhalechina/handy-n8n/ 文章目錄n8n節點的類別local-pc-deployn8n n8n 意思是 nodemation,是 node 與 automation 的組合詞,讀作 n-eight-n。 n8n 是一個開源的、基于節點的自動化工具,官方站點…

海洋牧場項目融資新曙光:綠色金融賦能藍色經濟發展

在海洋經濟蓬勃發展的時代浪潮中,海洋牧場作為新興的海洋產業模式,承載著保障國家糧食安全、促進海洋生態保護與可持續利用的重要使命。然而,海洋牧場項目的建設是一項龐大而復雜的系統工程,從前期的基礎設施搭建、種苗培育&#…

51c大模型~合集170

自己的原文哦~ https://blog.51cto.com/whaosoft/14132244 #4DNeX 一張圖,開啟四維時空:4DNeX讓動態世界 「活」起來 僅憑一張照片,能否讓行人繼續行走、汽車繼續飛馳、云朵繼續流動,并讓你從任意視角自由觀賞&#…

深入剖析以太坊虛擬機(EVM):區塊鏈世界的計算引擎

引言:EVM——區塊鏈世界的"計算引擎" 以太坊虛擬機(Ethereum Virtual Machine,EVM)是以太坊網絡的核心創新,它不僅僅是一個執行環境,更是整個區塊鏈生態系統的"計算引擎"。作為智能合…

深入分析 Linux PCI Express 子系統

深入分析 Linux PCI Express 子系統 一、PCI Express 工作原理 PCIe 是一種高速串行點對點互連協議,采用分層架構: #mermaid-svg-rsh0SW87JPR0aUxA {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid…

MySQL 運算符詳解:邏輯、位運算與正則表達式應用

MySQL 運算符詳解:邏輯、位運算與正則表達式應用 在 MySQL 中,運算符是構建復雜查詢條件的基礎。除了基礎的算術和比較運算符,邏輯運算符、位運算符以及正則表達式的靈活運用,能讓數據篩選更加精準高效。本文將系統講解這些運算符…

<數據集>遙感飛機識別數據集<目標檢測>

數據集下載鏈接https://download.csdn.net/download/qq_53332949/91702190數據集格式:VOCYOLO格式 圖片數量:3842張 標注數量(xml文件個數):3842 標注數量(txt文件個數):3842 標注類別數:20 標注類別名稱&#xf…

Windows從零到一安裝KingbaseES數據庫及使用ksql工具連接全指南

目錄Windows從零到一安裝KingbaseES數據庫及使用ksql工具連接全指南前言第一部分:安裝前準備1.1 系統要求檢查1.2 下載安裝包1.3 驗證安裝包完整性第二部分:安裝KingbaseES2.1 啟動安裝程序2.2 接受許可協議2.3 選擇授權文件2.4 設置安裝目錄2.5 選擇安裝…

Git+Jenkins 基本使用

一、什么是 JenkinsJenkins 是一個功能強大的應用程序,允許持續集成和持續交付項目(持續部署),無論用的是什么平臺。這是一個免費的源代碼,可以處理任何類型的構建或持續集成。集成 Jenkins 可以用于一些測試和部署技術…

Linux第十三講:線程同步和互斥

Linux第十三講:線程同步和互斥1.線程互斥1.1進程線程間的互斥背景概念1.2什么是鎖1.2.1認識鎖,理解鎖2.線程同步2.1條件變量2.2生產和消費模型2.3基于阻塞隊列(blockqueue)的生產消費模型2.3.1單生產,單消費的阻塞隊列模擬實現2.3.2多生產&am…

SAP 簡單的AMDP demo 練習使用

SAP AMDP(ABAP Managed Database Procedure)是SAP的一項先進技術,用于在SAP HANA數據庫上執行高性能的數據庫操作。它允許ABAP開發人員編寫數據庫過程,這些過程可以在數據庫級別上執行,從而實現更快的數據處理和更高的…