研究人員發現:基于文本的AI模型容易受到改述攻擊

由于自然語言處理(NLP)的進步,越來越多的公司和組織開始利用AI算法來執行與文本相關的任務,例如:過濾垃圾郵件、分析社交媒體帖子和評論、評估簡歷以及檢測假新聞。

但是,真的可以相信這些算法能夠可靠地執行任務嗎?IBM,亞馬遜和德克薩斯大學的新研究證明:使用一些工具,可以攻擊文本分類算法并以潛在的惡意方式對模型進行操縱。

在斯坦福大學舉行的SysML AI大會上,研究人員展示了這項有關“改述”攻擊的研究。其具體做法是修改輸入文本,以便在不改變其實際意義的情況下通過AI算法對其進行不同的分類。

可以這樣簡單解釋“改述攻擊”是如何工作的:以使用AI算法來評估電子郵件的文本并將其歸類為“垃圾郵件”或“非垃圾郵件”為例,改述攻擊會修改垃圾郵件的內容,使得AI將其分類為“非垃圾郵件”。

針對文本模型的對抗性攻擊的挑戰

在過去幾年中,一些研究小組已經探討了對抗性攻擊的各種方法。修改輸入將會導致AI算法對圖像和音頻樣本進行錯誤分類,如通過對標題或描述的修改,讓一些少兒不宜的內容被分類到少兒頻道中,對未成年人造成危害。但是,攻擊文本模型比篡改計算機視覺和音頻識別算法要困難得多。

“對于音頻和圖像,人類完全可以自行區分。” 人工智能研究員兼語言模型專家Stephen Merity說。例如,在圖像分類算法中,人類可以逐步改變像素的顏色,并觀察這些修改如何影響模型的輸出。這可以幫助研究人員發現模型中的漏洞。

“可是文本攻擊更加困難,因為它是離散的。在一個句子中,你不能說我想要多加10%的‘dog’這個詞。大部分情況是:一句話中有‘dog’這個詞,模型可以把有這個詞的句子進行某一種歸類。而且我們還不能有效地搜索模型中的漏洞。”Merity說:“我們的想法是,能不能智能地找出機器的弱點,然后把它推到特定的位置?”

“對于圖像和音頻,做對抗性干擾是有意義的。但對于文本來說,即使你對文字做了一些小改動,比如只改動一兩句話,都可能導致這段話無法順利讀出來。”IBM的研究員兼研究論文的共同作者Pin-Yu Chen說。

過去關于對文本模型的對抗性攻擊的工作只涉及改變句子中的單個單詞。雖然這種方法成功地改變了AI算法的輸出,但它經常導致修改后的句子聽起來是人為的。Chen和他的同事們不僅關注詞語的改變,而且還關注改寫句子和以有意義的方式改變更長的序列。

“我們正在嘗試解釋單詞和句子,通過創建在語義上與目標句子類似的序列來為攻擊提供更大的空間。然后我們要看看模型是否將它們歸類為原始句子。”Chen說。

研究人員開發了一種算法,可以在句子中找到可以操縱NLP模型行為的最佳變化。“主要的困難是:要確保文本的修改版本在語義上與原始版本相似。我們開發了一種算法,可以在非常大的空間中搜索單詞和句子,這些修改將對AI模型的輸出產生最大的影響。在該空間中找到最佳對抗性示例非常耗時。該算法計算效率高,并且提供了理論上的保證,它是人們可以找到的最佳搜索。”IBM研究院科學家,該論文的另一位合著者Lingfei Wu說。

在他們的論文中,研究人員提供了改變情感分析算法、假新聞檢測器和垃圾郵件過濾器行為的修改示例。例如,在產品評論中,將“The pricing is also cheaper than some of the big name conglomerates out there(這定價比現在的一些知名企業定的也還要低些)”改為“The price is cheaper than some of the big names below(這價格比下面的一些巨頭便宜)”,句子所表達的情緒就會從100%正面變為100%負面。

人類無法感知的改述攻擊

改述攻擊成功的關鍵在于它們是人類難以察覺的,因為它們保留了原始文本的語境和意義。

“我們將原始段落和修改后的段落給了人類評估員,他們很難看到意義上的差異。但對于機器而言,它完全不同。“Wu說。

Merity指出:改述攻擊不需要與人類完全一致,特別是當他們沒有預料到機器人會篡改文本時。他進一步解釋道:“我們每天都會遇到錯誤的輸入,對我們來說,這些只是來自真人回復的不連貫的句子而已,以至于當人們看到拼寫錯誤時,并不會認為這是一個安全問題。但在不久的將來,它可能是我們必須應對的問題。”

Merity還指出,改述和對抗性攻擊將引發安全風險的新趨勢:“許多科技公司依靠自動化決策對內容進行分類,實際上并沒有涉及人與人之間的互動。這使得該過程容易受到此類攻擊。”Merity說:“改述攻擊或許會與數據泄露同時發生,除非我們將發現邏輯漏洞。”

例如,一個人可能會欺騙仇恨言語分類器來批準他們的非法言論,或利用簡歷處理模型中的釋義漏洞將他們的工作申請推送到列表的頂部。

Merity警告說:“這些類型的問題將成為這個時代新的威脅,我擔心這類攻擊恐怕不會引起企業重視,因為他們大都專注于自動化和可擴展性。”

改述攻擊并非都是壞事

研究人員還發現,通過逆轉改述攻擊可以構建更健壯、更準確的模型。

在生成模型錯誤分類的改述句子之后,開發人員可以使用修改后的句子及其正確的標簽來重新訓練他們的模型,這將使模型更具彈性,從而可以抵御改述攻擊。

Wu表示:“這是我們在這個項目中的驚人發現之一。最初,我們僅僅是從從穩健的角度出發。但后來,我們發現這種方法不僅可以提高穩健性,還可以提高泛化能力。如果不用來攻擊的話,改述其實是一種非常好的泛化工具,可以提高模型的能力。”

論文鏈接:

https://arxiv.org/abs/1812.00151

參考鏈接:

https://venturebeat.com/2019/04/01/text-based-ai-models-are-vulnerable-to-paraphrasing-attacks-researchers-find/

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/449014.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/449014.shtml
英文地址,請注明出處:http://en.pswp.cn/news/449014.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

解決 linux 下安裝 node 報: command not found

前些天發現了一個巨牛的人工智能學習網站,通俗易懂,風趣幽默,忍不住分享一下給大家。點擊跳轉到教程。 注意:有時安裝成功后,需要關閉xshell,重新啟動。nvm才會生效。 1. 在 linux 下安裝 node 提示 -bash: node: com…

阿里云官方網站免費套餐怎么搶

阿里云推出包含云服務器 ECS、負載均衡、云數據庫 RDS、云數據庫 Redis 版、云數據庫 Mongodb 版、彈性公網 IP、CDN、對象存儲 OSS、文件存儲 NAS等40核心云產品,6個月免費使用何為免費套餐,其實就是讓你先體驗,覺得好用,易用&am…

1003 我要通過

1003 我要通過! (20 分)“答案正確”是自動判題系統給出的最令人歡喜的回復。本題屬于 PAT 的“答案正確”大派送 —— 只要讀入的字符串滿足下列條件,系統就輸出“答案正確”,否則輸出“答案錯誤”。 得到“答案正確”的條件是: …

在英特爾? 凌動? 處理器上將 OpenGL* 游戲移植到 Android* (第一部分)

將游戲和其他使用大量 3D 圖形的應用從 OpenGL 標準移植到 Google Android 設備(包括構建在英特爾 凌動? 微架構上的設備)存在巨大的機遇,因為基于 OpenGL 的游戲、游戲引擎和其他傳統軟件易于獲得;OpenGL 便于移植;而…

文件系統:使用 yum 安裝軟件包

前些天發現了一個巨牛的人工智能學習網站,通俗易懂,風趣幽默,忍不住分享一下給大家。點擊跳轉到教程。 一、yum命令的基本安裝功能 [rootlocalhost ~]# man yum command is one of: * install package1 [package2] [...]: ins…

elasticsearch全局analyzer聲明

2019獨角獸企業重金招聘Python工程師標準>>> 問題 elasticsearch從2.4升級到5.6,elasticsearch.yml配置中有一些analyzer配置拷貝到新版本,啟動報錯 index :analysis :analyzer :lowercase_whitespace :type : customtokenizer : myTokenizer…

Parallels Desktop虛擬機無法關機提示“虛擬機處理器已被操作系統重置”

如果你在使用PD的時候遇到了這樣子的彈窗,恭喜你篇博文可以幫助你,因為我剛剛也遇到了這個問題。如果有幫助可以點一下推薦按鈕。 針對Windows電腦 啟動虛擬機創建快照使用管理員權限運行命令提示符執行powercfg -h off重啟試試成功了再刪除快照即可修改…

linux下安裝 ping 命令

前些天發現了一個巨牛的人工智能學習網站,通俗易懂,風趣幽默,忍不住分享一下給大家。點擊跳轉到教程。 使用docker倉庫下載的ubuntu 14.04 鏡像。里面精簡的連 ping 命令都沒有。google 百度都搜索不到ping 命令在哪個包里。 努力找了半天&…

揚尼斯定律:程序員的開發效率每6年提高一倍

我不斷的聽到各種關于“軟件危機”的警言,以及關于軟件開發缺少過程規范的批評。我做編程工作超過15年,我認為這些言論基本上都是錯的:我確信我能在很短的時間里用如今的開發工具復制出15年前一個不錯的程序員開發出的東西。 模仿摩爾定律和…

ApiBoot - ApiBoot Quartz 使用文檔

ApiBoot Quartz ApiBoot內部集成了Quartz,提供了數據庫方式、內存方式的進行任務的存儲,其中數據庫方式提供了分布式集群任務調度,任務自動平滑切換執行節點。 引用ApiBoot Quartz 在pom.xml配置文件內添加,如下配置: …

《算法競賽進階指南》0.4二分

102. 最佳牛圍欄 農夫約翰的農場由N塊田地組成,每塊地里都有一定數量的牛,其數量不會少于1頭,也不會超過2000頭。 約翰希望用圍欄將一部分連續的田地圍起來,并使得圍起來的區域內每塊地包含的牛的數量的平均值達到最大。 圍起區域內至少需要包…

Hibernate 自動創建表

前些天發現了一個巨牛的人工智能學習網站&#xff0c;通俗易懂&#xff0c;風趣幽默&#xff0c;忍不住分享一下給大家。點擊跳轉到教程。 1. 在 hibernate.cfg.xml 添加這句話&#xff0c;可以自動生成數據表 : <property name"hibernate.hbm2ddl.auto">upd…

程序員越老越優秀嗎?

Peter Knego 向我們展示了一些有趣的東西&#xff1a; 官方數據&#xff1a;程序員年紀越大越出色、越稀有。他使用StackOverflow的聲譽值和其它幾個指標來印證他的觀點。 他的總結是&#xff1a; 隨著年齡的增加&#xff0c;程序員的數量急劇下降。程序員數量的峰值出現在2…

小程序學習(一):點擊愛心變色 -- 最簡單的事件實現

最近在學習小程序&#xff0c;想通過寫文章來記錄自己的學習歷程&#xff0c;希望能做到每周都寫…… 如何綁定一個事件 微信小程序中&#xff0c;綁定事件要在標簽內寫入這兩段代碼&#xff1a; bindtap"fnActive" data-favourite "{{isLike}}" 復制代碼…

安全通信

安全通信 應用層協議大多數自己都沒有實現加解密功能&#xff0c;比如http等。http就是直接把數據加載進來然后做簡單編碼&#xff08;也就是流式化&#xff09;然后響應客戶端&#xff0c;然后數據在瀏覽器展示&#xff0c;這個數據在傳輸過程是明文的&#xff0c;你截獲就可以…

出現 java.lang.NullPointerException 的幾種原因、可能情況

前些天發現了一個巨牛的人工智能學習網站&#xff0c;通俗易懂&#xff0c;風趣幽默&#xff0c;忍不住分享一下給大家。點擊跳轉到教程。一般報 java.lang.NullPointerException的 原因有以下幾種&#xff1a;1. 字符串變量未初始化 。 2. 接口類型的對象沒有用具體的類初始化…

純JPA 入門小案例(2)

2019獨角獸企業重金招聘Python工程師標準>>> JPA中的主鍵生成策略 通過annotation&#xff08;注解&#xff09;來映射hibernate實體的,基于annotation的hibernate主鍵標識為Id, 其生成規則由GeneratedValue設定的.這里的id和GeneratedValue都是JPA的標準用法。 JPA…

spring IoC/DI

一、spring創建對象的三種方式&#xff1a;1、通過構造方法創建無參構造創建&#xff1a;默認情況有參構造創建&#xff1a;需要明確配置<constructor-arg>中配置index&#xff1a;參數索引name&#xff1a;參數名type&#xff1a;參數類型&#xff08;區分基本數據類型和…

并發不是并行,它更好!

原文鏈接&#xff0c;譯文鏈接&#xff0c;譯者&#xff1a;雷哥&#xff0c;饒命&#xff0c;校對&#xff1a;李任 現代社會是并行的&#xff1a;多核、網絡、云計算、用戶負載&#xff0c;并發技術對此有用。 Go語言支持并發&#xff0c;它提供了&#xff1a;并發執行&…

詳解設計模式在Spring中的應用

設計模式作為工作學習中的枕邊書&#xff0c;卻時常處于勤說不用的尷尬境地&#xff0c;也不是我們時常忘記&#xff0c;只是一直沒有記憶。 今天&#xff0c;在IT學習者網站就設計模式的內在價值做一番探討&#xff0c;并以spring為例進行講解&#xff0c;只有領略了其設計的思…