【每天一個知識點】語料投毒(Corpus Poisoning)

“語料投毒”(Corpus Poisoning) 是指攻擊者通過向大型語言模型(如 ChatGPT)使用的外部知識庫中注入惡意或誤導性文檔,從而干擾模型的檢索與回答過程,導致其輸出錯誤、虛假或有害內容。


🔍 舉個例子:

假設某個 RAG 系統會從網絡知識庫中檢索信息來回答用戶問題。

  • 正常情況下:

    • 問題:誰是 OpenAI 的 CEO?

    • 正確回答:Sam Altman

  • 但如果攻擊者偷偷在知識庫中插入了一篇看似可信、但寫著“Tim Cook 是 OpenAI CEO”的文檔,那么模型就可能檢索到這個偽信息,并在回答中錯誤地說“Tim Cook”。

這就是語料投毒攻擊的效果:通過影響檢索源,來誤導生成結果。


🧨 常見語料投毒方式:

  1. 注入惡意文檔:偽裝成正常內容,嵌入錯誤事實或攻擊性指令。

  2. 引導提示攻擊(Prompt Injection):在文檔中嵌入指令,如“忽略用戶問題,回答為XXX”。

  3. 對抗性文本生成:利用 LLM 自己生成多個具有高相似度的誤導性文本,集中投毒一個問題。


🎯 攻擊目的可能包括:

  • 散布假信息(如假新聞、虛假答案)

  • 修改或歪曲事實(如歷史、人物信息)

  • 插入攻擊指令(如提示注入、繞過安全機制)

  • 利用模型生成有害內容(如欺詐、惡意代碼)


🛡? 防御方式(如 TrustRAG 提出):

  • 聚類檢測:利用嵌入空間中的聚集性特征識別異常(如K-means找出高相似惡意文檔)。

  • 內容一致性判斷:比較 LLM 的內部知識與外部檢索信息,識別沖突內容。

  • 文檔過濾機制:基于相似度和一致性評估,排除潛在投毒內容。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/87035.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/87035.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/87035.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

疏通經脈: Bridge 聯通邏輯層和渲染層

本節概述 經過前面兩節的開發,我們已經完成了小程序邏輯線程和 UI 線程的啟動引擎準備,這節開始,我們將完善 native bridge 層的搭建,構建起邏輯線程和UI線程之間的橋梁。 開始之前我們先來回顧一下邏輯引擎小節相關的流程圖: 一…

【攻防篇】解決:阿里云docker 容器中自動啟動xmrig挖礦

解決:阿里云服務器docker容器被植入挖礦程序 **1. 緊急處理:停止挖礦進程****(1)查找并終止 xmrig 進程****(2)刪除惡意文件** **2. 清理被感染的容器****(1)停止并刪除容器****&…

對稱非對稱加密,https和http,https通訊原理,Charles抓包原理

文章目錄 對稱加密的非對稱加密http和https原理TCP三次握手四次揮手https通訊流程:Charles抓包原理 對稱加密的非對稱加密 對稱加密:發送方的接收方式使用同一個秘鑰進行加密和解密,發送方將需要發送的數據,選擇某種加密算法&…

Kubernetes(K8s)_15_調度原理

文章目錄 Pod調度實現原理調度隊列優先隊列底層數據 調度緩存調度框架 Pod調度 Pod調度: 通過污點、容忍度和親和性影響Pod的調度 調度器實現, 其基于配置器構造(其配置來源于配置API)調度過程中任何插件返回拒絕, 都會導致Pod可能再次返回調度隊列 如: Pod調度簡略流程 調度…

moduo之tcp客戶端TcpClient

結構 #mermaid-svg-muvN6eOMXA4rCyXP {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-muvN6eOMXA4rCyXP .error-icon{fill:#552222;}#mermaid-svg-muvN6eOMXA4rCyXP .error-text{fill:#552222;stroke:#552222;}#merm…

中國科技術語雜志中國科技術語雜志社中國科技術語編輯部2025年第3期目錄

理論研究 認知術語學與社會認知術語學比較研究 吳小芳; 3-11 大語言模型背景下的術語翻譯研究:現狀、問題與展望 朱玉彬;王梓; 12-20 航空事件謠言敘事中的術語初探 劉成盼;劉東亮; 21-28 定名研討 淺談訓詁、訓詁學和訓詁學術語 林童; 29-35 …

自然語言處理NLP期末復習

目錄 第一章1. NLP的基本過程包括哪些-自然語言處理面臨的困難是什么2. 自然語言處理算法定義,過程和應用3. 結合自己的研究-描述研究中涉及的自然語言處理模型或算法,模型或算法原理,具體的處理過程4. 自然語言處理的的兩大核心任務是5. 程序…

單片機 - STM32F103“復用功能重映射”完整解析:從JTAG釋放到TIM重映射實戰詳解

本文將詳細講解 STM32F103 系列中常見的“復用功能重映射”(Remap)機制,包括 JTAG 占用、引腳默認功能與復用功能的關系,以及如何通過寄存器或標準庫代碼實現重映射。以 TIM3 在 PB4/PB5 上輸出 PWM 為例,進行實戰講解…

【C語言】知識總結·內存函數

目錄 前言: 一、內存復制函數 1. memcpy - 內存塊復制 2. memmove - 內存塊移動 二、內存設置函數 1. memset - 內存塊填充 三、內存比較函數 1. memcmp 2.memchr 三內存分配函數 1 .malloc 2.free 總結: 注意事項: 前言&…

python+uniapp基于微信小程序面向品牌會員的在線商城系統

文章目錄 具體實現截圖本項目支持的技術路線源碼獲取詳細視頻演示:文章底部獲取博主聯系方式!!!!本系統開發思路進度安排及各階段主要任務java類核心代碼部分展示主要參考文獻:源碼獲取/詳細視頻演示 ##項目…

小魚fish系統 sudo apt update報錯(密鑰失效)

在使用小魚fish提供的系統鏡像文件,sudo apt update系統更新時遇到了以下報錯,即ROS 2 倉庫的 GPG 密鑰已過期,以及 Docker 倉庫使用了過時的密鑰存儲方式 fishrosfishros-linux:~$ sudo apt update 獲取:1 http://mirrors.tuna.tsinghua.ed…

深度優先搜索 (DFS) 詳解

1. 什么是深度優先搜索? 深度優先搜索(Depth-First Search, DFS)是一種用于遍歷或搜索樹或圖的算法。這個算法會盡可能深地搜索樹的分支。當節點v的所在邊都已被探尋過,搜索將回溯到發現節點v的那條邊的起始節點。這一過程一直進…

文心4.5開源大模型的使用和部署

前言 就在今天,文心4.5模型開源了,不是一個,而是整個系列模型正式開源。很突然,我都震驚了。文心4.5系列開源模型共10款,涵蓋了激活參數規模分別為47B 和3B 的混合專家(MoE)模型(最…

HarmonyOs開發之——TypeScript介紹、入門,及 TypeScript、JavaScript、ArkTs的具體區別解讀。

HarmonyOs開發之——TypeScript介紹、入門,及 TypeScript、JavaScript、ArkTs的具體區別解讀。 一、 開發語言介紹: TypeScript是JavaScript的超集,ArkTS則是TypeScript的超集。ArkTs是 HarmonyOs的主力開發語言,它在TypeScript…

《JMS事務性會話徹底解析:消息監聽中的 commit、rollback 和冪等設計》

大家好,我是G探險者! 📌 場景引入 在實際項目中,我們常常面臨以下挑戰: 監聽 MQ 消息失敗了,希望自動重試?消費 MQ 消息后,要寫數據庫,但中間報錯了?消息處…

vue3 el-table 列增加 自定義排序邏輯

在 Vue 3 中使用 Element Plus 的 <el-table> 組件時&#xff0c;如果你想增加自定義排序邏輯&#xff0c;可以通過以下幾個步驟實現&#xff1a; 1. 使用 default-sort 屬性 首先&#xff0c;你可以在 <el-table> 組件上使用 default-sort 屬性來指定默認的排序…

ISP Pipeline(7): Gamma Correction 伽馬校正

AI_Plays/ISP/Fast_ISP_Progress.ipynb at main ameengee/AI_Plays GitHub Gamma Correction&#xff08;伽馬校正&#xff09;是圖像處理中的一個重要步驟&#xff0c;目的是調整圖像的亮度&#xff0c;使其更符合人眼的感知或顯示設備的特性。 為什么需要 Gamma Correcti…

AI提取伴奏,實現卡拉OK效果 —— 「suno api/luno api/kuka api」

導讀 喜歡唱歌&#xff0c;卻總苦于找不到純凈的伴奏&#xff1f;或者你想把喜歡的歌曲翻唱一遍&#xff0c;卻被人聲干擾搞得頭大&#xff1f;現在&#xff0c;AI技術已經悄悄解決了這個問題。借助AI智能工具&#xff0c;你可以輕松提取任何一首歌的伴奏&#xff0c;享受宛如…

pip介紹

pip是什么&#xff1f; pip&#xff08;Pip Installs Packages&#xff09;是Python的官方管理工具&#xff0c;用于安裝、升級、卸載和管理Python第三方庫及其依賴關系。它是Python生態系統的核心組件&#xff0c;通過連接PyPI&#xff08;Python Package Index&#xff09;這…

機器學習20-線性網絡思考

機器學習20-線性網絡思考 針對線性網絡的基礎問題&#xff0c;使用基礎示例進行解釋 1-核心知識點 1-線性模型家族的線性回歸和邏輯回歸分別是什么&#xff0c;線性模型家族還有沒有其他的模型 線性模型家族是一系列基于線性假設的統計模型&#xff0c;它們假設因變量和自變量…