一份全面「梳理LLM幻覺問題」的綜述

文章目錄

  • 一文全面梳理「LLM 幻覺問題」
    • 1. 幻覺的分類
    • 2. 幻覺的來源
      • 2.1 幻覺來自數據
      • 2.2 幻覺來自訓練
      • 2.3 幻覺來自生成/推理
    • 3. 幻覺的檢測
      • 3.1 事實性幻覺的檢測
      • 3.2 忠實性幻覺的檢測
    • 4. 幻覺的評估
    • 5. 幻覺的解決

一文全面梳理「LLM 幻覺問題」

相信大家在使用ChatGPT或者其他大模型時會遇到這樣的情況,模型答非所問甚至自相矛盾。

雖然大語言模型(LLMs)在各種下游任務中展示出了卓越的能力,在多個領域有廣泛應用,但存在著幻覺的問題:即生成與用戶輸入不符、與先前生成的內容矛盾或與已知世界知識不符的內容。

這種現象對LLMs在現實世界場景中的可靠性構成了重大挑戰。在準確率要求非常高的場景下幻覺是不可接受的,比如醫療領域、金融領域等。

目前在LLM幻覺問題上已經有無數的研究,比如關于幻覺的檢測、幻覺的評估基準分類、緩解幻覺的方法等。

今天我會結合幾篇有關LLM幻覺問題的綜述論文,來聊聊LLM幻覺的分類、檢測方法、評估和基準、減輕方法等。

傳送門:《一文讀懂:大語言模型LLM的幻覺問題》

最近的一篇是來自哈爾濱工業大學和華為的研究團隊,長達49頁,對有關LLM幻覺問題的最新進展來了一個全面而深入的概述。

這篇綜述(下文簡稱:綜述1)從LLM幻覺的創新分類方法出發,深入探究了可能導致幻覺的因素,并對檢測幻覺的方法和基準進行了概述。

在這里插入圖片描述

論文鏈接:https://arxiv.org/abs/2311.05232

在這里插入圖片描述

另外還有一篇綜述(下文簡稱:綜述2),來自騰訊AI實驗室和一些國內大學的研究團隊,綜述提出了LLM幻覺現象的分類法和評估基準,分析旨在減輕LLM幻覺的現有方法,并確定未來研究的潛在方向。

在這里插入圖片描述

論文鏈接:https://arxiv.org/pdf/2309.01219.pdf

還有一篇有關幻覺的論文(下文簡稱:論文1),對各種文本生成任務中的幻覺現象進行了新的分類,從而提供了理論分析、檢測方法和改進方法。

在這里插入圖片描述

論文鏈接:https://arxiv.org/pdf/2309.06794v1.pdf

1. 幻覺的分類

在綜述2中,將LLMs幻覺分為三種:輸入沖突幻覺上下文沖突幻覺事實沖突幻覺

  • 輸入沖突幻覺:是指生成的內容與用戶提供的輸入不符;
  • 上下文沖突幻覺:是指生成的內容與之前生成的信息相矛盾;
  • 事實沖突幻覺:是指生成的內容與已知的世界知識不符。

在這里插入圖片描述

在這里插入圖片描述

圖注:3種幻覺的定義

而在最新的綜述1中,將LLM幻覺分為兩種:事實型幻覺和忠實度幻覺。

在這里插入圖片描述

如上圖所示,左邊是事實型幻覺:當LLM被問到誰是第一個在月球上漫步的人時,LLM編了個人物出來,甚至還說得有模有樣。右邊是忠實度幻覺:LLM在看到這段新聞后,直接把年份概括錯了。

下圖是一張更為詳細的LLM幻覺種類圖,包括更為細致的分類:事實型幻覺包括事實不一致、事實捏造;忠實度幻覺又包括:指令-答案的不一致、文本不一致,以及邏輯不一致。

在這里插入圖片描述

總的來說,結合事實、上下文、輸入的不一致,幻覺的定義和分類上是相似的。

結合常見的下游任務,比如機器翻譯、問答系統、對話系統、文本摘要、LLM知識圖譜和視覺問答系統,論文1總結了典型的幻覺現象,如下表所示:

在這里插入圖片描述

2. 幻覺的來源

綜述2認為產生幻覺的主要原因有預訓練數據收集知識GAP大模型優化過程三個方面。

最新的綜述1也深入探討LLM產生幻覺的根本原因,主要分為三個關鍵方面:數據訓練推理

結合起來,我們具體來看下幻覺的來源:

2.1 幻覺來自數據

  • 預訓練數據:大模型的知識和能力主要來自與預訓練數據,如果預訓練數據使用了不完整或者過期的數據,那么就很可能導致知識的錯誤,從而引起幻覺現象。
  • 數據利用:LLMs 往往會捕捉到虛假的相關性,在回憶知識(尤其是長尾信息)和復雜推理場景中表現出困難,從而進一步加劇幻覺。

2.2 幻覺來自訓練

  • 預訓練階段:LLMs在這一階段學習通用表征并捕捉廣泛的知識,通常采用基于transformer的架構,在龐大的語料庫中進行因果語言建模。但是,固有的架構設計和研究人員所采用的特定訓練策略,可能會產生與幻覺相關的問題。
  • 對齊階段:一般涉及兩個主要過程,即監督微調和從人類反饋中強化學習(RLHF)。雖然對齊能顯著提高 LLM 響應的質量,但也會帶來產生幻覺的風險,主要分為兩方面:能力不對齊(Capability Misalignment)和信念不對齊(Belief Misalignment)。

2.3 幻覺來自生成/推理

經過預訓練和對齊后,解碼在體現 LLM 能力方面發揮著重要作用。然而,解碼策略的某些缺陷可能導致 LLM 出現幻覺。綜述1深入探討源于解碼過程的潛在原因,并強調兩個關鍵因素:

  • 解碼策略固有的隨機性(Inherent Sampling Randomness):比如采用采樣生成策略(如top-p和top-k)引入的隨機性也可能導致幻覺的產生。
  • 不完善的解碼表示(Imperfect Decoding Representation):在解碼階段,LLM 使用頂層表示法預測下一個標記。然而,頂層表示法也有其局限性,主要表現在兩個方面: 上下文關注不足(Insufficient Context Attention)和Softmax瓶頸(Softmax Bottleneck)。

3. 幻覺的檢測

檢測 LLM 中的幻覺對于確保生成內容的可靠性和可信度至關重要。傳統的衡量標準主要依賴于詞語重疊,無法區分可信內容和幻覺內容之間的細微差別。這樣的挑戰凸顯了為 LLM 幻覺量身定制更復雜的檢測方法的必要性。

鑒于這些幻覺的多樣性,檢測方法也相應地有所不同。

在綜述1中,全面介紹了針對事實性幻覺忠實性幻覺的主要幻覺檢測策略。

3.1 事實性幻覺的檢測

事實性幻覺的檢測方法:通常分為 “檢索外部事實”(Retrieve External Facts)和 “不確定性估計”(Uncertainty Estimation)。

檢索外部事實:為了有效地指出 LLM 輸出中的事實不準確之處,一種直觀的策略是將模型生成的內容與可靠的知識來源進行比較,如下圖 3 所示。
在這里插入圖片描述

雖然許多幻覺檢測方法都依賴外部知識源進行事實檢查,但有幾種方法可以在零資源環境下解決這一問題,從而無需檢索。

這些策略背后的基本前提是,LLM 幻覺的起源本質上與模型的不確定性有關。

因此,通過對模型生成的事實內容的不確定性進行估計,就可以檢測出幻覺。

不確定性估計的方法大致可分為兩種:基于內部狀態和** LLM 行為**,如圖 4 所示。前者的前提是可以訪問模型的內部狀態,而后者則適用于更受限制的環境,僅利用模型的可觀測行為來推斷其潛在的不確定性。

在這里插入圖片描述

3.2 忠實性幻覺的檢測

忠實性幻覺的檢測方法:主要側重于確保生成的內容與給定上下文保持一致,從而避免無關或矛盾輸出的潛在隱患。如下圖5探討在 LLM 生成中檢測不忠實的方法。

  • 基于事實度量:通過檢測生成內容與源內容之間的事實重疊度來評估忠實度。
  • 基于分類器的度量:利用經過訓練的分類器來區分生成內容與源內容之間的關聯程度。
  • 基于QA的度量方法:利用問題解答系統來驗證源內容與生成內容之間的信息一致性。
  • 不確定性估計:通過測量模型對其生成輸出的置信度來評估忠實度。
  • 基于prompt的度量方法:讓LLM充當評估者,通過特定的prompt策略來評估生成內容的忠實度。

在這里插入圖片描述

4. 幻覺的評估

針對不同類型的幻覺,采用的評估方式不一樣。

現有針對幻覺的工作,提出了各種基準來評估LLM中的幻覺,如下表5所示:

在這里插入圖片描述

現有的基準主要根據LLMs的兩種不同能力來評估幻覺:生成事實陳述或判別事實陳述與非事實陳述的能力。下表說明了這兩種評估形式的區別。

在這里插入圖片描述

  • Generation 生成式基準:將幻覺看作一種生成特征,類似于流暢度和連貫性,并對LLM生成的文本進行評估。例如,TruthfulQA用于評估大型模型對問題的回答的真實性,而FactScore則用于評估大型模型生成的個人傳記的事實準確性。

  • Discrimination 判別式基準:考察大型模型區分真實陳述和幻覺陳述的能力。具體來說,HaluEval要求模型確定狀態信息是否包含幻覺信息,而FACTOR則研究LLM是否更可能生成事實陳述而非非事實陳述。

在這些基準中,TruthfulQA是一種特殊的基準,兼具生成式和判別式兩種基準,提供了一個多項選擇的替代方案,以測試模型區分真實陳述的能力。

5. 幻覺的解決

論文1總結了五種解決幻覺的方法,具體如下圖所示:

在這里插入圖片描述

不同下游任務解決幻覺的方法不同,具體如下圖所示:

在這里插入圖片描述

在哈工大的綜述1中,全面回顧了當前減輕幻覺的方法,并根據幻覺成因對這些方法進行了系統分類。

具體來說,綜述1將重點放在解決與數據相關的幻覺、與訓練相關的幻覺和與推理相關的幻覺的方法上,每種方法都提供了量身定制的解決方案,以應對各自原因所固有的特定挑戰。

參考:
https://zhuanlan.zhihu.com/p/666278645
https://arxiv.org/abs/2311.05232
https://arxiv.org/abs/2309.01219
https://arxiv.org/abs/2309.06794v1

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/164053.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/164053.shtml
英文地址,請注明出處:http://en.pswp.cn/news/164053.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

vue3源碼

/*! Vue.js v2.6.14© 2014-2021 Evan YouReleased under the MIT License. */ (function (global, factory) { typeof exports ‘object’ && typeof module ! ‘undefined’ ? module.exports factory() : typeof define ‘function’ && define.am…

PC8259(CC-CV控制)同步降壓芯片5V/4.8A 輸出頻率可調 帶電流限制 QFN20封裝

概述 PC8259是一個同步降壓轉換器輸出電流為4.8A在9V至36V。外部關閉功能可以由邏輯電平控制以下拉COMP/EN引腳,然后進入待機模式。外部補償使反饋控制具有良好的線性以及具有靈活外部設計的負載調節。PC8259在CC(恒定輸出電流)模式或CV&…

python數據結構與算法-17_二叉查找樹

二叉查找樹(BST) 二叉樹的一種應用就是來實現堆,今天我們再看看用二叉查找樹(Binary Search Tree, BST)。 前面有章節說到了查找操作,包括線性查找、二分查找、哈希查找等,線性查找效率比較低,二分又要求必須是有序的序列&#x…

亞馬遜賣家不想被平臺限制,應如何脫離平臺,建立自己的跨境獨立站?

隨著跨境電商的快速發展,越來越多的賣家選擇在亞馬遜等電商平臺上銷售自己的產品。然而,這些平臺往往會限制賣家的經營行為,收取高額的傭金和費用,給賣家帶來了很大的壓力和風險。因此,一些賣家開始考慮脫離電商平臺&a…

Flink之狀態TTL機制內容詳解

1 狀態TTL機制 狀態的 TTL機制就是Flink提供的自動化刪除狀態中的過期數據,配置 TTL的 API可以做到對狀態中的數據進行冷熱數據分離,將熱數據一直保存在狀態存儲器中,將冷數據進行定期刪除. 1.1 API簡介 TTL常用API如下: API注解setTtl(Time.seconds(…))配置過期時長,當狀態…

Docker可視化管理界面工具Portainer安裝

Portainer是Docker容器管理界面工具,可以直觀的管理Docker。 部署也很簡單: 官方安裝文檔地址 1、創建數據卷 docker volume create portainer_data2、下載允許容器 docker run -d -p 8000:8000 -p 9443:9443 --name portainer --restartalways -v /v…

放棄無謂的「技術氛圍」幻想,準備戰斗

大型科技公司每年都招聘大量研發人才,這給了很多人一種錯覺,認為是「技術」導致了這些公司的成功,其實他們的成功是技術推動的市場戰略的成功,是市場需要某項服務,才需要研發人員夜以繼日的埋頭苦干。資本絕不會做虧本…

vue2 element el-transfer穿梭框組件支持拖拽及排序 已封裝,隨取隨用

項目場景: 項目中有個功能用到穿梭框組件,新版本需要支持穿梭框組件排序,由于element2版本中的穿梭框組件本身不支持排序功能 在此不僅需要支持隨意更換順序,還支持從一側拖拽至另一側,具體功能效果圖如下&#xff1…

為什么JSX只能在函數的返回語句中使用

JSX只能在函數的返回語句中使用,因為JSX本質上是一種聲明式的語法,用于描述React組件的結構和外觀。在函數的返回語句中使用JSX,可以將JSX表達式嵌入到組件的輸出中。 當我們編寫一個React組件時,我們通常需要定義一個Render函數…

消息中間件——RabbitMQ(五)快速入門生產者與消費者,SpringBoot整合RabbitMQ!

前言 本章我們來一次快速入門RabbitMQ——生產者與消費者。需要構建一個生產端與消費端的模型。什么意思呢?我們的生產者發送一條消息,投遞到RabbitMQ集群也就是Broker。 我們的消費端進行監聽RabbitMQ,當發現隊列中有消息后,就進…

森利威爾SL4010 升壓恒壓 12V升壓24V 12V升壓36V 12V升壓48V

在當今的電子設備中,電源管理系統的設計是非常重要的。為了保證設備的穩定運行,升壓和恒壓電源的應用已經成為不可或缺的一部分。在這篇文章中,我們將介紹森利威爾SL4010升壓恒壓電源,它可以實現12V升壓24V、12V升壓36V、12V升壓4…

c 在文本終端中顯示yuv圖片

把yuv422 轉為rgb32 &#xff0c;利用framebuffer 顯示 #include <stdio.h> #include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> #include <stdlib.h> #include <unistd.h> #include <sys/ioctl.h> #include <lin…

vue2.6源碼分析

vue相關文檔 vue-cli官方文檔 vuex官方文檔 vue-router 官方文檔 vue2.6源碼地址 如何調試源碼 package.json 添加了--sourcemap "scripts": {"dev": "rollup -w -c scripts/config.js --environment TARGET:web-full-dev --sourcemap" }新增…

linux apt update錯誤提示修復

錯誤提示&#xff1a; E: Release file for http://security.debian.org/dists/bullseye-security/InRelease is expired (invalid since 15d 14h 45min 26s). Updates for this repository will not be applied. E: Release file for http://ftp.jp.debian.org/debian/dists/b…

【Hello Go】Go語言并發編程

并發編程 概述基本概念go語言的并發優勢 goroutinegoroutine是什么創建goroutine如果主goroutine退出runtime包GoschedGoexitGOMAXPROCS channel無緩沖的channel有緩沖的channelrange和close單向channel 定時器TimerTicker Select超時 概述 基本概念 并行和并發概念 并行 &…

CVE-2023-6099:優卡特臉愛云一臉通智慧管理平臺SystemMng.ashx接口未授權漏洞復現

文章目錄 優卡特臉愛云一臉通智慧管理平臺未授權SystemMng.ashx接口漏洞復現&#xff08;CVE-2023-6099&#xff09; [附POC]0x01 前言0x02 漏洞描述0x03 影響版本0x04 漏洞環境0x05 漏洞復現1.訪問漏洞環境2.構造POC3.復現 0x06 修復建議 優卡特臉愛云一臉通智慧管理平臺未授權…

mysql字符串轉為數字的三種方法、字符串轉日期

隱式轉換 在MySQL中&#xff0c;使用0運算符可以將一個非數字的值隱式地轉換為數字。這在進行數學運算或比較操作時非常有用。 需要注意的是&#xff0c;在使用0進行隱式轉換時&#xff0c;MySQL會盡可能將字符串轉換為數字。如果字符串不能轉換為數字&#xff0c;則會返回0。…

【解決】HDFS JournalNode啟動慢問題排查

文章目錄 一. 問題描述二. 問題分析1. 排查機器性能2. DNS的問題 三. 問題解決 一句話&#xff1a;因為dns的問題導致journalnode啟動時很慢&#xff0c;通過修復dns對0.0.0.0域名解析&#xff0c;修復此問題。 一. 問題描述 從journalnode啟動到服務可用&#xff0c;完成RPC…

使用Python將圖片轉換為PDF

將圖片轉為 PDF 的主要原因之一是為了方便共享和傳輸。此外&#xff0c;將多張圖片合并成一個 PDF 文件還可以簡化文件管理。之前文章詳細介紹過如何使用第三方庫Spire.PDF for Python將PDF文件轉為圖片&#xff0c;那么本文介紹使用同樣工具在Python中實現圖片轉PDF文件的功能…

【OpenCV+OCR】計算機視覺:識別圖像驗證碼中指定顏色文字

文章目錄 1. 寫在前面2. 讀取驗證碼圖像3. 生成顏色掩碼4. 生成黑白結果圖5. OCR文字識別6. 測試結果 【作者主頁】&#xff1a;吳秋霖 【作者介紹】&#xff1a;Python領域優質創作者、阿里云博客專家、華為云享專家。長期致力于Python與爬蟲領域研究與開發工作&#xff01; 【…