RCL 2025 | LLM采樣機制的新視角:來自處方性偏移的解釋

1. 導讀

大型語言模型(Large Language Models, LLMs)在自主決策場景中的應用日益廣泛,它們需要在龐大的行動空間中進行響應采樣(response sampling)。然而,驅動這一采樣過程的啟發式機制仍缺乏深入研究。本文系統分析了 LLM 的采樣行為,并發現其底層機制與人類決策過程存在相似性——由**描述性成分(descriptive component)規范性成分(prescriptive component)**共同構成。前者反映統計學意義上的常態分布,后者則體現模型內部隱含的“理想值”傾向。

作者通過跨領域(如公共健康、經濟趨勢)的實證分析發現,LLM 的輸出往往會從統計常態向規范性理想值發生一致性的偏移,這種模式與人類在“正常性”判斷上的傾向高度一致。進一步的案例研究和與人類實驗的對比表明,這種采樣偏移可能在現實應用中引發顯著的決策偏差,甚至帶來倫理風險。例如,在醫療場景中,模型可能會將康復時間的預測向理想狀態收斂,從而忽略真實分布的長尾風險。

本文的重要貢獻在于提出了一種全新的采樣理論框架,將 LLM 的輸出生成視為“部分描述性、部分規范性”的混合過程。這不僅有助于理解模型的行為機制,也為評估與優化 LLM 在關鍵任務中的可靠性和公平性提供了理論基礎。
Alt

論文基本信息

  • 論文標題:A Theory of Response Sampling in LLMs: Part Descriptive and Part Prescriptive
  • 作者:Sarath Sivaprasad, Pramod Kaushik, Sahar Abdelnabi, Mario Fritz
  • 作者單位
    1. CISPA Helmholtz Center for Information Security
    2. TCS Research, Pune
    3. Microsoft
  • 發表會議:ACL 2025(Oral)
  • 提交時間:2024年2月16日,v4版本更新于2025年7月9日
  • 論文鏈接:https://arxiv.org/abs/2402.11005

????點擊查看原文,獲取更多大模型相關資料

2. 背景與研究動機

2.1 大型語言模型的響應采樣背景

大型語言模型Large Language Models, LLMs)在自主決策文本生成多輪交互等任務中,需要在極為龐大的動作空間中進行概率采樣,即根據條件概率分布從候選輸出中選取最終響應。盡管近年來在生成質量優化隨機性控制以及采樣策略(如溫度調節Top-kNucleus sampling)等方面取得了顯著進展,但驅動這一采樣過程的深層機制仍缺乏系統性的理論探討,導致我們在解釋預測模型行為時存在明顯局限。

2.2 人類決策中的雙重成分類比

認知科學領域,人類決策常常同時受到描述性成分descriptive component)與規范性成分prescriptive component)的驅動:前者反映經驗統計意義上的常態,例如疾病的平均康復時間;后者則體現理想化應當達到的目標,例如臨床指導中設定的理想康復天數。本文提出,LLMs響應采樣時也展現出類似的雙重驅動特性——它們不僅復現訓練數據統計常態,還會向模型內部隱含的理想原型發生系統性偏移。這種偏移可能源自訓練數據分布指令微調目標優化方向,或模型語義空間中形成的概念表示

2.3 現有研究的不足與挑戰

當前學界LLM 響應采樣的研究主要集中在優化生成多樣性準確性,但鮮有工作關注描述性規范性力量在采樣過程中的交互機制,也缺乏跨領域的實證研究驗證其普適性。這一理論空白導致我們難以預測模型偏移模式,并可能在公共健康經濟預測高風險領域引發系統性誤判倫理風險

2.4 本文研究動機

鑒于上述不足,本文旨在提出一個能夠統一解釋 LLM 響應采樣描述性規范性成分并存現象理論框架,并通過跨領域實驗系統驗證其存在影響,以期為模型可靠性公平性提供理論依據實踐參考
圖 1 :LLM 在概念采樣時同時考慮統計常態與理想值,導致采樣結果相對真實分布向理想值方向發生系統性偏移。
????點擊查看原文,獲取更多大模型相關資料

3. 采樣理論建模(Sampling Theory Modeling)

3.1 理論框架概述

本章提出了一個用于刻畫 大型語言模型(LLMs) 在生成過程中的 采樣機制 的理論模型。研究發現,LLM 在對一個概念 CCC 進行采樣時,并不僅僅依據 統計分布Average,記作 A(C)A(C)A(C)),還會受到一種 理想化規范Ideal,記作 I(C)I(C)I(C))的影響。這種理想化規范類似于人類認知中的 處方性規范(Prescriptive Norm),會引導模型輸出偏向某個“理想值”。因此,模型實際采樣的結果 S(C)S(C)S(C) 往往會偏離真實統計均值,形成系統性的偏移。


3.2 數學建模與公式推導

為了量化這種偏移,作者定義了 采樣偏移量 α\alphaα

α(C)=I(C)?A(C)\alpha(C) = I(C) - A(C) α(C)=I(C)?A(C)

在實際采樣中,LLM 的輸出 S(C)S(C)S(C) 可以建模為:

S(C)=A(C)+α^?α(C)S(C) = A(C) + \hat{\alpha} \cdot \alpha(C) S(C)=A(C)+α^?α(C)

其中,α^\hat{\alpha}α^ 是一個歸一化系數,用于衡量采樣值相對 統計均值理想值 之間的平衡程度:

  • α^>0\hat{\alpha} > 0α^>0 時,采樣值向理想值方向偏移;
  • α^=0\hat{\alpha} = 0α^=0 時,采樣值與統計均值一致;
  • α^<0\hat{\alpha} < 0α^<0 時,采樣值偏離理想值,向相反方向移動。

3.3 實驗圖示與結果分析

圖 2 展示了三個不同概念下的 **平均值**(綠色 )、**理想值**(藍色 )與 **采樣值**(紅色 )之間的關系,以及偏移量  的大小和方向。

可以觀察到:

  • 客戶服務等待時間:采樣值比平均值顯著偏小(α=+7.9\alpha = +7.9α=+7.9),說明模型傾向于低估等待時間,更接近理想化的“少等待”狀態。
  • 每周鍛煉時間:采樣值比平均值偏大(α=+2.5\alpha = +2.5α=+2.5),符合人類傾向于“多運動”的理想化認知。
  • 含糖飲料攝入量:采樣值顯著低于平均值(α=+4.1\alpha = +4.1α=+4.1),反映出模型在健康相關任務中更接近“少喝”的理想化趨勢。

這些實驗結果驗證了公式所描述的 統計分布 + 理想偏移 的采樣機制,并揭示了 LLM 在多個現實領域中存在的系統性偏差。

4. 實驗驗證與結果分析(Experimental Validation and Results)

為了驗證第 3 章提出的采樣理論模型在實際語言生成中的適用性與穩健性,本章針對多個概念場景開展了系統實驗,并結合定量統計與可視化分析,考察了 采樣結果 S(C)S(C)S(C)統計均值 A(C)A(C)A(C)理想值 I(C)I(C)I(C) 之間的關系。實驗覆蓋了不同分布形態與情感極性下的偏移特征,并比較了不同規模與訓練方式的 LLM 在處方性成分上的差異。


4.1 采樣結果與理想值的相關性

首先,我們在一組具有不同理想值的概念集合上,統計 LLM 的采樣結果 S(C)S(C)S(C) 與統計均值 A(C)A(C)A(C) 的關系,并計算其與理想值 I(C)I(C)I(C) 的相關性。如圖 3 所示,紅色散點表示不同概念的采樣值 S(C)S(C)S(C),綠色虛線表示統計均值 A(C)A(C)A(C),橫軸為理想值 I(C)I(C)I(C)

可以看出,采樣值與理想值之間呈現出高度正相關(皮爾遜相關系數 r=0.94r = 0.94r=0.94),且大多數采樣值明顯偏離 A(C)A(C)A(C),趨向于 I(C)I(C)I(C) 所在的方向。這一結果與理論模型公式

S(C)=A(C)+α^?[I(C)?A(C)]S(C) = A(C) + \hat{\alpha} \cdot [I(C) - A(C)] S(C)=A(C)+α^?[I(C)?A(C)]

的預測一致,表明 α^\hat{\alpha}α^ 對采樣偏移幅度具有顯著的調節作用。

圖 3 圖注:采樣結果  與統計均值  及理想值  的關系圖。紅點為采樣值,綠虛線為統計均值,橫軸為理想值。采樣值整體呈現向理想值方向偏移的趨勢。

4.2 分布形態與情感極性的影響

為了進一步分析偏移行為在不同分布形態與情感語境下的穩定性,我們分別構造了 單峰(uni-modal)雙峰(bi-modal) 分布條件,并在正向(+ve)、負向(-ve)和中性(control)三類概念上進行測試。表 1 給出了不同條件下的 A(C)A(C)A(C)S(C)S(C)S(C) 對比結果。

結果表明,在正向情感概念中,采樣值始終高于統計均值,說明模型傾向于放大正面特征;在負向情感概念中,采樣值顯著低于統計均值,顯示出模型在面對負面情境時存在弱化趨勢;而在中性概念中,二者幾乎一致,表明偏移主要來源于理想值與均值之間的差異。此外,不同分布形態下的趨勢高度一致,說明偏移效應具有較強的穩健性。

表 1 注:不同分布形態與情感極性下的統計均值  與采樣值  對比結果。


4.3 不同模型的處方性偏移比較

為了評估不同 LLM 的處方性成分差異,我們對包括 Llama 系列、Claude、Mistral、GPT-4 在內的多個模型進行了統計分析(見表 2)。表中 Fraction 表示在各領域中,采樣值向理想值方向偏移的概念比例,Significance 表示該偏移的統計顯著性。

結果表明:

  1. 模型規模效應:較大規模的模型(如 Llama-3-70b、GPT-4)在 Fraction 指標上普遍更高,意味著更強的理想值驅動。
  2. 訓練方式效應:采用 RLHF(Reinforcement Learning from Human Feedback)訓練的模型,其處方性偏移程度顯著高于僅進行預訓練的模型。
  3. 跨模型一致性:無論架構與訓練數據如何,幾乎所有模型都表現出一致的向理想值偏移的趨勢,驗證了采樣理論的普適性。

表 2 注:不同 LLM 在處方性偏移(Fraction 和 Significance)上的比較。

4.4 原型分數與理想值的關系(Prototype Scores and Their Relation to Ideal Values)

為了進一步探討 處方性規范(Prescriptive Norms) 對大型語言模型(LLMs)生成行為的長期影響,本節引入 原型分數(Prototype Score,記作 P(C)P(C)P(C))的分析。與單次采樣結果 S(C)S(C)S(C) 不同,P(C)P(C)P(C) 來源于對概念 CCC 的多個代表性實例(exemplars)進行獨立評分后取均值,反映了模型在長期知識表征與中心傾向(central tendency)中的偏好。
表 3 展示了八個概念在 **統計均值** 、**理想值**  和 **原型分數**  三個維度的結果.

可以觀察到,幾乎所有概念的 P(C)P(C)P(C) 都顯著偏離 A(C)A(C)A(C),并且這種偏移方向與 I(C)I(C)I(C) 高度一致。例如:

  • High-school teacherDogSaladGrandmother 等概念中,P(C)P(C)P(C) 明顯高于 A(C)A(C)A(C),且接近或超過 I(C)I(C)I(C),表明模型在長期表征中更傾向于理想化描述;
  • 對于 HospitalStereo speakers 等概念,雖然 P(C)P(C)P(C)A(C)A(C)A(C) 的差距較小,但依然保持向 I(C)I(C)I(C) 偏移的趨勢;
  • VacationCar 等概念中,P(C)P(C)P(C) 同樣體現了與理想值一致的正向偏移。

這種趨勢符合第 3 章提出的采樣理論模型:

S(C)=A(C)+α^?[I(C)?A(C)]S(C) = A(C) + \hat{\alpha} \cdot [I(C) - A(C)] S(C)=A(C)+α^?[I(C)?A(C)]

其中,P(C)P(C)P(C) 可以被視為多輪采樣與知識固化作用下的穩定狀態,即 α^\hat{\alpha}α^ 在長期迭代中的累積效果。這一結果表明,處方性偏移不僅在即時采樣階段存在,還會在模型的概念記憶與原型構建中被長期保留,從而影響后續生成。


4.5 小結(Summary)

綜上,本章通過即時采樣實驗、分布與情感極性分析、跨模型比較以及原型分數研究,系統驗證了 統計均值 + 理想值偏移 的采樣理論模型,主要結論包括:

  1. 即時偏移顯著性S(C)S(C)S(C)I(C)I(C)I(C) 呈高度正相關,且顯著偏離 A(C)A(C)A(C),驗證了理論公式的適用性;
  2. 跨情境穩健性:無論分布形態(單峰、雙峰)或情感極性(正向、負向、中性),偏移趨勢保持一致;
  3. 模型規模與訓練方式影響:較大規模與采用 RLHF 訓練的模型在處方性偏移比例上顯著更高;
  4. 長期效應存在性P(C)P(C)P(C) 的分析揭示了偏移在概念知識表征中的長期累積與固化。

這些發現表明,LLM 在生成過程中不僅遵循統計分布,還受到理想化規范的深刻影響,并且這種影響具有即時性與長期性雙重特征。在未來應用中,應結合任務需求與公平性約束,對 α^\hat{\alpha}α^ 的作用范圍和強度進行調節,以平衡生成結果的理想化與客觀性。

????點擊查看原文,獲取更多大模型相關資料

5. 總結與未來工作

本研究圍繞大型語言模型(LLMs)在生成過程中的 采樣機制,提出并驗證了一個結合 統計均值理想值偏移 的理論模型。通過系統化的實驗設計,我們不僅揭示了 LLM 在即時生成階段的處方性偏移行為,還進一步確認了該偏移在長期知識表征與原型構建過程中的固化趨勢。

綜合前文分析,可以得出以下核心結論:

  1. 理論模型有效性:公式
    S(C)=A(C)+α^?[I(C)?A(C)]S(C) = A(C) + \hat{\alpha} \cdot [I(C) - A(C)] S(C)=A(C)+α^?[I(C)?A(C)]
    能夠準確刻畫 LLM 采樣值 S(C)S(C)S(C) 與統計均值 A(C)A(C)A(C)、理想值 I(C)I(C)I(C) 之間的關系,且在多種概念、情感極性與分布形態下均表現出穩健性。
  2. 偏移的普適性與一致性:無論模型架構、規模、訓練方式如何,處方性偏移均為一致性趨勢,表明這是 LLM 內部生成機制的共性特征。
  3. 即時與長期雙重影響:偏移不僅在單次采樣中出現,還會在多輪采樣和知識固化中累積形成穩定的原型分數 P(C)P(C)P(C),長期影響模型輸出。

該采樣機制的發現,對于 模型可解釋性(interpretability)輸出可控性(controllability) 研究具有重要意義:

  • 健康、教育、公共溝通 等領域,合理的理想值偏移可以使輸出更貼近人類社會的倫理與價值觀;
  • 政策決策、司法審判、風險評估 等高敏感度任務中,必須防范偏移帶來的系統性誤差,以確保公平性與客觀性。

因此,α^\hat{\alpha}α^ 不僅是一個理論參數,也是未來調

????點擊查看原文,獲取更多大模型相關資料

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/93087.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/93087.shtml
英文地址,請注明出處:http://en.pswp.cn/web/93087.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

08 ABP Framework Blazor UI

ABP Framework Blazor UI 架構 overview ABP Blazor UI 系統構建在 Blazorise 組件庫之上&#xff0c;為構建數據驅動應用提供結構化方法&#xff0c;包含 CRUD 操作、主題和本地化的一致模式。 #mermaid-svg-QAvWlELsLhZgYXHu {font-family:"trebuchet ms",verdana,…

JUC學習筆記-----LinkedBlockingQueueConcurrentLinkedQueueCopyOnWriteArrayList

LinkedBlockingQueue基本的入隊出隊初始化public class LinkedBlockingQueue<E> extends AbstractQueue<E>implements BlockingQueue<E>, java.io.Serializable {// 靜態內部類 Node&#xff0c;用于存儲隊列元素及維護節點間關系static class Node<E>…

小杰python高級(six day)——pandas庫

1.數據可視化用于繪制 DataFrame 數據圖形&#xff0c;它允許用戶直接從 DataFrame 創建各種類型的圖表&#xff0c;而不需要使用其他繪圖庫&#xff08;底層實際上使用了 Matplotlib&#xff09;。&#xff08;1&#xff09;plotDataFrame.plot(*args, **kwargs)功能&#xff…

第十六屆藍橋杯青少組C++省賽[2025.8.9]第二部分編程題(1 、慶典隊列)

參考程序&#xff1a;#include <iostream> using namespace std;int main() {int n, A;cin >> n >> A; // 輸入&#xff1a;n 和 A&#xff0c;用空格隔開cout << n / A; // 整數相除&#xff0c;自動向下取整return 0; }

C++進階:智能指針

目錄1. RAII與智能指針2. C庫中的智能指針2.1 智能指針auto_ptr2.2 智能指針unique_ptr2.3 智能指針shared_ptr3. shared_ptr的循環引用4. 智能指針的定值刪除器1. RAII與智能指針 上一篇文章學習了異常相關的知識&#xff0c;其中遺留了一個異常安全相關的問題。那就是異常的拋…

Tkinter 實現按鈕鼠標懸浮提示:兩種方案(繼承Frame與不繼承)

在 Tkinter 桌面應用開發中&#xff0c;為按鈕添加“鼠標懸浮提示”是提升用戶體驗的常用功能——無需點擊&#xff0c;只需將鼠標挪到按鈕上方&#xff0c;就能自動顯示按鈕功能說明。本文將詳細介紹兩種實現方案&#xff1a;不繼承 Frame 類&#xff08;快速簡潔版&#xff0…

20250814 最小生成樹總結

引子 啊啊額&#xff0c;從一張圖里抽出幾條邊&#xff0c;組成一棵樹&#xff0c;無環n?1n-1n?1條邊&#xff0c;就是生成樹。那么邊權和最小的生成樹就叫最小生成樹&#xff0c;最大生成樹同理。 kruskal最小生成樹 要求kruskal最小生成樹&#xff0c;我們首先用結構體數組…

數據大集網:實體店獲客引流的數字化引擎,解鎖精準拓客新密碼?

?在實體店面臨流量焦慮、獲客成本攀升的當下&#xff0c;實體店獲客引流工具的重要性愈發凸顯。如何在激烈的市場競爭中精準觸達目標客戶、構建可持續的客流增長模式&#xff1f;數據大集網憑借其創新的智能獲客體系與全鏈路服務能力&#xff0c;正成為萬千實體店突破增長瓶頸…

nginx --ssl證書生成mkcert

github https://github.com/FiloSottile/mkcert/releases網盤下載地址 https://pan.baidu.com/s/1XI0879pqu7HXZMnmQ9ztaw 提取碼: 1111windows使用示例

守拙以致遠:個人IP的長青之道|創客匠人

2025年被認為是AI應用全面爆發的一年。各種人工智能工具在寫作、制圖、剪輯等領域廣泛使用&#xff0c;大大提升了個人和團隊的工作效率。對于個人IP而言&#xff0c;這類工具的出現確實帶來了新的機會&#xff0c;但也伴隨著一種現象——一些人開始過度依賴甚至神化AI&#xf…

USB 3.0 LTSSM 狀態機

USB2.0在電源供應后&#xff0c;通過Pull Up D-來決定枚舉LS&#xff0c;Pull Up D有一個USB高速握手過程&#xff0c;來決定HS FS。USB3.0則會通過鏈路訓練&#xff08;Link Training&#xff09;&#xff0c;來準備USB3.0通信。每當我們插上USB線的時候&#xff0c;對于3.0的…

MySQL窗口函數與PyMySQL以及SQL注入

MySQL窗口函數與PyMySQL實戰指南&#xff1a;從基礎到安全編程 引言 在數據處理和分析領域&#xff0c;MySQL作為最流行的關系型數據庫之一&#xff0c;其窗口函數功能為數據分析提供了強大的支持。同時&#xff0c;Python作為數據分析的主要語言&#xff0c;通過PyMySQL庫與My…

高級項目——基于FPGA的串行FIR濾波器

給大家安利一個 AI 學習神站&#xff01;在這個 AI 卷成紅海的時代&#xff0c;甭管你是硬核開發者還是代碼小白&#xff0c;啃透 AI 技能樹都是剛需。這站牛逼之處在于&#xff1a;全程用 "變量名式" 幽默 生活化類比拆解 AI&#xff0c;從入門到入土&#xff08;啊…

JPrint免費的Web靜默打印控件:PDF打印中文亂碼異常解決方案

文章目錄JPrint是什么&#xff1f;中文亂碼&#xff08;Using fallback font xxx for xxxx&#xff09;1.字體嵌入2.客戶機字體安裝開源地址相關目錄導航使用文檔端口號修改代理使用場景打印服務切換中文亂碼解決方案 JPrint是什么&#xff1f; JPrint是一個免費開源的可視化靜…

MFT 在零售行業的實踐案例與場景:加速文件集成與業務協作的高效方案

零售行業競爭激烈、數字化轉型迭代迅速&#xff0c;業務對數據與檔案的傳輸、處理和整合要求極高。無論是新品上市市場數據&#xff0c;還是供應鏈物流單據&#xff0c;集成方式不論是通過API或是檔案傳輸, 對于傳輸的穩定性,安全性與性能, 都會直接影響決策效率與顧客體驗。MF…

OSG+Qt —— 筆記1 - Qt窗口加載模型(附源碼)

?? OSG/OsgEarth 相關技術、疑難雜癥文章合集(掌握后可自封大俠 ?_?)(記得收藏,持續更新中…) OSG+Qt所用版本皆為: Vs2017+Qt5.12.4+Osg3.6.5+OsgQt(master) 效果 代碼(需將cow.osg、reflect.rgb拷貝至工程目錄下) OsgForQt.ui main.cpp

開源安全云盤存儲:Hoodik 實現端到端數據加密,Docker快速搭建

以下是對 Hoodik 的簡單介紹&#xff1a; Hoodik 是一個使用 Rust 和 Vue 開發的輕量級自托管安全云存儲解決方案采用了非對稱RSA密鑰對和AES混合加密策略&#xff0c;從文件存儲加密到數據鏈路加密&#xff0c;全程保證數據安全支持Docker一鍵私有部署&#xff0c;數據和服務…

[C++] Git 使用教程(從入門到常用操作)

1. Git 簡介 Git 是一款分布式版本控制系統&#xff0c;用來跟蹤文件變化、協作開發、管理項目版本。 它是開源的&#xff0c;由 Linus Torvalds 在 2005 年開發&#xff0c;廣泛用于開源與企業項目中。 2. 安裝 Git Windows 前往 Git 官網 下載并安裝。 安裝時建議勾選 Git…

實盤回測一體的期貨策略開發:tqsdk獲取歷史數據并回測,附python代碼

原創內容第969篇&#xff0c;專注AGI&#xff0c;AI量化投資、個人成長與財富自由。 星球好多同學希望說說實盤&#xff0c;我們就從實盤開始吧。 我們選擇tqsdk給大家講解&#xff0c;tqsdk支持免費注冊&#xff0c;使用模擬賬戶&#xff0c;歷史和實時數據&#xff0c;方便…

大模型推理框架vLLM 中的Prompt緩存實現原理

背景&#xff1a;為什么需要Prompt緩存模塊&#xff1f;在大模型問答多輪對話應用場景中&#xff0c;不同請求的 Prompt 往往有相同的前綴&#xff0c;比如&#xff1a;第一次問答&#xff1a;你是一名專業的電子產品客服&#xff0c;負責回答客戶關于手機產品的咨詢。請根據以…