論文閱讀:User Behavior Simulation with Large Language Model-based Agents

https://dl.acm.org/doi/pdf/10.1145/3708985

https://www.doubao.com/chat/15495707526837250

Advances and Challenges in Foundation Agents–Memory調研

論文翻譯

基于大型語言模型代理的用戶行為模擬

摘要

在推薦系統、社交網絡等以人為中心的應用中,高質量的用戶行為數據模擬一直是一個基礎性且具有挑戰性的問題。用戶行為模擬的主要難點源于人類認知和決策過程的復雜機制。近年來,大量證據表明,通過學習海量的網絡知識,大型語言模型(LLMs)能夠具備類人智能和泛化能力。受此啟發,本文初步探索了在推薦領域使用大型語言模型進行用戶行為模擬的潛力。為了讓大型語言模型表現得像人類,我們設計了檔案、記憶和行動模塊來裝備它們,構建基于大型語言模型的代理以模擬真實用戶。為了實現不同代理之間的交互并觀察它們的行為模式,我們設計了一個沙盒環境,在該環境中,每個代理都可以與推薦系統進行交互,不同代理之間可以通過一對一聊天或一對多社交廣播與朋友交流。在實驗中,我們首先通過主觀和客觀評估來證明代理生成行為的可信度。然后,為了展示我們方法的潛在應用,我們模擬并研究了兩種社會現象:(1)信息繭房;(2)用戶從眾行為。我們發現,控制推薦算法的個性化程度和提高用戶社會關系的異質性可以作為緩解信息繭房問題的兩種有效策略,而用戶的從眾行為會受到其社會關系數量的顯著影響。為了推動這一方向的發展,我們已在https://github.com/RUC-GSAI/YuLan-Rec發布了我們的項目。

1 引言

以人為中心的人工智能(AI)致力于推動為人類服務的技術發展,在過去幾十年中引起了工業界和學術界的廣泛關注。用戶行為分析是以人為中心的人工智能的一個基本方面,尤其在推薦系統、社交網絡和搜索引擎等應用中。它旨在理解和推斷人類的偏好和行為模式,這對于優化用戶體驗和系統性能至關重要[1]。用戶行為分析的準確性在很大程度上依賴于高質量用戶數據的可用性。然而,嚴格的隱私法規(例如通用數據保護條例)和倫理擔憂極大地限制了數據共享的范圍。此外,多樣化和全面的數據集的有限可用性使得有效開發和評估推薦系統變得困難。這些挑戰需要替代方案來獲取用戶行為數據,特別是那些能夠在不違反隱私規范的情況下模擬現實場景的方案[2]。傳統的模擬策略,如數據驅動和模型驅動方法,存在明顯的局限性。數據驅動方法雖然具有適應性和準確性,但嚴重依賴于高質量的真實世界數據,引發了隱私和倫理方面的擔憂。另一方面,模型驅動方法需要復雜的規則定義,并且往往無法捕捉現實世界用戶行為的動態性和細微差別[3]。這些局限性凸顯了對創新模擬方法的需求,這些方法需要在適應性、可擴展性和真實性之間取得平衡。

近年來,大型語言模型(LLMs)憑借從多樣化的網絡數據中編碼的廣泛知識,已成為能夠理解和生成類人行為的強大工具[4]。這種獨特的能力使大型語言模型非常適合模擬用戶行為,特別是在需要主觀決策、動態交互模式和個性化偏好的場景中。與傳統方法不同,基于大型語言模型的模擬可以在不依賴敏感用戶數據的情況下運行,這使其成為推進隱私保護和可擴展用戶行為分析研究的一個有前景的方向。然而,將大型語言模型的能力轉移到模擬現實場景中的用戶行為并非易事。首先,用戶具有多樣化的偏好、個性和背景,這使得大型語言模型難以有效模擬不同的用戶角色。此外,現實世界中的用戶行為是動態互聯的,先前的行為會影響后續的行為。由于普通的大型語言模型擅長一次性的靜態任務,我們需要設計額外的模塊來增強它們處理動態行為的能力。

此外,現實世界場景中的用戶行為數量龐大,其中許多是瑣碎的,例如“吃早餐”或“刷牙”等日常活動,這些與推薦系統無關。模擬每一個用戶行為既不必要也不切實際,因此需要仔細考慮哪些行為應該優先模擬。除了這些單用戶挑戰之外,設計一個環境和執行協議來有效組織多個用戶之間的交互也需要大量的努力。

為了解決上述問題,我們提出了一種新穎的推薦模擬器,稱為RecAgent。從用戶角度來看,我們用一個基于大型語言模型的自主代理來模擬每個用戶,該代理由檔案模塊、記憶模塊和行動模塊組成。檔案模塊可以靈活高效地生成不同的代理檔案。記憶模塊旨在使用戶行為在動態環境中更加一致,用戶先前的行為可以存儲在記憶中,以影響他們后續的決策。在行動模塊中,我們不僅納入了用戶在推薦系統內的行為,如點擊和瀏覽項目,還考慮了朋友聊天和社交廣告等外部因素,以更全面地模擬用戶決策過程。通過整合所有這些模塊,我們旨在實現更一致、合理和可靠的用戶行為模擬。從系統角度來看,我們的模擬器最多包含1000個代理。這種配置在現實的大規模模擬需求與實際考慮(如與大型語言模型推理相關的計算時間和資源需求)之間取得了平衡。它以輪次方式執行。在每一輪中,代理根據其預定義的活動水平自主執行操作。為了促進人機協作,我們允許真實人類作為代理在模擬器中參與,并與推薦系統和其他代理進行交互。此外,還可以通過暫停模擬過程、修改代理檔案,然后重新運行模擬器來主動干預系統。這種干預對于研究緊急事件的影響、用戶反事實行為等方面可能是有益的。

與傳統的推薦模擬策略相比,我們的模擬器使用大型語言模型來捕捉用戶的決策過程。由于大型語言模型已經學習了全面的網絡知識,它們在模擬推薦系統(這是一種典型的網絡應用)方面可能更有效。此外,我們的模擬器不需要額外的數據來初始化模擬過程,這使得聯合模擬多個場景成為可能。然而,在傳統的模擬策略中[3],數據驅動方法更具適應性和準確性,但需要真實世界的數據來初始化模擬器,而模型驅動方法需要手動定義復雜的規則,這些規則不具有可擴展性和有效性。

為了評估我們模擬器的有效性,我們從代理和系統兩個角度進行了廣泛的實驗。從代理角度來看,我們首先關注記憶模塊的評估,因為它是驅動代理行為的關鍵。然后,我們對代理進行整體評估,研究它是否能夠產生可信的用戶行為。從系統角度來看,我們關注模擬效率的評估以及主動干預模擬器是否能產生預期的用戶行為。最后,我們通過使用模擬器研究兩種現象(1)信息繭房和(2)用戶從眾行為,展示了模擬器的應用。

總之,本文的主要貢獻可以總結如下:

我們開創了在推薦領域使用基于大型語言模型的代理進行用戶行為模擬的方向。

作為該方向的初步嘗試,我們設計了一個統一的代理框架和多代理環境來模擬真實用戶行為。

我們進行了廣泛的實驗,以證明我們的模擬器所模擬的用戶行為的可信度。

我們通過研究信息繭房和用戶從眾行為現象,展示了我們模擬器的潛力。

在這里插入圖片描述

3.1.2 記憶模塊

認知神經科學的最新進展[63]強調了人類記憶的三個關鍵組成部分:感覺記憶、短時記憶和長時記憶。感覺記憶直接從環境中獲取信息,并僅能保留幾百毫秒。在此期間,重要信息會被轉移到短時記憶,而不太重要的信息則會被丟棄。短時記憶起到橋梁作用,其中的信息可以通過反復接觸得到強化,并最終轉移到長時記憶中。長時記憶能長時間存儲信息,使人類能夠根據經驗做出決策并產生高級見解。為了準確模擬用戶行為,我們基于上述人類記憶機制設計了模擬器的記憶模塊,其詳細工作原理如圖2所示。下面,我們首先詳細介紹模擬器中的代理感覺記憶、短時記憶和長時記憶,然后說明它們如何協同工作以完成不同的記憶操作。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/95012.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/95012.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/95012.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于ECharts的智慧社區數據可視化

引言數據可視化是現代Web應用的重要組成部分,它能將復雜的數據以直觀的圖形方式呈現,幫助用戶快速理解數據背后的信息。本文將介紹如何使用ECharts庫實現智慧社區住戶數據的可視化展示,包括柱狀圖和餅圖兩種常見圖表類型的實現與優化。技術棧…

Qt 綜述:從基礎到一般應用

摘要: Qt,作為久經考驗的跨平臺C開發框架,以其強大的功能、豐富的類庫和靈活的機制,在桌面應用、嵌入式系統、網絡編程等領域占據重要地位。本文將深入解析Qt的核心技術體系,涵蓋基礎架構、核心機制、UI開發、外觀定制…

基于PyTorch一文講清楚損失函數與激活函數并配上詳細的圖文講解

PyTorch損失函數與激活函數 目錄 激活函數詳解損失函數詳解實戰案例性能優化技巧 激活函數詳解 1. 什么是激活函數? 激活函數是神經網絡中的關鍵組件,它決定了神經元是否應該被激活。沒有激活函數,神經網絡就只是線性變換的堆疊&#xf…

蒼穹外賣-Day1 | 環境搭建、nginx、git、令牌、登錄加密、接口文檔、Swagger

目錄 nginx: nginx反向代理和負載均衡概念 nginx反向代理和負載均衡如何配置? 后端環境:maven管理 sky-common sky-pojo sky-server: 后端環境搭建--Git進行版本控制 后端數據庫--Mysql 前后端聯調 前后端運行&#xf…

論文閱讀-ZeroDCE和ZeroDCE++

文章目錄1 概述2 模塊2.1 總體說明2.2 LE曲線(Light Enhance Curve)2.3 DCE-Net2.4 無監督損失2.4.1 空間一致性損失2.4.2 曝光控制損失2.4.3 顏色恒定損失2.4.4 照明平滑度損失2.5 ZeroDCE3 效果3.1 不同損失函數組合的效果3.2 參數設置影響3.3 訓練數據…

Web自動化技術選擇

我想學習自動化技術,我的訴求是: 1.我想做自動報社保功能,先從我們自己的系統里面下載Excel,然后自動登錄到社保局的系統,自動填寫Excel,自動上傳Excel。 2.可以自動的到社保局的系統里面查下數據&#xff…

【celeba】-數據集的介紹

CelebA 數據集在 MTCNN 中的使用 1 數據集結構 CelebA_副本/ ├── Anno/ │ ├── list_bbox_celeba.txt # 邊界框 │ ├── list_landmarks_celeba.txt # 5 關鍵點 │ ├── list_attr_celeba.txt # 40 屬性 │ └── identity_CelebA.txt …

解讀 GPT-5:從“博士級 AI 專家”能力到 OpenAI API Key 獲取與實踐(提示工程→性能調優全流程)

GPT-5深度解讀:一位“博士級專家”的誕生與思考第一部分:新范式——化繁為簡的統一智能體 OpenAI的GPT-5,遠不止是一次常規的模型升級。它的發布,標志著一種顛覆性的架構思想變革:從過去那個讓用戶在各種“Turbo”、“…

8.3.1 注冊服務中心Etcd

etcd是什么 etcd 是一個分布式鍵值對存儲,設計用來可靠而快速的保存關鍵數據并提供訪問。通過分布式鎖, leader選舉保障可靠的分布式協同。 etcd 特點 完全復制,集群中的每個節點均擁有全量數據 強一致性,etcd通過raft共識算法…

異或循環冗余

異或代碼CRC8-ITU例程比較計算CRC16異或改進測試重點代碼 def fun_crc(datas):crc 0xFF poly 0x07 for i in range(len(datas)):for j in range(7, -1, -1):if (crc & 0x80) 0x80: crc (crc << 1) ^ polyelse:crc (crc << 1)if (datas[i] & 2**j):#值…

一款輕量、免費、無廣告,強大的演示工具,支持屏幕放大、涂鴉、截圖、錄屏

軟件介紹 ZoomIt&#xff0c;是一款輕量、免費、無廣告&#xff0c;強大的演示工具&#xff0c;支持屏幕放大、涂鴉、截圖、錄屏等。在系統托盤中不顯示的運行&#xff0c;可自定義快捷鍵&#xff0c;使用方面。 軟件基礎功能 屏幕放大&#xff1a;按下快捷鍵“Ctrl1”可進入…

從街亭失守看管理

最近看了《三國演義》&#xff0c;重溫了街亭失守事件&#xff0c;從馬謖最耀眼的登場來看就是&#xff0c;火燒藤甲兵計策和諸葛亮不謀而合&#xff0c;說明馬謖確實是有真材實料的&#xff0c;但在守街亭的任務上&#xff0c;諸葛亮也躊躇過又對先帝的遺言“馬謖不可重用”記…

全面解析 URL 重定向原理:從協議、實現到安全實踐

一、什么是 URL 重定向&#xff1f; URL 重定向&#xff08;URL Redirection&#xff09;是 Web 技術中一種將用戶請求的 URL 自動轉向另一個目標 URL 的機制。用戶可能完全不會察覺跳轉發生&#xff0c;因為瀏覽器在幕后完成了一切。 重定向通常用于以下場景&#xff1a; 網…

多任務 Transformer 模型的高效任務間注意力

抽象 在計算機視覺和更廣泛的深度學習領域&#xff0c;Transformer 架構已被公認為許多應用程序的最先進技術。然而&#xff0c;對于多任務學習&#xff0c;與單任務模型相比&#xff0c;可能需要更多的查詢&#xff0c;考慮到實際的硬件限制&#xff0c;它的多頭注意力通常接近…

QT的常用控件說明

文章目錄基本的代碼的模板Label控件font字體相關Button 控件CheckBox 控件Radio控件ComboBox控件LineEdit 控件基本的代碼的模板 class MainWindow(QWidget):def __init__(self, *args, **kwargs):super().__init__(*args, **kwargs) # 調用父類初始化方法# 聲明窗口實例# 代…

5Python異常處理與模塊導入全指南

目錄 什么是異常&#xff1f; 異常的捕獲方法&#xff1a; 為什么要捕獲異常&#xff1f; 捕獲異常的語法&#xff1a; 異常的else和finally語法&#xff1a; 什么是異常&#xff1f; 異常就是程序運行過程中出現了錯誤&#xff0c;也就是我們常說的出bug了-。- 異常的捕…

區塊鏈密碼學簡介

區塊鏈密碼學簡介 一、對稱密碼算法 概述 對稱密碼算法的主要特點是使用相同的密鑰進行加密和解密。這類算法根據其加密方式大致可以分為兩類:流密碼和分組密碼。區塊鏈技術主要采用分組密碼。流密碼以數據流的形式逐位或逐字節加密,而分組密碼則將數據分成固定大小的塊進行…

GridKernalGateway

GridKernalGateway 是 Apache Ignite 架構中一個關鍵的安全與狀態管理組件&#xff0c;它的作用是 “在公共 API 和內部內核&#xff08;kernal&#xff09;之間建立安全、可控的訪問通道”。 我們可以把它理解為一個 “門衛 狀態哨兵”&#xff0c;確保外部調用不會在 Ignite…

MySQL索引、B+樹相關知識總結

MySQL索引、B樹相關知識匯總一、有一個查詢需求&#xff0c;MySQL中有兩個表&#xff0c;一個表1000W數據&#xff0c;另一個表只有幾千數據&#xff0c;要做一個關聯查詢&#xff0c;如何優化&#xff1f;1、為關聯字段建立索引2、小表驅動大表二、b樹和b樹的區別1、更高的查詢…

Java學習進階 -- 泛型的繼承和通配符及綜合練習

首先&#xff0c;泛型不具備繼承性&#xff0c;但是數據具備繼承性1.核心概念解析泛型不具備繼承性即使類型A是類型B的子類&#xff0c;Generic<A>也不是Generic<B>的子類這是Java泛型的類型安全設計&#xff0c;防止不安全的類型轉換數據具備繼承性泛型容器中的元…