【論文筆記】Multi-Agent Based Character Simulation for Story Writing

論文信息

論文標題: Multi-Agent Based Character Simulation for Story Writing - In2Writing 2025
論文作者: Tian Yu, Ken Shi, Zixin Zhao, Gerald Penn
論文鏈接: https://aclanthology.org/2025.in2writing-1.9/
論文領域: 故事生成,多智能體系統,角色模擬


研究背景

近年來,大型語言模型(LLMs)在文本連貫性和流暢性方面取得了顯著進展,研究者們開始將LLMs應用于自動故事生成和人機協作寫作任務。傳統的故事生成方法通常包含兩個階段:規劃階段(sequencing events)和生成階段(elaborating events into scenes)。然而,現有的LLM生成故事仍存在諸多問題,如缺乏趣味性(由于線性敘事結構)、角色不一致、邏輯矛盾等問題,論文通過分析 Dramatron 和 Agents Room 兩篇經典論文總結問題為以下三點:

  • 如何在保持敘事連貫性的同時,生成更具趣味性和非線性結構的故事?
  • 如何有效模擬故事中角色的行為,使其更加真實可信?
  • 如何將故事生成過程模塊化,以便更好地與人類作家協作?

創新點

論文提出的解決方案可總結為以下四點創新:

  1. 角色模擬策略:首次將fabula和syuzhet概念整合到一個統一的故事生成過程中
  2. 兩階段生成框架:將故事生成分解為角色扮演(role-play)和重寫(rewrite)兩個步驟
  3. 多智能體協作機制:引入導演智能體和角色智能體,實現更真實的角色模擬
  4. 人機協作設計:系統設計考慮了人類作家可以作為獨立智能體參與角色扮演過程

核心思想與方法論

該系統借鑒了敘事理論中的“故事時間”(syuzhet)和“事件時間”(fabula)概念 。

  • 事件時間 (Fabula): 指事件發生的原始、按時間順序排列的序列,是故事世界的底層敘事 。在論文的框架中,角色扮演步驟負責構建這個“事件時間” 。
  • 故事時間 (Syuzhet): 指故事最終呈現給讀者的順序,可以是非線性的,以增強戲劇效果和觀眾參與度 。重寫步驟則將角色扮演的中間結果重塑為最終的“故事時間”形式 。

該方法包含以下兩個主要步驟:

在這里插入圖片描述

角色扮演步驟 (Role-playing Step)

  • 目的: 模擬故事的“事件時間”(fabula),即事件的嚴格時間順序 。

  • 工作流程:

    1. 系統首先接收一個包含場景列表的輸入計劃 PpP_pPp?,該計劃指定了故事的呈現順序(故事時間,syuzhet)。
    2. 利用一個基于 LLM 的排序算法,將 PpP_pPp? 中的場景重新排列成嚴格按時間順序排列的角色扮演計劃 PcP_cPc?。類似地,場景內部的事件大綱 opo_pop? 也會被重新排序成時間大綱 oco_coc?
    3. 系統定義了兩種智能體:
      • 導演智能體 (Director Agent):負責控制場景的發展,選擇下一個發言的角色智能體,并向其發出行動指令 (command) 。
      • 角色智能體 (Character Agent):根據其目標、身體狀態和記憶,對導演的指令做出回應,并以第三人稱視角描述對話和行動
    4. 角色扮演過程類似于一個“群聊”管理,導演智能體根據時間大綱 oco_coc? 引導角色智能體進行模擬,直到場景結束。
    5. 角色智能體擁有一個基于文本的記憶和身體狀態系統,可以根據新的聊天歷史進行更新,以保持一致性 。

在這里插入圖片描述

重寫步驟 (Rewrite Step)

  • 目的: 將角色扮演的輸出(事件時間)精煉成符合原始計劃呈現順序(故事時間)的最終故事文本 。
  • 工作流程:
    1. 重寫算法依次處理原始輸入計劃 PpP_pPp? 中指定的每個場景,并按照其呈現順序生成內容 。
    2. 系統提示 LLM,根據原始的呈現大綱 opo_pop? 撰寫場景內容,并參考角色扮演步驟中生成的對話和行動模擬結果 。
    3. 這種模塊化的方法允許作者在生成下一個場景之前對當前場景的內容進行修改 。

實驗與評估

數據集與設置

  • 數據集: 使用了名為“Tell Me A Story”的數據集,該數據集包含復雜的寫作提示和人工撰寫的故事 。作者通過 UMAP 和 k-means 聚類方法對數據集進行了分析,并選擇了 28 個代表性提示進行實驗 。
  • 對比方法:
    1. 單一智能體方法:Dramatron 。
    2. 多智能體方法:Agents’ Room 。
  • 實驗流程:
    • 通過一個“教師 LLM”(03-mini)從“黃金故事”中合成一個“合成計劃”,然后將該計劃作為輸入,讓三種寫作系統(Dramatron、Agents’ Room 和本論文提出的系統)生成故事 。
    • 所有系統均使用 GPT-4o 模型,并采用零樣本(zero-shot)提示策略,以確保公平比較 。

在這里插入圖片描述

評估方法

  • 自動評估: 采用基于 LLM 的評估器,靈感來自 Agents’ Room 的評估方法 。采用兩篇文章選擇其中一篇的方式,實現通過設定 prompt 讓 LLM 進行選擇,如下圖所示。
  • 評估標準: 評估器根據四個標準對故事進行兩兩比較:情節(Plot)、創意(Creativity)、發展(Development)和語言使用(Language Use)。同時還包括一個單獨的“總體”(Overall)標準 。
  • 評估模型: 使用 Gemini 1.5 Pro 作為評估模型 。
  • 結果分析: 使用 Bradley-Terry 模型將兩兩比較結果線性化,得到各系統的潛在能力參數(strength)。

在這里插入圖片描述


實驗結果

  • LLM 評估結果: 在所有評估標準(總體、情節、創意、發展和語言使用)上,作者提出的系統都顯著優于 Agents’ Room 和 Dramatron 。
  • 定性分析:
    • 作者的系統在角色一致性和敘事連貫性方面表現更好 。
    • 通過一個具體的例子(train 026),論文解釋了其優勢:由于采用了時間順序的角色扮演,角色智能體(Aerie)在扮演第一個場景(與 Kissen 會面)之前已經有了第二個場景(回顧早期旅程)的記憶,從而避免了其他系統可能出現的幻覺或過早劇透問題 。
    • 其他方法存在問題,例如 Agents’ Room 可能會出現重復或無關的詞語,這可能是因為其生成過程約束較弱 。

在這里插入圖片描述


結論

  • 結論: 該論文首次將“事件時間”和“故事時間”的概念整合到一個統一的故事生成流程中 。通過角色扮演步驟生成“事件時間”,再通過重寫步驟將其修改為“故事時間”,實現了作者意圖和角色驅動對話之間的自然平衡 。這種方法利用角色模擬結果,大大降低了實際故事內容創作的難度 。
  • 未來工作:
    1. 改進排序算法,以更好地處理包含閃回等復雜時間結構的場景 。
    2. 在角色扮演過程中實施明確的隱私控制,以防止智能體訪問其不應獲取的信息 。
    3. 探索將人類參與者更有效地整合到創作流程中的方法 。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/919354.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/919354.shtml
英文地址,請注明出處:http://en.pswp.cn/news/919354.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

GaussianLSS

背景 BEV感知能夠聚合多個傳感器輸入得到統一的空間表征,在3D感知、下游應用以及跨模態融合中發揮重要作用。現有的BEV感知分為2D反投影(LSS)以及3D投影(BEVFormer),其中3D投影依賴于3D體素的投影&#xff…

衛生許可證識別技術:通過OCR與NLP實現高效合規管理,提升審核準確性與效率

在食品安全、公共衛生管理日益重要的今天,衛生許可證成為企業合規經營的關鍵憑證。傳統人工審核方式效率低、易出錯,而衛生許可證識別技術應運而生,正逐步革新監管與合規流程。下面深入解析這項技術的核心要素。核心技術原理衛生許可證識別本…

【habitat學習一】Habitat-Lab 配置鍵文檔詳解(CONFIG_KEYS.md)

該文件是 Habitat-Lab(Facebook Research 開發的 Embodied AI 模擬框架)的核心配置文檔,詳細定義了 Habitat 配置系統(基于 OmegaConf)中所有可配置參數的層級結構、默認值、取值范圍及功能說明。以下內容嚴格按文件結…

AI-調查研究-55-機器人 百年進化史:從Unimate到人形智能體的技術躍遷

點一下關注吧!!!非常感謝!!持續更新!!! 🚀 AI篇持續更新中!(長期更新) AI煉丹日志-31- 千呼萬喚始出來 GPT-5 發布!“快的…

【python實用小腳本-190】Python一鍵刪除PDF任意頁:輸入頁碼秒出干凈文件——再也不用在線裁剪排隊

Python一鍵刪除PDF任意頁:輸入頁碼秒出干凈文件——再也不用在線裁剪排隊 PDF刪頁, 零依賴腳本, 命令行秒用, 小白神器, 瑞士軍刀 故事開場:一把瑞士軍刀救了你 周一早高峰,老板發來 200 頁 PDF: “把第 18、25、37 頁刪掉&#x…

RH134 運行容器知識點

1. 相比較虛擬機,容器有哪些技術優勢?答:輕量級:容器共享宿主操作系統的內核,比虛擬機更輕量級,啟動速度更快,資源占用更少。高效性:容器可以快速部署和擴展,適合于微服務…

亞矩陣云手機智能定位:助力Snapchat矩陣賬號的本地化內容運營穿透技術

——構建跨地理圍欄的智能社交營銷網絡**??一、技術架構&#xff1a;動態定位引擎與多維度穿透體系??動態定位引擎??多源信號融合定位?&#xff1a;集成GPS/基站/WiFi三角定位技術&#xff0c;通過亞矩陣云手機底層驅動注入真實坐標數據&#xff08;誤差<5米&#xf…

數據處理和統計分析 —— Pandas 基礎(附數據集)

目錄 一、概述 &#xff08;一&#xff09;series 1、組成 2、創建方式 3、Series常用屬性 &#xff08;二&#xff09;DataFrame 1、組成&#xff1a; 2、構建方式 &#xff08;三&#xff09;數據導入和導出 二、加載數據集 加載部分數據 loc / iloc 三、分組和聚合計算 需求…

github 如何在 readme 顯示Star History

在GitHub的README文件中顯示Star History&#xff08;星標歷史&#xff09;圖表&#xff0c;可以通過以下幾種方式實現&#xff1a; 使用Star History服務 你可以使用Star History服務來生成并嵌入星標歷史圖表 。具體步驟如下&#xff1a; 訪問 Star History 網站: https:/…

安全防范方案

一、基于地理位置的訪問控制&#xff08;核心方案&#xff09; 原理&#xff1a;通過內置GeoIP數據庫或第三方IP庫識別訪問源國家/地區&#xff0c;動態攔截非目標區域IP。 配置步驟&#xff1a; 啟用GeoIP模塊 登錄管理控制臺 → 安全策略 → 地理位置策略 → 加載MaxMind Ge…

Python爬蟲實戰:研究optimesh庫,構建Github網格數據采集系統

1. 引言 1.1 研究背景與意義 在計算機輔助設計(CAD)、有限元分析(FEA)、計算流體力學(CFD)等領域,網格作為離散化連續空間的基礎載體,其質量直接影響數值模擬的精度與效率。高質量的網格應具備單元形狀規則、分布均勻、邊界貼合度高等特征,而低質量網格可能導致計算…

利用Qwen大模型進行c++11并發庫的學習,與時俱進!!!!

文章目錄 1、學習新的東西可以借助ai和官方文檔 1.1 會問問題 異步編程教程 1. std::future 2. std::shared_future 3、std::promise 4、4. std::packaged_task 5. std::async 6. std::future_status 和等待函數 綜合代碼 總結 1、學習新的東西可以借助ai和官方文檔 因為別人寫…

曲面/線 擬合gnuplot

1. 下載gnuplot windows 版&#xff0c;安裝&#xff0c;&#xff08;別的綠色的可能下載即用&#xff0c;推薦下面鏈接這款&#xff09; gnuplot - Browse Files at SourceForge.net 2. 準備數據&#xff0c;存成data.dat或者其它文件名稱&#xff0c;放桌面 數據內容如下…

CentOS Linux 7 (Core)上部署Oracle 11g、19C RAC詳細圖文教程

一、部署參考鏈接&#xff1a; 墨天輪數據庫社區 - 樂知樂享&#xff0c;同心共濟 實戰篇&#xff1a;一步步教你 Linux 7 安裝 Oracle 11GR2 RAC 實戰篇&#xff1a;Linux7 安裝 Oracle 19C RAC 詳細圖文教程 Linux7 安裝 Oracle 19C RAC 詳細圖文教程

WebSocket DevTools 開發調試工具完全指南 – 實時監控、消息攔截、性能分析一站式解決方案

概述 WebSocket DevTools 是一款專為 WebSocket 連接調試而設計的瀏覽器開發者工具擴展。它提供了實時監控、消息攔截、連接管理等功能&#xff0c;幫助開發者快速定位和解決 WebSocket 相關問題。 主要特性 &#x1f50d; 實時監控&#xff1a;實時顯示 WebSocket 連接狀態…

常見的光源頻閃控制方式

一、光源頻閃的優勢消除運動模糊&#xff0c;提升成像質量 光源以極短脈沖&#xff08;微秒級&#xff09;與相機曝光嚴格同步&#xff0c;實現“瞬時凍結”高速運動物體。增強特征對比度&#xff0c;提高缺陷檢出率 頻閃模式下&#xff0c;LED可短時超負荷工作&#xff0c;峰值…

讀From GPT-2 to gpt-oss: Analyzing the Architectural Advances(續)

序 本篇由來&#xff0c;在COC上我當面感謝了組委會和姜寧老師&#xff0c;隨即被姜寧老師催稿&#xff0c;本來當天晚上寫了一個流水賬&#xff0c;感覺甚為不妥。于是決定慢慢寫&#xff0c;緩緩道來。要同時兼顧Show me the code&#xff0c;Show me the vide。希望能形成一…

6-7 TIM編碼器接口 [江科協STM32]

一、引入&#xff08;1&#xff09;編碼器接口的好處&#xff1a;節約軟件資源&#xff1a;外部中斷計次&#xff0c;程序頻繁進入中斷&#xff0c;則軟件資源會被簡單頻繁的工作給占用&#xff0c;效率不高使用定時器的編碼器接口&#xff0c;再配合編碼器&#xff0c;就可以測…

01數據結構-交換排序

01數據結構-交換排序1.冒泡排序1.1基礎冒泡排序1.1.1基礎冒泡排序代碼實現1.2冒泡排序的一次優化1.2.1冒泡排序的第一次優化代碼實現1.3冒泡排序的二次優化1.3.1 冒泡排序的二次優化代碼實現2.快速排序2.1雙邊循環法2.1.1雙邊循環法的代碼實現2.2單邊循環法2.2.1單邊循環法代碼…

MySQL架構和儲存引擎

MySQL服務器整體架構如下&#xff1a;連接層&#xff1a;連接層的作用是處理客戶端的連接&#xff0c;如何管理連接的。網絡端口和連接管理線程&#xff1a;網絡端口&#xff1a;一臺服務器可以連接網絡上多個端口的客戶連接&#xff0c;只需要開放多個端口&#xff0c;只需要在…