PersonalLLM——探索LLM是否能根據五大人格特質重新塑造一個新的角色?

1.概述

近年來,大型語言模型(LLMs),例如ChatGPT,致力于構建能夠輔助人類的個性化人工智能代理,這些代理以進行類似人類的對話為重點。在學術領域,尤其是社會科學中,一些研究報告已經指出,生成式代理具備模擬人類個性特征的能力。盡管在這一領域取得了顯著進展,但關于個性化LLM如何精確且持續地再現特定人格特質的研究評估卻相對匱乏。
在這種背景下,本文介紹了一項研究論文。該論文通過讓LLMs模擬基于五大人格特質的角色,并通過從生成的內容中提取心理語言特征、進行人類評分和人格預測,來探究LLMs是否能夠再現人格特征。這項研究為我們提供了對LLMs在個性化方面的潛力和挑戰的深入理解。

源碼地址:https://github.com/hjian42/personallm
論文地址:https://arxiv.org/pdf/2305.02547.pdf

2.五大人格特質

本文探討了"五大"人格特質理論,這是由美國心理學家劉易斯·戈德堡提出的一個框架,用于描述和理解人的個性差異。該理論認為,人的個性可以通過五個基本維度來分類,這五個維度共同構成了人格的框架。

"五大"人格特質,也被稱為五因素模型(Five-Factor Model),是心理學中一個廣泛接受的人格特質理論。這個模型認為人格可以通過五個基本維度來描述,這五個維度通常被縮寫為OCEAN:

  1. 開放性(Openness):與創造性、好奇心、想象力和對新體驗的開放態度相關。
  2. 責任心(Conscientiousness):涉及組織性、堅持、自律、成就導向和可靠性]。
  3. 外向性(Extraversion):與社交性、活躍度、樂觀和對外界刺激的需求相關。
  4. 宜人性(Agreeableness):與合作性、信任、利他、謙遜和對他人的同情相關。
  5. 神經質(Neuroticism):與情緒穩定性相反,涉及情緒波動、焦慮、抑郁和自我意識。

此外,本文還介紹了一個實驗,其中讓大型語言模型(LLM)根據上述五大人格特質之一來模擬角色。隨后,利用大五人格量表(Big Five Inventory,BFI)對LLM模擬的角色進行了評估。通過這種方式,本文旨在探索LLM是否能夠準確地再現和模擬特定的人格特質,這對于構建更加個性化和人性化的AI代理具有重要意義。

3. 實驗概述

項目部署:

conda activate audiencenlp
python3.9 run_bfi.py --model "GPT-3.5-turbo-0613"
python3.9 run_bfi.py --model "GPT-4-0613"
python3.9 run_bfi.py --model "llama-2"

本文的實驗工作流程如下圖所示。

如圖所示,本實驗按照以下步驟進行。

A. 首先,運行提示,生成具有獨特個性特征的LLM角色
B. 然后讓生成的 LLM 角色完成故事寫作任務
C. 使用 “語言探究和字數統計”(LIWC)框架,研究 "LLM角色 "所描述的故事是否包含表明指定個性特征的語言模式
D. 評估 LLM 角色(人類角色和 LLM 角色)所描述的故事。
E. 讓人類和 LLM 完成從故事中預測作家 LLM 角色性格特征的任務

3.1 LLM角色模擬

實驗使用了兩個 LLM 模型(GPT-3.5 和 GPT-4),分別針對五大人格特質模擬了 10 個 LLM 角色,總共生成了 320 個角色
然后,使用上述的 "BFI "對所生成的 "LLM 角色 "進行了評估,以檢查它們是否充分再現了 “五大角色”。

3.2故事寫作

然后,320 個LLM**"角色 "被要求 "請分享一個 800 字左右的個人故事。 請不要在故事中明確提及你的性格特征**。**不要在故事中明確提及你的性格特征。不要在故事中明確提及你的性格特征。**要求參與者撰寫一個文本故事用于分析,并提示 "不要在故事中明確提及您的個性特征。

3.2 LIWC 分析

接下來,我們使用LIWC(語言調查和字數統計)框架從 "角色 "所描述的故事中提取心理語言特征,這是一種通過對文本中的詞匯進行抽象和分類來對屬性進行歸類的方法。

這項分析旨在通過研究故事中的性格特征與分配給LLM的性格特征之間的相關性,找出與性格特征的性格特征相對應的語言模式。

3.3 故事評價

然后,人類和本地語言學家根據以下標準對本地語言學家角色所描述的故事進行評分

  1. 可讀性:故事是否易讀、結構合理、流暢自然?
  2. 個性:故事是否獨特,是否清楚地表達了作者的思想和情感?
  3. 冗余:故事簡明扼要,沒有不必要的內容
  4. 凝聚力:故事寫得好嗎?
  5. 可讀性:閱讀是否有趣?
  6. 可信度:故事是否引人入勝,是否符合實際情況?

3.4 性格預測

最后,支持每個人和 LLM 從給定的故事中預測作家 LLM 角色的個性特征,評分標準為 1 到 5 分。本實驗的目的是評估 LLM 角色所描述的故事是否能有效地展示人類和 LLM 都能識別的人格特質。

4. 實驗結果

本文使用 GPT-3.5 和 GPT4 這兩個 LLM 模型生成的 320 個 LLM 角色進行了實驗,以確認以下兩個研究問題。

A. LLM的 "角色 "是否反映了指定的個性特征?
B. 從 "LLM 角色 "所描述的故事中,能否獲得每種人格特質的語言模式?
C. LLM角色所描述的故事是否寫得充分?
D. 故事能預測LLM角色的個性特征嗎?

4.1 LLM的 "角色 "是否反映了指定的個性特征?

為了證實這一研究問題,本實驗根據 320 個LLM角色對 BFI 的回答計算了他們的個性分數,并通過 t 檢驗分析了這些分數的分布與所分配的個性特征的函數關系。

結果如下。

實驗結果表明在統計學上LLM的角色****在所有性格特征上都有明顯的差異,這證明他們反映了他們被賦予的角色

4.2 LLM的 "角色 "是否反映了指定的個性特征?

為了證實這一研究問題,本實驗使用 LIWC 從 LLM 角色生成的故事中提取了心理語言特征,并計算了這些特征與指定人格特質之間的點比對相關性(PBCs)。

點雙項相關系數是一種適用于分析二元變量與連續變量之間關系的系數,在此用于研究指定的人格特質(=二元變量)與 LIWC 特征(=連續變量)之間的相關性。

下表概述了與個性特征有顯著統計學相關性的 LIWC 特征。

實驗結果表明,指定的人格特質對法學碩士角色的語言風格有顯著影響,例如,當LLM被賦予神經質角色時,更傾向于使用負面詞匯,如焦慮和負面語氣。結果表明,所分配的人格特質對法學碩士角色的語言風格有顯著影響

此外,更重要的是,這些相關性反映了在人類描述的故事中觀察到的模式,證實了人類和 LLM 角色之間用詞的一致性。(與 GPT-3.5 相比,GPT-4 的結果與人類更加一致) 。

4.3 LLM角色所描述的故事是否寫得充分?

為了證實這一研究問題,本實驗評估了由 LLM 角色(包括人類角色和 LLM 角色)生成的故事。

評估結果見下表。

值得注意的是,GPT-4 角色所生成的故事在可讀性(可讀性)、內聚性(內聚性)和可信性(現實性)方面都獲得了人類和 LLM 4.0 或更高的評分。重點是在以下方面獲得了 4.0 或更高的評分。

結果證實,"角色 "所產生的故事不僅語言流暢、結構連貫,而且引人入勝

4.4 故事能預測法學碩士角色的個性特征嗎?

為了證實這一研究問題,本實驗將每個角色的個性特征視為二元分類問題,并計算了人類和 LLM 預測個性特征的準確率。

實驗結果如下圖所示。

實驗結果表明,人類從 GPT-4 角色描述的故事中預測性格特征的準確率在外向性和宜人性方面分別低至 68% 和 51%,這證實了人類基于文本的性格預測任務的難度。.
另一方面,GPT-4 在 “外向性”、"宜人性 "和 "自覺性 "方面的準確率分別為 97%、68%和 69%,表明它可以非常準確地預測人格特質。研究結果如下

5.總結

本論文通過模擬基于五大人格特質的角色,并通過分析生成內容中的心理語言特征、人類評價以及人格預測,深入探討了大型語言模型(LLM)是否能夠再現人格特質。
實驗結果表明,LLM不僅能夠成功模擬特定的人物形象,而且還能通過用詞習慣反映出人格特質,進而實現對人格特質的預測。這一發現突顯了LLM在模擬人類個性方面的龐大潛力。
然而,研究也指出了未來需要進一步探索的領域。例如,當前的實驗并未模擬更自然的情境,如LLM角色之間的互動或協作。此外,研究主要關注英語,尚未擴展到其他語言的探索。
隨著這一研究領域的持續發展,我們有理由期待,未來將能夠開發出能夠精確復制人類個性和行為的人工智能代理,它們的行為模式將與人類無異。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/13648.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/13648.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/13648.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

正心歸一、綻放真我 好普集團正一生命文化藝術大賽(中老年賽區)正式啟動

為進一步弘揚社會主義核心價值觀,弘揚生命文化,提升公眾對生命價值的認識與尊重,同時展現中老年藝術家的創作才華,激發廣大中老年朋友的藝術熱情和創造力。好普集團主辦,幸福金齡會與正一生命科學研究(廣州…

adb獲取點擊坐標并模擬點擊事件(模擬滑動)

屏幕分辨率: $ adb shell wm size Physical size: 1080x2340 獲取設備的最大X和Y: 為8639 18719 $ adb shell getevent -p | grep -e "0035" -e "0036" 0035 : value 0, min 0, max 8639, fuzz 0, flat 0, resolution 0 0036 : v…

AWS安全性身份和合規性之Artifact

AWS Artifact是對您很重要的與合規性相關的信息的首選中央資源。AWS Artifact是一項服務,提供了一系列用于安全合規的文檔、報告和資源,以幫助用戶滿足其合規性和監管要求。它允許按需訪問來自AWS和在AWS Marketplace上銷售產品的ISV的安全性和合規性報告…

網絡模型-VLAN聚合

VLAN聚合 VLAN聚合(VLAN Aggregation,也稱SuperVLAN)指在一個物理網絡內,用多個VLAN(稱為Sub-VLAN)隔離廣播域并將這些Sub-VLAN聚合成一個邏輯的VLAN(稱為SuperVLAN),這些Sub-VLAN使用同一個IP子網和缺省網關,,進而達到節約IP地址…

BOM..

區別:

基于BERT的醫學影像報告語料庫構建

大模型時代,任何行業,任何企業的數據治理未來將會以“語料庫”的自動化構建為基石。因此這一系列精選的論文還是圍繞在語料庫的建設以及自動化的構建。 通讀該系列的文章,猶如八仙過海,百花齊放。非結構的提取無外乎關注于非結構…

excel轉pdf并且加水印,利用ByteArrayOutputStream內存流不產生中間文件

首先先引入包&#xff1a;加水印和excel轉PDF的 <dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.5.12</version></dependency><dependency><groupId>org.apache.poi&l…

2024全新爆款好物推薦,618必買數碼好物清單吐血整理!

?距離618購物狂歡節越來越近了&#xff0c;有很多日常價格不菲的產品在這次活動期間都會進行促銷活動&#xff0c;尤其是數碼類產品&#xff0c;加上618的優惠活動更有吸引力了。不過面對大促的熱潮我們消費者在選購商品的同時還是要擦亮眼睛&#xff0c;避免買到質量不好的商…

SSE 與 SASE哪個云原生安全框架更加適合

近年來&#xff0c;隨著云計算和網絡技術的不斷發展&#xff0c;出現了一種新的網絡安全解決方案——SASE&#xff08;安全訪問服務邊緣&#xff09;。SASE是一種將網絡和安全功能融合到單個基于云的服務中的框架&#xff0c;旨在提供更加安全、高效和便捷的網絡訪問體驗。SASE…

云原生周刊:Flux 2.3 發布 | 2024.5.20

開源項目推薦 kubeinvaders kubeinvaders 專為 Kubernetes 用戶設計。它提供了一種有趣而交互式的方式來探索和可視化您的 Kubernetes 集群。通過類似游戲的界面&#xff0c;用戶可以瀏覽他們的集群&#xff0c;發現資源&#xff0c;甚至模擬對 Pod 的攻擊。通過 kubeinvader…

我的前端封裝之路

最近有粉絲提問了我一個面試中遇到的問題&#xff0c;他說面試的時候&#xff0c;面試官問我&#xff1a;你在以前的項目中封裝過組件嗎&#xff1f;或者做過npm公共庫嗎&#xff1f;遇到過什么問題嗎&#xff1f;當時自己突然覺得好像沒什么可回答的啊&#xff0c;但面試結束想…

前端 CSS 經典:弧形邊框選項卡

1. 效果圖 2. 開始 準備一個元素&#xff0c;將元素左上角&#xff0c;右上角設為圓角。 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-width, i…

thingML的學習——什么是thingML

今天開始建模的學習&#xff0c;thingML是建模的一種工具 &#xff0c;也可以理解為一種建模語言&#xff0c;有自己的語法和語義。 ThingML 支持的多種平臺和通信協議&#xff0c;如UART、I2C、MQTT、WebSocket、REST、ROS、Bluetooth、BLE和Zwave&#xff0c;通過插件機制&a…

Spring Cloud Alibaba-07-RocketMQ消息驅動

Lison <dreamlison163.com>, v1.0.0, 2024.4.20 Spring Cloud Alibaba-07-RocketMQ消息驅動 文章目錄 Spring Cloud Alibaba-07-RocketMQ消息驅動MQ簡介MQ的應用場景常見的MQ產品RocketeMQ的架構及概念 RocketMQ入門RocketMQ環境搭建 SpringBoot 集成 RocketMQ MQ簡介 …

來盤點我的校園生活(3)

來公布上期數學題答案:12 你算對了嗎&#xff1f; 今天我們班真是炸開了鍋。事情是這樣的&#xff0c;我今天早晨上學&#xff0c;學校不讓早到&#xff0c;但我一個不小心早到了&#xff0c;主任的規定是盡量不早到&#xff0c;早到不扣分&#xff0c;倒要站在那兒背書&…

Linux--軟硬鏈接

目錄 0.文件系統 1.軟硬鏈接 1.1見一下軟硬鏈接 1.2軟硬鏈接的特征 1.3軟硬鏈接是什么&#xff0c;有什么作用&#xff08;場景&#xff09; 0.文件系統 Linux--文件系統-CSDN博客 1.軟硬鏈接 1.1見一下軟硬鏈接 1.這是軟鏈接 這個命令在Unix和Linux系統中用于創建一個符號…

基于 Prometheus 的超算彈性計算場景下主機監控最佳實踐

作者&#xff1a;左知 超算場景的業務特點 主機監控&#xff0c;或許是監控/可觀測領域最傳統和普遍的需求。在超算訓練&#xff0c;AI 大規模訓練的業務場景下&#xff0c;主機監控又有哪些痛點和難點呢&#xff1f;根據我們針對多個大規模超算客戶的需求整理&#xff0c;超…

Python案例題目,入門小白題

1.抓取鏈家前十頁的數據 鏈家網址&#xff1a;長沙房產網_長沙房地產_長沙房產門戶(長沙鏈家網) 1.1.計算均價和總價 import time ? from selenium import webdriver from selenium.webdriver.common.by import By ? driver webdriver.Chrome() driver.get("https://c…

linux系統內存持續飆高的排查方法

目錄 前言&#xff1a; 1、查看系統內存的占用情況 2、找出占用內存高的進程 3、解決方法 4、補充&#xff1a;如果物理內存使用完了&#xff0c;會發生的情況 前言&#xff1a; 如果一臺服務器內存使用率持續處于一個高峰值&#xff0c;服務器可能會出現響應慢問題。例如s…

使用@Autowired + Map 實現策略模式

使用Autowired Map 實現策略模式 創建接口 public interface UserService {String getName(); }創建多個類實現上面的接口 實現一 import com.boot.service.UserService; import org.springframework.stereotype.Service;Service("zhangsan") public class Zhangsan…