【SDRS】面向多模態情感分析的情感感知解糾纏表征轉移

abstract

多模態情感分析(MSA)旨在利用多模態的互補信息對用戶生成的視頻進行情感理解。現有的方法主要集中在設計復雜的特征融合策略來整合單獨提取的多模態表示,忽略了與情感無關的信息的干擾。在本文中,我們提出將單模表征分解為情感特定特征和情感獨立特征,并將前者融合到MSA任務中。具體來說,我們設計了一個新的情感感知解糾纏表示轉換框架,稱為SDRS,由兩個部分組成。交互式情感感知表征解糾纏旨在利用新開發的交叉注意自編碼器,通過考慮其他模態的語境影響,提取每個非語言模態的情感特異性特征表征。注意跨模態表征轉移試圖利用投射后的非語言情感特異性表征在潛在表征空間中轉移文本表征。最后利用變換后的表示對預訓練的語言模型進行微調,用于多模態情感分析。在CMU-MOSI、CMU-MOSEI和CH-SIMS三個公共基準數據集上進行了大量實驗。結果表明,所提出的SDRS框架不僅可以獲得僅基于多模態標簽的最新結果,而且優于額外需要每個模態標簽的方法。

intro

隨著移動設備和社交網絡的快速發展和廣泛使用,人們開始對多模式交互特征進行建模[4,6]。近年來,基于模型的融合技術得到了發展[2 - 4,7],如張量融合[8]、記憶融合[9]和多模態自適應門融合[10]。為了減輕異質性問題,研究人員試圖獨立學習模態不變表征和模態特定表征[11 - 16]。這些方法主要學習如何利用各種模態的互補性和冗余性來表示多模態數據。

然而,在現有的MSA方法中,不同模態的特征通常是獨立提取的,或者作為模態不變和模態特定的特征,這兩種方法都沒有考慮到與情感無關的信息可能產生的干擾。此外,單模態情緒可能受到來自其他模態的信息的影響,如圖1所示。為了有效區分情感特定特征和情感獨立特征,從本質上有必要探索來自不同模態的交互信息[17-21]。盡管有些方法考慮了每個模態內部的差異,但模態之間的解耦特征是孤立地完成的[11,14,22]。這些方法往往只考慮特征融合過程中多模態信息的相互影響,而忽略了特征解耦過程中多模態信息的相互影響,即忽略了多模態交互在去除與情感無關的信息干擾中的作用。

基于這些觀察結果,我們建議通過考慮其他模態的影響,將單模態表征分解為情感特定特征和情感獨立特征。具體而言,我們設計了一種新的情感感知解糾纏表征轉移框架(SDRS),該框架由兩個主要部分組成:交互式情感感知表征解糾纏(ISRD)和注意跨模態表征轉移(ACRS)。

ISRD的目標是通過交叉注意自動編碼器(CAAE)來學習特定于情感的特征表示。CAAE使用由堆疊的交叉注意層組成的轉換器式編碼器和解碼器,在提取情感特定特征時考慮其他模態的信息,從而在多模態環境中捕獲單個模態的真實表達情感。

我們設計了一種新的對比損失來區分情感特定和情感獨立的特征,有助于減輕模式的異質性。在ISRD的實現過程中,我們采用一種從粗到細的策略來訓練CAAE,即首先訓練粗粒度CAAE來學習特定極性的表征,然后使用這些表征來指導細粒度CAAE學習特定情感的表征。

基于文本語義對情感分析的重要影響,ACRS旨在利用非語言情感特定表征來轉移原始文本表征,這些非語言情感特定表征首先被投射到文本表征空間中。通過這種轉換操作,可以最大限度地減少原始語義的變化,并可以探索非語言模式對情感的影響。這也使得下游語言模型更容易對融合詞嵌入進行微調。我們在三個公共基準數據集上進行了廣泛的實驗:

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/81932.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/81932.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/81932.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Sui 上線兩周年,掀起增長「海嘯」

兩年前的 5 月 3 日,Sui 的主網正式發布,將在開發網和測試網上驗證過的下一代技術承諾變為現實。這一新興網絡旨在優化現有區塊鏈技術,結合高性能計算環境與安全性、可驗證性及韌性。 隨著 Sui 迎來兩周年,這股浪潮已成長為「海嘯…

深入理解 mapper-locations

mybatis-plus.mapper-locations: classpath*:/mapper/**/*.xml 是 MyBatis/MyBatis-Plus 在 Spring Boot 配置文件(如 application.yml 或 application.properties)中的一項關鍵配置,用于指定 MyBatis Mapper XML 文件的存放路徑。以下是詳細…

電容的作用

使用多個電容是從電容的實際等效模型去考慮的(也就是從SI,信號完整性方面)。只考慮一個實際電容時,它的阻抗曲線是一個類似于倒三角形的形狀,只在諧振頻率點(與等效串聯電感形成)處的阻抗最小。因此相當于只在這一個頻率點處及附近…

移植的本質是什么

有斷時間我就在想,為什么freertos,lvgl等等的移植都是把庫文件放進來,直接點擊編譯,然后把bug都處理完成就移植成功了,為什么呢? 明明我一個函數都沒調用,為什么會有一堆錯誤,莫名其…

廣告場景下的檢索平臺技術

檢索方向概述 數據檢索領域技術選型大體分為SQL事務數據庫、NoSQL數據庫、分析型數據庫三個類型。 SQL數據庫的設計思路是采用關系模型組織數據,注重讀寫操作的一致性,注重數據的絕對安全。為了實現這一思路,SQL數據庫往往會犧牲部分性能&…

高頻PCB設計如何選擇PCB層數?

以四層板為例,可以第一層和第二層畫信號,作為信號層。 第三層可以走電源,然后第四層走GND 但是更可以第一層和第三層畫信號。第二層可以走電源,然后第四層走GND 用中間的電源層以及地層可以起到屏蔽的作用,有效降低寄…

[Linux_69] 數據鏈路層 | Mac幀格式 | 局域網轉發 | MTU MSS

目錄 0.引入 1.以太網幀格式 2.重談局域網轉發的原理(基于協議) 小結 3.認識MTU 3.1MTU對IP協議的影響 3.2MTU對UDP協議的影響 3.3MTU對于TCP協議的影響 0.引入 在去年的這篇文章中,我們有對網絡進行過一個概述[Linux#47][網絡] 網絡協議 | TCP/IP模型 | 以…

vue2 provide 后 inject 數據不是響應式的,不實時更新

今天用 provide 后&#xff0c;inject 獲取數據時不是實時更新的&#xff0c;獲取的不是更新后的值 祖父組件 <div style"text-align: left !important;"><button click"change">更改</button> </div>data() {return {name: ini…

洛谷---P1629 郵遞員送信

題目描述 有一個郵遞員要送東西&#xff0c;郵局在節點 1。他總共要送 n?1 樣東西&#xff0c;其目的地分別是節點 2 到節點 n。由于這個城市的交通比較繁忙&#xff0c;因此所有的道路都是單行的&#xff0c;共有 m 條道路。這個郵遞員每次只能帶一樣東西&#xff0c;并且運…

2025年LangChain(V0.3)開發與綜合案例

LangChain是什么&#xff1f; 在實際企業開發中&#xff0c;大模型應用往往比簡單的問答要復雜得多。如果只是簡單地向大模型提問并獲取回答&#xff0c;那么大模型的許多強大功能都沒有被充分利用。 要開始使用LangChain&#xff0c;首先需要安裝相關的庫&#xff1a; pip …

十分鐘了解 @MapperScan

MapperScan 是 MyBatis 和 MyBatis-Plus 提供的一個 Spring Boot 注解&#xff0c;用于自動掃描并注冊 Mapper 接口&#xff0c;使其能夠被 Spring 容器管理&#xff0c;并與對應的 XML 或注解 SQL 綁定。它的核心作用是簡化 MyBatis Mapper 接口的配置&#xff0c;避免手動逐個…

深度解析 MindTorch:無縫遷移 PyTorch 到 MindSpore 的高效工具

在深度學習領域&#xff0c;框架的選擇往往取決于開發者的習慣、硬件支持以及項目需求。PyTorch 作為當前最受歡迎的深度學習框架之一&#xff0c;以其動態圖機制和簡潔的 API 設計深受開發者喜愛。然而&#xff0c;隨著昇騰硬件的崛起&#xff0c;如何高效地利用昇騰的強大計算…

[250506] Auto-cpufreq 2.6 版本發布:帶來增強的 TUI 監控及多項改進

目錄 Auto-cpufreq 2.6 版本發布&#xff1a;帶來增強的 TUI 監控及多項改進 Auto-cpufreq 2.6 版本發布&#xff1a;帶來增強的 TUI 監控及多項改進 Auto-cpufreq&#xff0c;一款適用于 Linux 的免費開源自動 CPU 速度與功耗優化器&#xff0c;已發布其最新版本 2.6。該工具…

Linux 更改內存交換 swap 為 zram 壓縮,減小磁盤寫入

1、查看當前 swap 的方式 swapon --show 我這里是默認的 swap 文件&#xff0c;大小為 2G。 2、安裝 zram Ubuntu 下&#xff1a; sudo apt install zram-tools安裝后默認會啟動&#xff1a; 3、關閉默認的 swap 文件 sudo swapoff /swapfile 其次是關閉 /etc/fstab 中的 …

ORCAD打印pdf

1 筆記本電腦綁定了打印機&#xff0c;要改成這個

C++中指針使用詳解(4)指針的高級應用匯總

C 中指針的高級應用非常豐富&#xff0c;掌握這些內容能讓你寫出更高性能、更底層控制力強的代碼。下面是應用模塊梳理和例子講解。 目錄預覽 函數指針與回調機制指針數組 vs 數組指針指針與類成員函數&#xff08;成員函數指針&#xff09;智能指針&#xff08;unique_ptr, s…

圖像處理軟件imgPro—調參救星!

推薦一款圖像處理軟件imgPro&#xff0c;該軟件是逛B站時偶然間發現&#xff0c;雖然up主是新號&#xff0c;但是視頻中看起來非常實用&#xff01; 核心是多種算法高效調參&#xff0c;亮點是自動生成源碼&#xff01;這您受得了嗎&#xff1f;調試之后&#xff0c;直接復制代…

DOM基礎學習

一、DOM文檔對象模型 通常將DOM看作一顆“樹”&#xff0c;DOM將整個文檔看作一顆“家譜樹 ” 二、對象 用戶定義的對象內建對象&#xff08;Array、Date、Math&#xff09;宿主對象 三、節點 node 元素節點&#xff08;element node&#xff09;文本節點&#xff08;text…

初識人工智能、機器學習、深度學習和大模型

文章目錄 1. 前言2. 相關概念3. 層級關系4. 應用場景對比4. 實際案例 初識人工智能、機器學習、深度學習和大模型 1. 前言 之前經常聽人說AI、機器學習&#xff0c;深度學習之類的詞匯&#xff0c;總是傻傻的不了解他們的區別&#xff0c;近來有空&#xff0c;來通俗說說個人看…

n8n系列(1)初識n8n:工作流自動化平臺概述

1. 引言 隨著各類自動化工具的涌現,n8n作為一款開源的工作流自動化平臺,憑借其靈活性、可擴展性和強大的集成能力,正在獲得越來越多技術團隊的青睞。 本文作為n8n系列的開篇,將帶您全面了解這個強大的自動化平臺,探索其起源、特性以及與其他工具的差異,幫助您判斷n8n是否…