【論文閱讀筆記】Smil: Multimodal learning with severely missing modality

Ma M, Ren J, Zhao L, et al. Smil: Multimodal learning with severely missing modality[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2021, 35(3): 2302-2310.[開源]

本文的核心思想是探討和解決多模態學習中的一個重要問題:在訓練和測試數據中嚴重缺失某些模態時,如何有效進行學習。具體來說,這里的“嚴重缺失”指的是在多達90%的訓練樣本中缺少一些模態信息。在過去的研究中,大多關注于如何處理測試數據的模態不完整性,而對于訓練數據的模態不完整性,尤其是嚴重缺失的情況,探討較少。文章提出了一種新的方法——SMIL(Severely Missing Modality in Multimodal Learning),使用貝葉斯元學習來同時實現兩個目標:靈活性(在訓練、測試或兩者中處理缺失模態)和效率(從不完整的模態中高效學習)。核心思想是通過擾動潛在特征空間,使單一模態的嵌入能夠近似全模態的嵌入。為了驗證這一方法的有效性,作者在三個流行的基準數據集(MM-IMDb, CMU-MOSI 和 avMNIST)上進行了一系列實驗。結果表明,SMIL在處理嚴重模態缺失的多模態學習問題方面,相比現有方法和生成型基準(如自編碼器和生成對抗網絡)具有更好的性能。

image-20231123084815031

  • 模態重建

模態重建是通過使用重建網絡來實現的。該網絡利用可用的模態信息來生成缺失模態的近似值,從而在潛在特征空間中生成完整的數據,并促進兩個方面的靈活性。一方面,該模型可以通過使用完整和不完整的數據進行聯合訓練來挖掘混合數據的全部潛力。另一方面,在測試時,通過打開或關閉特征重建網絡,該模型可以以統一的方式處理不完整或完整的輸入。具體來說,重建網絡被訓練來預測先驗權重的權重,而不是直接生成缺失模態。這是通過學習一組可以使用 K-means 或 PCA 在所有模態完整樣本之間聚類的模態先驗 M 來實現的。然后,通過計算模態先驗的加權和來重建缺失模態。這種方法可以有效地處理缺失模態問題,并在實驗中取得了良好的結果。

  • 不確定性引導特征正則化

該網絡通過對特征進行擾動來評估數據的不確定性,并將不確定性評估用作特征正則化,以克服模型和數據偏差。具體來說,該網絡使用一組隨機噪聲向量來擾動輸入特征,并計算每個擾動的輸出的方差。然后,將方差用作特征正則化的權重,以減少特征之間的差異。這種方法可以有效地處理低質量和不完整的特征,并提高多模態模型的魯棒性和泛化能力。與之前的確定性正則化方法相比,不確定性引導特征正則化可以顯著提高模型的容量和性能。

  • 貝葉斯元學習框架

通過利用貝葉斯元學習框架來聯合優化所有網絡實現的。具體來說,主網絡 f θ f_{\theta} fθ?在重構 f ? ? f_{\phi_{\phi}} f????網絡和正則化 f ? r f_{\phi_{r}} f?r??網絡的幫助下在 D m D_m Dm?上進行元訓練。然后,在 D f D_f Df?上對更新后的主網絡 f θ ? f_{\theta^{*}} fθ??進行元測試。最后,通過梯度下降元更新網絡參數 { θ , ? c , ? r } \left\{\boldsymbol{\theta}, \boldsymbol{\phi}_{c}, \boldsymbol{\phi}_{r}\right\} {θ,?c?,?r?}。該框架旨在優化目標函數,即最小化 L ( D f ; θ ? , ψ ) \mathcal{L}\left(\mathcal{D}^{f} ; \boldsymbol{\theta}^{*}, \boldsymbol{\psi}\right) L(Df;θ?,ψ),其中 θ ? = θ ? α ? θ L ( D m ; ψ ) \boldsymbol{\theta}^{*}=\boldsymbol{\theta}-\alpha \nabla_{\boldsymbol{\theta}} \mathcal{L}\left(\mathcal{D}^{m} ; \boldsymbol{\psi}\right) θ?=θ?α?θ?L(Dm;ψ) ψ = { ? c , ? r } \psi=\left\{\phi_{c}, \phi_{r}\right\} ψ={?c?,?r?}表示重構和正則化網絡參數的組合。貝葉斯元學習的目標是最大化條件似然: log ? p ( Y ∣ X ; θ ) \log p(\mathbf{Y} \mid \mathbf{X} ; \boldsymbol{\theta}) logp(YX;θ)。然而,解決它涉及到不可行的真后驗 p ( z ∣ X ) p(z|X) p(zX)。因此,通過一種分攤分布 q ( z ∣ X ; ψ ) q(z|X;ψ) q(zX;ψ)來近似真后驗分布,并且近似的下限形式可以定義為 L θ , ψ = E q ( z ∣ X ; θ , ψ ) [ log ? p ( Y ∣ X , z ; θ ) ] ? KL ? [ q ( z ∣ X ; ψ ) ∥ p ( z ∣ X ) ] . \begin{aligned} \mathcal{L}_{\boldsymbol{\theta}, \boldsymbol{\psi}}=\boldsymbol{E}_{q(\mathbf{z} \mid \mathbf{X} ; \boldsymbol{\theta}, \boldsymbol{\psi})}[\log p(\mathbf{Y} \mid \mathbf{X}, \mathbf{z} ; \boldsymbol{\theta})]- & \operatorname{KL}[q(\mathbf{z} \mid \mathbf{X} ; \boldsymbol{\psi}) \| p(\mathbf{z} \mid \mathbf{X})] . \end{aligned} Lθ,ψ?=Eq(zX;θ,ψ)?[logp(YX,z;θ)]??KL[q(zX;ψ)p(zX)].?

我們通過蒙特卡羅(MC)抽樣來最大化這個下界

image-20231123090948982

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/165801.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/165801.shtml
英文地址,請注明出處:http://en.pswp.cn/news/165801.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【dart線程之怎么處理異步和順序異步任務隊列】

dart線程之怎么處理異步和順序異步任務隊列 單線程的dart怎么處理異步任務的? 事件循環模型就是實現異步處理任務的核心。 關于阻塞式調用和非阻塞式調用的概念 阻塞和非阻塞關注的是程序在等待調用結果(消息、返回值)時的狀態阻塞式調用…

JS中的OOP

JS中的OOP OOP 為我們解決了什么問題?想象一下,我們希望為教師提供一個平臺,每位注冊的教師都可以提交分數,并為課程分配作業和其他內容。 如果有一個地方(在本例中是一個對象),可以訪問所有教…

Python編寫的爬蟲為什么受歡迎?

每每回想起我當初學習python爬蟲的經歷,當初遇到的各種困難險阻至今都歷歷在目。即便當初道阻且長,窮且益堅,我也從來沒有想過要放棄。今天我將以我個人經歷,和大家聊一聊有關Python語音編寫的爬蟲的事情。談一談為什么最近幾年py…

C#中的事件(委托的發布和訂閱、事件的發布和訂閱、EventHandler類、Windows事件)

目錄 一、委托的發布和訂閱 1.訂閱操作符號“"和取消訂閱操作符號“-” 2.示例源碼 二、事件的發布和訂閱 三、EventHandler類 四、Windows事件 C#中的事件是指某個類的對象在運行過程中遇到的一些特定事情,而這些特定的事情有必要通知給這個對象的使用者…

【海德教育】河北初級職稱報名條件:

河北助理工程師 學歷要求 大專畢業后滿3年,工程類專業 本科畢業后滿1年 ,工程類專業 非工程類專業,年限增加2年即可。

多線程,線程池,線程的創建,線程池的參數

文章目錄 多線程-1 高并發〇、使用多線程的場景1. 為什么使用多線程 1. 線程概述1.1 線程和進程1.2 并發和并行1.3 多線程的優勢1.4 程序運行原理1.5 主線程 1.6 線程的 6 種狀態2. 線程的創建和啟動2.1 Thread類2.2創建線程有哪幾種方法2.2.1 繼承**Thread**類,重寫…

centos7 安裝docker

1.卸載舊版本,不管裝沒裝過,執行一下,防止版本沖突 yum remove docker \ docker-client \ docker-client-latest \ docker-common \ docker-latest \ docker-latest-logrotate \ docker-logrotate \ docker-engine 2. yum安裝gcc相關 以及 安…

electron27-react-mateos:基于electron+react18仿matePad桌面系統

基于Electron27React18ArcoDesign搭建桌面版OS管理系統。 electron-react-mateos 基于最新前端跨端技術棧electron27.xreact18arco-designzustand4sortablejs構建的一款仿制matePad界面多層級路由管理OS系統。 ElectronReactOS支持桌面多路由配置,新開窗口彈窗開啟路…

YB4051系列設備是高度集成的 Li-lon 和 Li-Pol 線性充電器,針對便攜式應用的小容量電池。

YB4051H 300mA 單電池鋰離子電池充電器0.1 mA 終端,45nA 電池漏電流 概述: YB4051系列設備是高度集成的 Li-lon 和 Li-Pol 線性充電器,針對便攜式應用的小容量電池。它是一個完整的恒流/恒壓線性充電器。不需要外部感應電阻,由于…

51單片機利用I/O口高阻狀態實現觸摸控制LED燈

51單片機利用I/O口高阻狀態實現觸摸控制LED燈 1.概述 這篇文章介紹使用I/O口的高阻狀態實現一個觸摸控制LED燈亮滅的實驗。該實驗通過手觸摸P3.7引腳,改變電平信號控制燈的亮滅。 2.實驗過程 2.1.實驗材料 名稱型號數量單片機STC12C20521LED彩燈無1晶振12MHZ1電…

Elasticsearch:ES|QL 函數及操作符

如果你對 ES|QL 還不是很熟悉的話,請閱讀之前的文章 “Elasticsearch:ES|QL 查詢語言簡介???????”。ES|QL 提供了一整套用于處理數據的函數和運算符。 功能分為以下幾類: 目錄 ES|QL 聚合函數 AVG COUNT COUNT_DISTINCT 計數為近…

geemap學習筆記013:為遙感動態GIF圖添加圖名

前言 遙感動態GIF圖可以展示地理區域隨時間的變化,這對于監測自然災害、濕地變化、城市擴展、農田變化等方面非常有用,并且可以反復觀察圖像,以更深入地了解地表的動態變化。本節主要是對遙感動態GIF圖添加圖名,以便于更好地理解…

聚觀早報 |一加12正式開啟預訂;OPPO Reno11系列賣點

【聚觀365】11月24日消息 一加12正式開啟預訂 OPPO Reno11系列賣點 小鵬第三季度營收財報 Claude 2.1 聊天機器人公布 現代汽車將與倫敦大學學院合作 一加12正式開啟預訂 全新的一加12系列公開亮相已有一段時間,不久前一加官方宣布,該機將于12月4日…

android:The application could not be installed: INSTALL_FAILED_TEST_ONLY

1、問題描述 在android12 (OPPO PEEM00)上安裝APP時,提示上述異常 原因分析: android:testOnly:應用是否是為了測試,它可能向外暴露數據,引發安全漏洞。因此國內廠商的手機檢測到這個屬性為t…

ebpf實戰(一)-------監控udp延遲

問題背景: 為了分析udp數據通信中端到端的延遲,我們需要對整個通信鏈路的每個階段進行監控,找出延遲最長的階段. udp接收端有2個主要路徑 1.數據包到達本機后,由軟中斷處理程序將數據包接收并放入udp socket的接收緩沖區 數據接收流程 2. 應用程序調用recvmsg等a…

<JavaEE> 什么是進程控制塊(PCB Process Control Block)?

目錄 一、進程控制塊的概念 二、進程控制塊的重要屬性 2.1 唯一身份標識(PID) 2.2 內存指針 2.3 文件描述符表 2.4 狀態 2.5 優先級 2.6 記賬信息 2.7 上下文 一、進程控制塊的概念 進程控制塊(Process Control Block, PCB&#xff…

Springboot引入分布式搜索引擎Es RestAPI

文章目錄 RestAPI初始化RestClient創建索引庫刪除索引庫判斷索引庫是否存在總結 RestClient操作文檔增加文檔數據查詢文檔刪除文檔修改文檔批量導入文檔小結 RestAPI ES官方提供了各種不同語言的客戶端,用來操作ES。這些客戶端的本質就是組裝DSL語句,通…

IOS Frida 常用腳本

調用堆棧 console.log("bt:" + Thread.backtrace(this.context,Backtracer.ACCURATE).map(DebugSymbol.fromAddress).join(\n\t)); Hook 調用,修改返回值 // Get a reference to the openURL selectorvar openURL = ObjC.classes.UIApplication["- openURL:&qu…

uni-app 跨端開發注意事項

文章目錄 前言H5正常但App異常的可能性標題二H5正常但小程序異常的可能性小程序正常但App異常的可能性小程序或App正常,但H5異常的可能性App正常,小程序、H5異常的可能性使用 Vue.js 的注意區別于傳統 web 開發的注意H5 開發注意微信小程序開發注意支付寶…

Docker實用篇

Docker實用篇 0.學習目標 1.初識Docker 1.1.什么是Docker 微服務雖然具備各種各樣的優勢,但服務的拆分通用給部署帶來了很大的麻煩。 分布式系統中,依賴的組件非常多,不同組件之間部署時往往會產生一些沖突。在數百上千臺服務中重復部署…