機器學習頂刊文獻_人工智能頂刊TPAMI2019最新《多模態機器學習綜述》

原標題:人工智能頂刊TPAMI2019最新《多模態機器學習綜述》

來源:專知

摘要:”當研究問題或數據集包括多個這樣的模態時,其特征在于多模態。

【導讀】人工智能領域最頂級國際期刊IEEE Transactions on Pattern Analysis and Machine Intelligence(IEEE TPAMI,影響因子為 9.455),2019年1月最新一期發表了關于多模態機器學習綜述論文。我們周圍的世界涉及多種形式 - 我們看到物體,聽到聲音,感覺質地,聞到異味等等。 一般而言,模態指的是事物發生或經歷的方式。 大多數人將形態與感覺方式聯系起來,這些感覺方式代表了我們主要的交流和感覺渠道,例如視覺或觸覺。 因此,當研究問題或數據集包括多個這樣的模態時,其特征在于多模態。 本文主要關注但不僅僅關注三種形式:自然語言既可以是書面的,也可以是口頭的; 視覺信號,通常用圖像或視頻表示; 和聲音信號,編碼聲音和口頭信息,如韻律和聲音表達。

我們對世界的體驗是多模式的 - 我們看到物體,聽到聲音,感覺質地,聞到異味和味道。情態是指某種事物發生或經歷的方式,并且當研究問題包括多種這樣的形式時,研究問題被描述為多模式。為了使人工智能在理解我們周圍的世界方面取得進展,它需要能夠將這種多模態信號一起解釋。多模式機器學習旨在構建可以處理和關聯來自多種模態的信息的模型。這是一個充滿活力的多學科領域,具有越來越重要的意義和非凡的潛力。本文不是關注特定的多模態應用,而是研究多模態機器學習本身的最新進展。我們超越了典型的早期和晚期融合分類,并確定了多模式機器學習所面臨的更廣泛的挑戰,即:表示,翻譯,對齊,融合和共同學習。這種新的分類法將使研究人員能夠更好地了解該領域的狀況,并確定未來研究的方向。

論文地址:

http://www.zhuanzhi.ai/paper/2236c08ef0cd1bc87cae0f14cfbb9915

https://ieeexplore.ieee.org/document/8269806

模態特征表示

多模態的表示方法有兩類:

聯合表示將不同模態的特征映射到同一個空間,代表方法有神經網絡的方法、圖模型方法與序列模型方法。

協調方法特征仍在原空間,但是通過相似度或者結構特征協調。

多模態特征翻譯

多模態特征翻譯分為基于樣本的和生成式的:

基于樣本的方法從特征字典中找出最佳翻譯。基于樣本的方法分為基于檢索式的和合并的方法。

生成式的方法則是通過樣本,訓練一個翻譯模型,并使用翻譯模型完成對特征的轉換。生成式的方法有基于語法的、encoder-decoder模型和連續模型。

多模態特征對齊

多模態特征對齊是找到同一個實例的不同之間模態特征之間的關系。

顯式對齊方法包括監督模型和無監督模型。無監督模型如CCA和DTW(Dynamic time warping)等。

隱式對齊的方法包括圖模型和神經網絡

多模態特征融合

多模態特征融合是指將從不同模態的特征集成在一起,共同完成一個任務,如分類。

無模型融合的方法被分為早期模型(基于特征)、晚期模型(基于決策)和混合模型

有模型融合的方法有核方法、圖模型方法、神經網絡模型方法等。

責任編輯:

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/445926.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/445926.shtml
英文地址,請注明出處:http://en.pswp.cn/news/445926.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Windows上同時運行兩個Tomcat

步驟 1.獲得免安裝包 從Tomcat官網下載免安裝包。 2.解壓復制 解壓并創建兩個副本tomcat1和tomcat2,它們的路徑分別為: tomcat1:C:\tomcat\double\apache-tomcat-7.0.90-8081tomcat2:C:\tomcat\double\apache-tomcat-7.0.90-…

FFmpeg源代碼簡單分析-其他-libswscale的sws_scale()

參考鏈接 FFmpeg源代碼簡單分析:libswscale的sws_scale()_雷霄驊的博客-CSDN博客_bad dst image pointers libswscale的sws_scale() FFmpeg的圖像處理(縮放,YUV/RGB格式轉換)類庫libswsscale中的sws_scale()函數。libswscale是一…

布朗橋python_MATLAB 里面有哪些加快程序運行速度的方法呢,求分享?

挖墳了…睡不著覺當個備忘錄記一下用過的方法吧1. 循環向量化2. 利用函數的矩陣輸入功能批量處理3. 必須用for且費時的地方改成單層parfor,要是循環次數比cpu核數還少反而會拖慢程序4. 非常大的矩陣的運算可以用gpuArray(這個在matlab 深度學習工具箱中深有體會)5. …

FFmpeg源代碼簡單分析-其他-libavdevice的avdevice_register_all()

參考鏈接 FFmpeg源代碼簡單分析:libavdevice的avdevice_register_all()_雷霄驊的博客-CSDN博客 libavdevice的avdevice_register_all() FFmpeg中libavdevice注冊設備的函數avdevice_register_all()。avdevice_register_all()在編程中的使用示例可以參考文章&#…

Tomcat無需輸入項目名,直接用域名訪問項目

問題 在Tomcat上開發Web應用,通常是將應用放置Tomcat主目錄下webapps,然后在瀏覽器地址欄輸入域名應用名(如http://localhost:8080/app)對應用進行訪問。 為了方便開發,打算直接用域名訪問項目。例如,在瀏…

藍牙該串口設備不存在或已被占用_電腦識別不了串口設備如何解決_電腦檢測不到串口怎么辦...

2015-09-07 10:46:45win8.1系統USB轉串口不能識別設備出現錯誤代碼10的解決方法分享給大家,win8.1系統插入USB設備提示“指定不存在的設備”,左下角有小黃色感嘆號,導致設備無法識別不能識別...2016-12-02 10:52:57一般情況下,win…

FFmpeg源代碼簡單分析-其他-libavdevice的gdigrab

參考鏈接 FFmpeg源代碼簡單分析:libavdevice的gdigrab_雷霄驊的博客-CSDN博客_gdigrab libavdevice的gdigrab GDIGrab用于在Windows下屏幕錄像(抓屏)gdigrab的源代碼位于libavdevice\gdigrab.c。關鍵函數的調用關系圖如下圖所示。圖中綠色背…

分區和分片的區別_PHP: 分區和分片 - Manual

分區和分片數據庫群組是由于各種各樣的原因建立的,他可以提升處理能力、容忍錯誤,并且提升大量服務器同時工作的的性能。群組有時會組合分區和共享功能,來將大量復雜的任務分拆成更加簡單的任務,更加可控的單元。插件可以支持各種…

Ubuntu安裝GmSSL庫適用于ubuntu18和ubuntu20版本

參考鏈接 編譯與安裝【GmSSL】GmSSL 與 OpenSSL 共存的安裝方法_阿卡基YUAN的博客-CSDN博客_openssl和gmssl在Linux下安裝GmSSL_百里楊的博客-CSDN博客_安裝gmssl ubuntu18操作 需要超級管理員權限本人將下載的安裝包master.zip和安裝的位置都設定在/usr/local下創建文件夾/u…

Windows7右鍵菜單欄添加打開cmd項

背景簡介 眾所周知,在Linux桌面操作系統中的工作目錄窗口中,單擊鼠標右鍵,彈出的菜單欄通常有一項“打開終端”,然后移動鼠標點擊該項,就可以打開Shell窗口,在當前工作目錄進行命令行操作。 但是&#xf…

python11_Python11,文件操作

整了這么多雜七雜八又“沒用”的,終于來點實際的操作了。Python中用open()方法來對打開文件。我們來看看它的用法:path "C:\\Users\Frank\Desktop\\text.txt"f open(path,r,encoding"utf-8")首先給變量path指定一個路徑&#xff0…

在ubuntu環境下執行openssl編譯和安裝

參考鏈接 工具系列 | Ubuntu18.04安裝Openssl-1.1.1_Tinywan的技術博客_51CTO博客密碼學專題 openssl編譯和安裝_MY CUP OF TEA的博客-CSDN博客_openssl 編譯安裝 下載 /source/index.html編譯 使用命令sudo tar -xvzf openssl-1.1.1q.tar.gz 解壓。使用cd openssl-1.1.1q/進…

chrome 使用gpu 加速_一招解決 Chrome / Edge 卡頓緩慢 讓瀏覽器重回流暢順滑

最近一段時間,我發現電腦上的 Chrome 谷歌瀏覽器越用越卡了。特別是網頁打開比較多,同時還有視頻播放時,整個瀏覽器的響應速度都會變得非常緩慢,視頻也會卡頓掉幀。 我用的是 iMac / 32GB 內存 / Intel 四核 i7 4Ghz CPU,硬件性能應該足以讓 Chrome 流暢打開幾十個網頁標簽…

CLion運行程序時添加命令行參數 即設置argv輸入參數

參考鏈接 CLion運行程序時添加命令行參數_三豐雜貨鋪的博客-CSDN博客_clion命令行參數 操作流程 Run -> Edit -> Configuration -> Program arguments那里添內容最快捷的方式是,點擊錘子編譯圖標和運行圖標之間的的圖標,進行Edit Configurati…

python的userlist_Python Collections.UserList用法及代碼示例

Python列表是array-like數據結構,但與之不同的是它是同質的。單個列表可能包含數據類型,例如整數,字符串以及對象。 Python中的列表是有序的,并且有一定數量。根據確定的序列對列表中的元素進行索引,并使用0作為第一個…

解決 SSL_CTX_use_certificate:ca md too weak:ssl/ssl_rsa.c 問題

報錯原因分析 原因是openssl調整了安全級別,要求ca具備更高等級的安全,因此先前發布的證書,如果采用了不安全的算法,比如MD5,就會顯示上述這個錯誤 解決辦法 重新生成證書,先前證書棄用使用函數 SSL_CTX_…

向上滾動 終端_ubuntu

Ubuntu終端Terminal常用快捷鍵Ubuntu終端Terminal常用快捷鍵 快捷鍵 功能 Tab 自動補全 Ctrla 光標移動到開始位置 Ctrle 光標移動到最末尾 Ctrlk 刪除此處至末尾的所有內容 Ctrlu 刪除此處至開始的所有內容 Ctrld 刪除當前字符 Ctrlh 刪除當前字符前一個字符 Ctrlw 刪除此處到…

openssl實現雙向認證教程(服務端代碼+客戶端代碼+證書生成)

參考鏈接 openssl實現雙向認證教程(服務端代碼客戶端代碼證書生成)_huang714的博客-CSDN博客_ssl_ctx_load_verify_locations基于openssl實現https雙向身份認證及安全通信_tutu-hu的博客-CSDN博客_基于openssl實現 注意事項 openssl版本差異很可能導致程…

python用pip安裝pillow_cent 6.5使用pip安裝pillow總是失敗

python:2.7.8阿里云cent os32位virtualenvvirtualenvwrapper之前有一個virtualenv不知道怎么回事成功裝上了pillow之后再在別的virtualenv裝就全都報錯這是為什么 太奇怪了?下載whl安裝,不管哪個版本都說不支持這個系統。imaging.c:3356: error: expected ?.?. ?…

基于openssl和國密算法生成CA、服務器和客戶端證書

參考鏈接 國密自簽名證書生成_三雷科技的博客-CSDN博客_國密證書生成openssl采用sm2進行自簽名的方法_dong_beijing的博客-CSDN博客_openssl sm 前提說明 OpenSSL 1.1.1q 5 Jul 2022 已經實現了國密算法查看是否支持SM2算法openssl ecparam -list_curves | grep -i sm2參考…