IEEE International Conference on Multimedia and Expo 2025(ICME 2025)?將于?6月30日至7月4日在法國南特舉行。作為全球多媒體領域的頂級會議之一,ICME 2025 匯聚全球頂尖學者與產業專家,聚焦人工智能驅動的多媒體技術,涵蓋圖像與視頻處理、多媒體分析與生成、社交媒體分析等AI相關主題。
音頻編碼器能力挑戰賽依托于ICME 2025會議平臺,由?小米集團、薩里大學與海天瑞聲?聯合主辦,旨在評估音頻編碼器在豐富的多樣性任務中的表征能力。本次挑戰賽的獲獎結果及成果交流 Workshop 即將在ICME 2025會議現場舉辦。屆時,將公布獲獎團隊,歡迎大家到場參與,聆聽優秀參賽隊伍做技術報告!
時間:7月1日(周二)10:15 AM – 11:30 AM
地點:南特會議中心 Room 450
-
什么是音頻編碼器?
音頻編碼器(Audio Encoder)是一種將原始音頻信號進行壓縮、編碼的技術或算法。在AI領域中現代音頻編碼器不僅限于壓縮,還被用于特征提取、多任務學習、通用音頻理解模型等。
-
挑戰賽簡介
音頻編碼器能力挑戰賽旨在評估音頻編碼器在豐富的多樣性任務中的表征能力。本次挑戰賽受 HEAR benchmark 啟發,引入了多項核心增強點,包括多樣化的任務集、面向真實世界的應用、參數化與非參數化評估方法相結合,以及一個全新的高效開源評估系統。
參賽者需提交預訓練音頻編碼器,該編碼器可將原始波形映射為連續的嵌入向量(embedding)。這些編碼器將被用于多個不同任務的測試,包括語音、環境聲音和音樂,重點考察其在真實場景中的可用性。
本次挑戰設有兩個賽道:
· Track A:參數化評估
· Track B:無參數(parameter-free)評估
該挑戰賽為評估和推進音頻編碼設計的前沿技術提供了一個平臺。
-
挑戰賽時間表
· 2025年2月7日:挑戰賽發布并啟動
· 2025年4月1日:注冊截止
· 2025年4月30日:提交截止
· 2025年5月27日:結果公布
· 2025年7月1日:頒獎及成果交流
7月1日 ICME 2025 法國 南特
音頻編碼器能力挑戰賽 Workshop
期待您的到來!