杜比全景聲——空間音頻技術

  • 什么是杜比?
  • 是否是標清、高清、超清之上的更清晰的格式?
  • 杜比全景聲 和傳統多聲道立體聲的差別?
  • 杜比全景聲音頻的渲染方式?
  • 車載平臺上杜比技術的應用?
  1. 杜比技術的起源

  • 杜比實驗室(Dolby Laboratories)是一家總部位于美國的公司,由雷·杜比(Ray Dolby)于1965年在英國倫敦創立。雷·杜比是一位物理學家和電子工程師,他的目標是改進錄音質量。他的第一個發明是杜比降噪系統,這是一種可以顯著減少磁帶錄音中背景噪聲的技術。
  • 2010年6月,杜比推出了杜比7.1環繞聲(Dolby Surround 7.1),并在全球范圍建立起與影院的合作,推出配置7.1環繞音箱的杜比影廳
  • 杜比全景聲(Dolby Atmos)是杜比實驗室于2012年推出的高級環繞聲標準,用于電影院,通過將前置、側置、后置和天空揚聲器加上復雜的音頻處理和算法相結合,提供高達最高64聲道的環繞聲,增加空間沉浸感
  1. 杜比技術的應用

杜比的技術在電影制作中尤其重要。杜比數字(Dolby Digital)是一種音頻壓縮技術,它使得電影制作人可以在電影中使用更豐富、更逼真的聲音。杜比全景聲(Dolby Atmos)則進一步提升了這種體驗,它允許聲音在三維空間中移動,給觀眾帶來沉浸式的體驗。

  1. 杜比的三大核心技術

  • 杜比數字(Dolby Digital): 一種音頻壓縮技術,比如AC-3格式,將6個聲道的數據壓縮到一個數據流中。應用于DVD、藍光光盤;
  • 杜比全景聲 (Dolby Atoms): 音頻領域革命性的技術,徹底摒棄傳統聲道概念,將聲音視為“對象”,在三維空間自由移動,從而模擬逼真的場景。應用在電影、電視和音樂制作;
  • 杜比視界(Dolby Vision): 高動態范圍(HDR)視頻技術,提供更亮、更暗、更豐富的顏色。主要用于投影和高端電視。
  1. 基礎概念科普

4.1 音頻編碼技術

PCM 是指脈沖編碼調制(Pulse Code Modulation),是數字通信的編碼方式之一,是一種將模擬信號數字化的方法。主要過程是將話音等模擬信號每隔一定時間進行取樣,使其離散化,同時將抽樣值按分層單位四舍五入取整量化,同時將抽樣值按一組二進制碼來表示抽樣脈沖的幅值。

我們熟悉的MP3、AAC、OPUS通常都是基于PCM進行壓縮編碼的格式

4.2 聲道(Channel)/聲床(Bed)

聲道(Sound Channel ): 是指聲音在錄制或播放時在不同空間位置采集或回放的相互獨立的音頻信號,所以聲道數也就是聲音錄制時的音源數量或回放時相應的揚聲器數量。聲床是制作端對于聲道的對應說法。

4.2.1 1維音頻

基于單聲道的PCM編碼,我們稱為一維音頻

4.2.2 2維音頻

用兩個不同的PCM進行雙聲道播放,可以稱為二維音頻

4.2.3 2.5維音頻

多個聲道進行播放,即為2.5維音頻

2.5維音頻常見的配置有:

  • 5.1聲道: 表示有五個普通聲道+1個低音聲道:

  • 7.1:7個普通聲道+1個低音聲道

超重低音聲道提供20-120Hz的聲音

4.1.4 3維音頻

引入天空聲道,即為3維音頻

  • 代表性的是7.1.4: 7個平面聲道+1個低音聲道+4個天空聲道

  • 9.1.6: 9個平面聲道+1個低音聲道+6個天空聲道

x.y.z的涵義:

  • x通常代表耳平面的傳統環繞聲道的數量(如前置、中置、環繞);
  • y代表低音聲道的數量,雖然我們見到的大多都是1,但在“多炮”的揚聲器排布下,甚至可以提高到4個或更多低音揚聲器,在更大的空間中實現理想的低頻響應;
  • z代表天空聲道的數量,天空(或稱高度)聲道的存在使得揚聲器排布從平面提升為立體,能夠通過響度和時間差的調整,控制聲像在三維空間中的方向。

傳統聲道的概念還是基于左右兩聲道完成,每個聲音元素的發聲點局限在空間中相對固定的聲道/揚聲器中,要求聲道數量和擺放位置完全一樣

在飛機飛過的時候,音量、頻率、延時等等都會發生變化

4.1.5 立體聲音效發展歷程

4.3 聲音對象(Object)

聲音不再局限于聲道或者音箱,可以自由擺放在虛擬的三維空間中的任意位置,可以按照設計的軌跡進行運動。

設計好每個對象的軌跡之后,這些對象的位移信息再由渲染器進行計算出哪個音箱要出多大聲或者要延遲多少ms才能使得某個聲音元素聽起來像是它本來應該在的位置。

這種概念的引入使得回放系統的配置更加靈活,這樣一來不論是簡單的Soundbar,或者耳機,或者5.1.2、9.3.6的家庭影院,都可以通過計算而渲染出全景聲音效

Pan-through array: The sound can travel through each speaker placed around and above the audience as it moves across the cinema, in what’s called a pan-through array.

優點:

  • 全景特效:聲音更真實,更立體
  • 兼容性高:不需要Care具體的播放設備的規格、數量及設備的擺放,都能達到同樣的效果
  1. 杜比全景聲的產生過程

解碼方式:

  1. 直通(Passthrough): 指電視或投影或機頂盒——不對音軌進行任何解碼,直接將原音頻數據傳輸給回音壁或者功放。一臺機器想要支持源碼輸出,需要經過杜比和DTS的授權認證。

  2. 解碼: 指將Dolby AtmoS的音頻信息在電視或投影或機頂盒端先完成解碼再映射到回音壁的方式。由于杜比公司有專利保護,任何想要解碼的硬件或軟件播放器,都需要向杜比支付授權費才能獲得解碼密鑰。這也是很多設備并不支持的自己解碼的原因。

  3. 轉碼: 指播放Dolby Atmos的設備或軟件本身不是直連回音壁,還需要將聲音傳給中間商。此時會把音頻打包轉碼成普通的LPCM音頻格式,在這個過程中會丟失的是全景聲的元數據。就不再是7.1.2而上7.1聲道。效果也是有損的

  4. 雙耳渲染

6.1 頭部跟蹤

頭部跟蹤的必要性是一個大話題,為了更清晰地認知頭部跟蹤的必要性,我們需要了解人對于聲音方位感的感知原理。人們對聲音方位感的判斷主要有4個依據:時間差、聲級差、人體濾波效應和頭部晃動

  1. 時間差(Interaural Time Difference, ITD):

聲音到達雙耳的距離不一樣,時間不一樣,會有延時

  1. 聲級差(Interaural Level Difference, ILD):

由于雙耳和音源的距離差異,也會造成此外,頭部的遮擋,也會使得到達左耳與右耳聲音的聲壓級是不同的,進一步形成聲級差。

不同頻率的聲波會發生衍生的效果也不一樣

  1. 人體濾波效應:

人的頭部、肩頸、軀干,會對來自不同方向的聲音產生不同的作用,形成反射、遮擋或衍射。

大腦通過這些不同的濾波效果產生對聲源方位的判斷,這就是著名的頭部相關傳輸函數——HRTFs (Head-Related Transfer Functions)。

  1. 頭部的晃動:

當一個聲源的位置難以判斷的時候,人們常常會不自覺的輕微晃動頭部,使時間差、聲級差或人體濾波效應產生變化,并依據這些變化進行快速的重新定位

在現實中,聲源位于三維的空間中,通常都需要我們綜合時間差、聲級差、人體濾波效應這三個要素可以被綜合的表述為頭部相關傳輸函數(Head-Related Transfer Functions, HRTFs),這項技術構成了絕大部分三維聲定位技術的基礎。頭部晃動雖然并不是一個決定性因素,但是無論在哪個方向上,都對我們判斷聲源的位置有著極大地幫助

6.2 雙耳渲染

室內聲場有3個組成部分:直達聲、早期反射聲和混響聲。人們對于聲音的空間感主要是依據早期反射聲和混響聲來建立的。

  1. 直達聲

聲音直接穿到人耳所感知到的聲音

  1. 反射聲

聲音通過回音壁和障礙物經過多次反射進入人耳所感知到聲音

  1. 混響聲

聲音在空間中不斷反射、衰減,形成了均勻、密集的混響聲,與直達聲、反射聲共同建立起室內聲場。這是一個經過多次反射的、沒有方向性的聲音,當然沒有方向性也就是說它會來自三維空間內的各個方向。

6.3 聲音的采集

目前移動設備擁有最大用戶基群,耳機成為主要的播放場景。雙耳信號回放的終極目標就是在聽音者鼓膜處再現與實際聽音環境相同的聲學信號

常見的有兩種采集方式:

  1. 在同一位置進行錄音和回放(Dummy Head人頭錄音)

這種方式缺點顯而易見,制約了現代音樂產業中的混音工作,不適合非現場演出的錄音和回放

  1. 采取“計算音頻”的方式,模擬在真實聽音環境中聆聽一個或多個真實揚聲器的聽覺體驗

從理論上來說,只要模擬足夠精確,雙耳重放應該完全可以重現多個揚聲器的聽感(不包括其他感官),畢竟人的耳朵本身也是雙聲道的

  1. 移動設備的杜比全景聲回放

對于用戶終端對于杜比全景聲的回放處理,下面先看一張表,這張表整理了各個流媒體平臺在各個硬件終端上對于杜比全景聲的處理方式,表中撰寫的狀態,是APP從云端下發給終端設備的音源的規格

AtmosAndroidiOSWIndowsMacTV* (For AVR)
Apple MusicEAC3-JOC 768kbpsEAC3-JOC 768kbpsEAC3-JOCEAC3-JOC
QQ音樂AC4-IMS 256kbps雙耳渲染EAC3-JOC 448kbps
網易云音樂雙耳渲染EAC3-JOC 768kbps
Apple TVEAC3-JOC 768kbps7.1.4EAC3-JOC
愛奇藝5.1(部分廠商)雙耳渲染立體聲立體聲EAC3-JOC
優酷雙耳渲染雙耳渲染立體聲立體聲立體聲
騰訊視頻雙耳渲染多聲道立體聲立體聲EAC3-JOC
Bilibili雙耳渲染多聲道立體聲立體聲立體聲
本地音視頻APP√(Android 13)

可以看到,各大終端里,只有Apple在自己的硬軟件生態內保持了相對原始的聲道信息,亦即保留了更多的空間信息。

從2020年開始,安卓廠商們還陸續往手機里集成了Dolby格式的解碼器,配合著杜比的效果調試(包擴DRC,人聲增強,響度均衡,頻響調整,聲道互饋等),就統稱為“杜比全景聲”。

  1. 杜比全景聲的制作

渲染流程:

制作過程:

  1. Eletre中的杜比

路特斯 lambda 配置豪華的座艙 音響系統

  • 選用英國品牌KEF,兩個配置:

    • 2D配置支持15揚,7.1全景聲,額定功率1400W
    • 3D配置支持23揚,7.1.4全景聲,額定功率2120W。
  • 需要刷杜比Key才能使用,杜比Key是杜比官方授權密鑰,不安裝不能播放。565和臺架均不能播放

  • 杜比全景聲內容:主要包括杜比介紹視頻、QQ音樂+索尼高品質的7.1.4音樂展示、音樂播放器、音樂播放的信

息展示及控制(HUD顯示、語音控制、方控等)、整車聲音設置的杜比全景聲的試聽及

app入口。

  • 杜比播放器也叫高品質音樂,英文名是:HYPER Music,圖標如下:

杜比App主界面:

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/43399.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/43399.shtml
英文地址,請注明出處:http://en.pswp.cn/web/43399.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

大數據基礎:Hadoop之MapReduce重點架構原理

文章目錄 Hadoop之MapReduce重點架構原理 一、MapReduce概念 二、MapReduce 編程思想 2.1、Map階段 2.2、Reduce階段 三、MapReduce處理數據流程 四、MapReduce Shuffle 五、MapReduce注意點 六、MapReduce的三次排序 Hadoop之MapReduce重點架構原理 一、MapReduce概…

ORACLE重裝之后恢復數據庫,相當于sqlserver的附加數據庫

在開發機器上經常會遇到重裝系統的問題,重裝之前如果ORACLE沒有及時備份的話重裝之后就糾結了,數據還原很頭疼。 只能找到一些ORACLE安裝與重裝系統前目錄相同的解決辦法,目錄不同就沒招了。 我用的是oracle11G。老版的應該相似。 經過我的嘗試,找到了幾個關鍵點,現在分…

講講 JVM 的內存結構(附上Demo講解)

講講 JVM 的內存結構 什么是 JVM 內存結構?線程私有程序計數器?虛擬機棧本地方法棧 線程共享堆?方法區?注意永久代?元空間?運行時常量池?直接內存? 代碼詳解 什么是 JVM 內存結構? JVM內存結構分為5大區域,程序計數器、虛擬機棧、本地…

C# 泛型

泛型 泛型不是語法糖,而是由框架提供的一種便捷語法,首次出現在.NET 2.0中。 1. 泛型定義 泛型:是一種程序特性,定義時不對類型做出明確的規定,使用時規定且不能改變。一般應用:泛型集合、泛型方法、泛型…

機器學習——LR、?GBDT、?SVM、?CNN、?DNN、?RNN、?Word2Vec等模型的原理和應用

LR(邏輯回歸) 原理: 邏輯回歸模型(Logistic Regression, LR)是一種廣泛應用于分類問題的統計方法,尤其適用于二分類問題。其核心思想是通過Sigmoid函數將線性回歸模型的輸出映射到(0,1)區間,從…

【AI前沿】深度學習:神經網絡基礎

文章目錄 📑引言一、神經元和感知器1.1 神經元的基本概念1.2 感知器模型 二、多層感知器(MLP)2.1 MLP的基本結構2.2 激活函數的重要性2.3 激活函數2.4 激活函數的選擇 三、小結 📑引言 深度學習是現代人工智能的核心技術之一&…

kotlin Flow 學習指南 (三)最終篇

目錄 前言Flow生命周期StateFlow 替代LiveDataSharedFlow其他常見應用場景處理復雜、耗時邏輯存在依賴關系的接口請求組合多個接口的數據 Flow使用注意事項總結 前言 前面兩篇文章,介紹了Flow是什么,如何使用,以及相關的操作符進階&#xff…

如何挑選適合的需求池管理系統?10款優質工具分享

本文將分享10款優質需求池管理工具:PingCode、Worktile、Teambition、Epicor Kinetic、TAPD、SAP IBP、Logility、RELEX Solutions、JIRA、明道云。 在管理項目和產品需求時,正確的工具能夠大幅提高效率與透明度。如何從眾多需求池工具中選擇最適合團隊的…

第一節 SHELL腳本中的常用命令(2)

二,網絡管理命令nmcli 1.查看網卡 # 或者先用ip addr或ip a等查看網卡 ip a s 網卡名 ifconfig 網卡名 nmcil device show 網卡名 nmcil device status nmcil connection show 網卡名2.設置網卡 a)當網卡未被設置過時 設置dncp網絡工作模式 nmcil connection add con-name…

Rust編程-編寫自動化測試

編寫單元測試步驟: 1. 準備所需的數據 2. 調用需要測試的代碼 3. 斷言運行結果與我們所期望的一致 Rust的test元數據: #[cfg(test)]:是一個屬性宏(attribute macro)。用于控制特定的代碼段僅在測試環境中編譯…

自定義類型:聯合體

像結構體一樣,聯合體也是由一個或者多個成員組成,這些成員可以是不同的類型。 聯合體類型的聲明 編譯器只為最?的成員分配?夠的內存空間。聯合體的特點是所有成員共?同?塊內存空間。所以聯合體也叫:共?體。 輸出結果: 聯合體…

size_t 數據類型的好處

什么是size_t size_t 類型在不同的平臺上對應不同的底層整數類型,具體取決于平臺的指針大小。size_t 主要用于表示大小和長度,如數組的元素數量、緩沖區的大小等,它的設計目的是為了匹配指針的大小,以避免類型不匹配引起的錯誤。…

代碼隨想錄算法訓練營DAY58|101.孤島的總面積、102.沉沒孤島、103. 水流問題、104.建造最大島嶼

忙。。。寫了好久。。。。慢慢補吧。 101.孤島的總面積 先把周邊的島嶼變成水dfs def dfs(x, y, graph, s):if x<0 or x>len(graph) or y<0 or y>len(graph[0]) or graph[x][y]0:return sgraph[x][y]0s1s dfs(x1, y, graph, s)s dfs(x-1, y, graph, s)s dfs(…

【爬蟲入門知識講解:xpath】

3.3、xpath xpath在Python的爬蟲學習中&#xff0c;起著舉足輕重的地位&#xff0c;對比正則表達式 re兩者可以完成同樣的工作&#xff0c;實現的功能也差不多&#xff0c;但xpath明顯比re具有優勢&#xff0c;在網頁分析上使re退居二線。 xpath 全稱為XML Path Language 一種…

軟考高級第四版備考--第16天(規劃溝通管理)Plan Communication Management

定義&#xff1a;基于每個干系人或干系人群體的信息需求、可用的組織資產以及具體的項目的需求&#xff0c;為項目溝通活動制定恰當的方法和計劃的過程。 作用&#xff1a; 及時向干系人提供相關信息&#xff1b;引導干系人有效參與項目&#xff1b;編制書面溝通計劃&#xf…

【基于R語言群體遺傳學】-16-中性檢驗Tajima‘s D及連鎖不平衡 linkage disequilibrium (LD)

Tajimas D Test 已經開發了幾種中性檢驗&#xff0c;用于識別模型假設的潛在偏差。在這里&#xff0c;我們將說明一種有影響力的中性檢驗&#xff0c;即Tajimas D&#xff08;Tajima 1989&#xff09;。Tajimas D通過比較數據集中的兩個&#x1d703; 4N&#x1d707;估計值來…

vue項目中常見的一些preset及其關系

Babel的作用 Babel主要用途是用來做js代碼轉換的&#xff0c;將最新的js語法或者api轉換成低版本瀏覽器可兼容執行的代碼。 語法兼容是指一些瀏覽器新特性增加的js寫法&#xff0c;例如箭頭函數 ()>{}&#xff1b;低版本的瀏覽器無法識別這些&#xff0c;會導致一些語法解…

spark shuffle寫操作——UnsafeShuffleWriter

PackedRecordPointer 使用long類型packedRecordPointer存儲數據。 數據結構為&#xff1a;[24 bit partition number][13 bit memory page number][27 bit offset in page] LongArray LongArray不同于java中long數組。LongArray可以使用堆內內存也可以使用堆外內存。 Memor…

秋招突擊——7/9——字節面經

文章目錄 引言正文八股MySQL熟悉嗎&#xff1f;講一下MySQL索引的結構&#xff1f;追問&#xff1a;MySQL為什么要使用B樹&#xff1f;在使用MySQL的時候&#xff0c;如何避免索引失效&#xff1f;講一下MySQL的事物有哪幾種特征&#xff1f;MySQL的原子性可以實現什么效果&…

GESP C++ 三級真題(2023年9月)T2 進制判斷

進制判斷 問題描述 N進制數指的是逢N進一的計數制。例如&#xff0c;人們日常生活中大多使用十進制計數&#xff0c; 而計算機底層則一般使用二進制。除此之外&#xff0c;八進制和十六進制在一些場合也是 常用的計數制(十六進制中&#xff0c;一般使用字母A至F表示十至十五…