目錄
AAC音頻格式介紹
主要特點
技術優勢
常見文件擴展名
應用領域
AAC與PCM的區別與優勢對比
基本概念差異
主要技術區別
各自優勢
PCM的優勢
AAC的優勢
應用場景選擇
AAC音頻數據格式解析
1. AAC 文件格式
(1) ADIF (Audio Data Interchange Format)
(2) ADTS (Audio Data Transport Stream)
2. AAC 裸流格式(Raw AAC)
(1) AudioSpecificConfig
(2) AAC 數據幀
3. AAC 編碼類型(Profile)
4. AAC vs. MP3 數據對比
5. 解析工具
總結
?
AAC音頻格式介紹
AAC(Advanced Audio Coding,高級音頻編碼)是一種有損數字音頻壓縮格式,由MPEG(Moving Picture Experts Group)和ISO/IEC聯合開發,作為MP3格式的后繼者。
主要特點
-
高效壓縮:在相同比特率下,AAC通常能提供比MP3更好的音質
-
廣泛支持:被Apple iTunes、YouTube、Android、iOS等廣泛采用
-
采樣率范圍:8-96 kHz
-
多聲道支持:最多支持48個聲道
-
擴展性:支持可變比特率(VBR)和恒定比特率(CBR)
技術優勢
-
采用改進的濾波器組(改進的離散余弦變換)
-
時域噪聲整形(TNS)
-
預測技術
-
聯合立體聲編碼
-
量化噪聲處理更精細
-
更高效的霍夫曼編碼
常見文件擴展名
-
.aac - ADIF格式的AAC文件
-
.m4a - MPEG-4音頻(通常為AAC編碼)
-
.mp4 - MPEG-4容器(可能包含AAC音頻)
應用領域
-
流媒體服務(如Spotify、Apple Music)
-
數字電視和廣播
-
移動設備音頻
-
視頻游戲音效
-
網絡視頻(如YouTube)
AAC已成為當今最流行的音頻格式之一,尤其在蘋果生態系統中占據主導地位。
AAC與PCM的區別與優勢對比
基本概念差異
PCM (脈沖編碼調制):
-
原始無損音頻格式
-
直接記錄聲音波形的數字樣本
-
未壓縮格式,文件體積大
-
CD音頻的標準格式(44.1kHz/16bit)
AAC (高級音頻編碼):
-
有損壓縮音頻格式
-
使用心理聲學模型去除人耳不易察覺的聲音信息
-
通過復雜算法大幅減小文件體積
-
MPEG標準的一部分,廣泛用于流媒體和移動設備
主要技術區別
特性 | PCM | AAC |
---|---|---|
壓縮方式 | 無壓縮 | 有損壓縮 |
數據量 | 大(約10MB/分鐘CD音質) | 小(約1MB/分鐘128kbps) |
音質 | 原始無損 | 接近無損(高比特率時) |
處理復雜度 | 低 | 高(編解碼需要更多計算) |
延遲 | 低 | 較高(編碼需要緩沖) |
各自優勢
PCM的優勢
-
完美音質:保留原始音頻所有細節
-
低處理延遲:無需編解碼,實時性好
-
編輯友好:多次編輯不會造成音質損失
-
通用兼容:所有音頻設備都支持基本PCM格式
-
專業應用:音樂制作、錄音棚等專業領域標準
AAC的優勢
-
高效壓縮:比MP3更高效,相同體積音質更好
-
節省空間:適合移動設備和流媒體傳輸
-
網絡友好:減少帶寬需求,加快傳輸速度
-
廣泛支持:蘋果生態、Android、流媒體平臺普遍支持
-
靈活比特率:支持從低質量語音到高質量音樂的不同需求
應用場景選擇
使用PCM的情況:
-
專業音頻制作和母帶處理
-
需要多次編輯的音頻工程
-
對延遲敏感的實時音頻應用
-
需要絕對保真度的場景
使用AAC的情況:
-
消費級音樂播放和流媒體
-
移動設備存儲音頻文件
-
網絡視頻的音頻軌道
-
需要節省存儲空間的場合
現代音頻系統通常會根據需要在PCM和AAC之間轉換,如在錄音時使用PCM,分發時轉換為AAC。
AAC音頻數據格式解析
AAC(Advanced Audio Coding)是一種高效的有損音頻壓縮格式,廣泛應用于流媒體、數字廣播和移動設備。其數據格式可以分為文件格式和裸流格式兩種主要形式。
1. AAC 文件格式
AAC通常以容器格式存儲,常見的包括:
-
.aac(ADIF 或 ADTS 格式)
-
.m4a(MPEG-4 容器,通常為 AAC-LC)
-
.mp4(MPEG-4 視頻/音頻容器)
-
.3gp(移動設備常用)
(1) ADIF (Audio Data Interchange Format)
-
特點:整個文件只有一個頭部,后面緊跟連續的 AAC 數據幀。
-
適用場景:本地存儲,不適合流式傳輸(因為必須從頭開始解碼)。
-
結構:
| ADIF Header | Raw AAC Data Frames... |
(2) ADTS (Audio Data Transport Stream)
-
特點:每個 AAC 數據幀前都有一個同步頭,適合流媒體傳輸(如 HTTP Live Streaming)。
-
適用場景:網絡流媒體、實時廣播。
-
結構:
| ADTS Header | AAC Frame | ADTS Header | AAC Frame | ... |
-
ADTS 頭結構(7或9字節):
字段 位數 說明 Sync Word 12 bits 固定? 0xFFF
,用于幀同步MPEG Version 1 bit 0
=MPEG-4,?1
=MPEG-2Layer 2 bits 固定? 00
(AAC無Layer概念)Protection Absent 1 bit 1
=無CRC校驗,0
=有CRCProfile 2 bits 0
=AAC Main,?1
=AAC LC,?2
=AAC SSR,?3
=AAC LTPSampling Freq Index 4 bits 采樣率索引(如? 4
=44.1kHz)Private Bit 1 bit 通常為? 0
Channel Config 3 bits 聲道配置(如? 2
=雙聲道)Original/Copy 1 bit 0
=原始,?1
=復制Home 1 bit 通常為? 0
Copyright ID Bit 1 bit 版權標識 Copyright ID Start 1 bit 版權開始標識 Frame Length 13 bits ADTS幀總長度(頭+AAC數據) Buffer Fullness 11 bits 碼流緩沖信息 Num of Raw Data Blocks 2 bits 0
=1個AAC幀
2. AAC 裸流格式(Raw AAC)
AAC裸流數據通常存儲在MP4等容器中,其結構由音頻配置信息(AudioSpecificConfig)和原始數據幀組成。
(1) AudioSpecificConfig
-
描述AAC的編碼參數,通常存儲在MP4的
esds
(Elementary Stream Descriptor)或ADTS頭中。 -
結構(2字節或更多):
字段 位數 說明 Audio Object Type 5 bits 編碼類型(如? 2
=AAC-LC)Sampling Freq Index 4 bits 采樣率索引(同ADTS) Channel Config 4 bits 聲道配置(同ADTS) GASpecificConfig 可變 擴展參數(如幀長、是否含SBR/PS等)
(2) AAC 數據幀
-
AAC 數據以幀(Frame)為單位存儲,每幀包含:
-
1024個PCM樣本(AAC-LC)或?960個樣本(AAC-LD,低延遲模式)。
-
采用改進的離散余弦變換(MDCT)進行頻域編碼。
-
使用霍夫曼編碼進一步壓縮數據。
-
3. AAC 編碼類型(Profile)
AAC有多個變種,適用于不同場景:
Profile | 說明 | 典型應用 |
---|---|---|
AAC-LC (Low Complexity) | 標準AAC,平衡音質和計算量 | 音樂流媒體(Spotify、Apple Music) |
AAC-HE (High Efficiency, v1) | 結合SBR(頻帶復制),提高低碼率音質 | 網絡廣播、低比特率傳輸 |
AAC-HEv2 (v2) | 增加PS(參數立體聲),進一步壓縮立體聲數據 | 超低碼率語音/音樂 |
AAC-LD (Low Delay) | 低延遲(~20ms),適合實時通信 | 視頻會議、VoIP |
AAC-ELD (Enhanced Low Delay) | 增強低延遲,音質更好 | 高清語音通話 |
4. AAC vs. MP3 數據對比
特性 | AAC | MP3 |
---|---|---|
壓縮效率 | 更高(相同音質下文件更小) | 較低 |
音質 | 高頻保留更好,低碼率表現更優 | 高碼率接近AAC,低碼率較差 |
幀結構 | 固定1024樣本(LC)或960(LD) | 1152樣本(MPEG1)或576(MPEG2) |
延遲 | 較高(編碼需緩沖) | 較低 |
專利 | 需授權(但已廣泛免費支持) | 專利已過期 |
5. 解析工具
-
FFmpeg:可提取AAC裸流并分析:
sh
復制
下載
ffmpeg -i input.aac -c:a copy -f adts output.aac
-
Hex Editor:手動分析ADTS頭。
-
MP4Box:解析MP4中的AAC配置:
sh
復制
下載
MP4Box -info input.mp4
總結
-
ADIF?適合本地存儲,ADTS?適合流式傳輸。
-
AAC裸流?由?
AudioSpecificConfig
?+ 數據幀組成。 -
AAC-LC?最常用,AAC-HE/HEv2?適合低碼率,AAC-LD/ELD?適合實時通信。
-
比MP3更高效,但計算復雜度更高。
AAC憑借其高壓縮比和優秀音質,已成為現代音頻編碼的主流標準。
?