MP3技術白皮書-音頻格式全解析

MP3的技術雖然現在已經完全公開,但是,其具體的技術細節還是有一定的深度,因此此次小編對某些技術進行深度解釋,希望網友們笑納。

采樣率:

  數碼音頻系統是通過將聲波波形轉換成一連串的二進制數據來再現原始聲音的,實現這個步驟使用的設備是模/數轉換器(A/D)它以每秒上萬次的速率對聲波進行采樣,每一次采樣都記錄下了原始模擬聲波在某一時刻的狀態,稱之為樣本。

  將一串的樣本連接起來,就可以描述一段聲波了,把每一秒鐘所采樣的數目稱為采樣頻率或采率,單位為HZ(赫茲)。采樣頻率越高所能描述的聲波頻率就越高。 對于每個采樣系統均會分配一定存儲位(bit數)來表達聲波的聲波振幅狀態,稱之為采樣分辯率或采樣精度,每增加一個bit,表達聲波振幅的狀態數就翻一翻,并且增加6db的動態范圍態,即6db的動態范圍,一個2bit的數碼音頻系統表達千種狀態,即12db的動態范圍,以此類推。如果繼續增加bit數則采樣精度就將以非常快的速度提高,可以計算出16bit能夠表達65536種狀態,對應,96db 而20bit可以表達1048576種狀態,對應120db。24bit可以表達多達16777216種狀態。對應144db的動態范圍,采樣精度越高,聲波的還原就越細膩。(注:動態范圍是指聲音從最弱到最強的變化范圍)人耳的聽覺范圍通常是20HZ~20KHZ。

  根據奈魁斯特(NYQUIST)采樣定理,用兩倍于一個正弦波的頻繁率進行采樣就能完全真實地還原該波形,因此一個數碼錄音波的休樣頻率直接關系到它的最高還原頻率指標例如,用44.1KHZ的采樣頻率進行采樣,則可還原最高為22.05KHZ的頻率-----這個值略高于人耳的聽覺極限,(注: 可錄MD,例R900的取樣頻率為44.1KHZ并且有取樣頻率轉換器,可將輸入的32KHz/44.1KHZ/48KHZ轉換為該機的標準取樣頻率44.1KHZ的還原頻率足已記示和真實再現世界上所有人再能辯的聲音了,所以CD音頻的采樣規格定義為16bit。44KHZ, 即使在最理想的環境下用現實生活中幾乎不可能制造的高精密電子元器件真實地實現了16bit的錄音,仍然會受到濾波和聲特定位等問題的困擾,人們還是能察覺出一些微小的失真所以很多專業數碼音頻系統已經使用18bit甚至24bit 進行錄音和回放了。

現有的采樣方式:

  MP3:MP3的全稱應為MPEG1 Layer-3音頻文件,MPEG(Moving Picture Experts Group)在漢語中譯為活動圖像專家組,特指活動影音壓縮標準,MPEG音頻文件是MPEG1標準中的聲音部分,也叫MPEG音頻層,它根據壓縮質量和編碼復雜程度劃分為三層,即Layer-1、Layer2、Layer3,且分別對應MP1、MP2、MP3這三種聲音文件,并根據不同的用途,使用不同層次的編碼。MPEG音頻編碼的層次越高,編碼器越復雜,壓縮率也越高,MP1和MP2的壓縮率分別為4:1和6:1-8:1,而MP3的壓縮率則高達10:1-12:1,也就是說,一分鐘CD音質的音樂,未經壓縮需要10MB的存儲空間,而經過MP3壓縮編碼后只有1MB左右。不過MP3對音頻信號采用的是有損壓縮方式,為了降低聲音失真度,MP3采取了“感官編碼技術”,即編碼時先對音頻文件進行頻譜分析,然后用過濾器濾掉噪音電平,接著通過量化的方式將剩下的每一位打散排列,最后形成具有較高壓縮比的MP3文件,并使壓縮后的文件在回放時能夠達到比較接近原音源的聲音效果。(另MP3PRO:mp3PRO編碼器將音頻的錄音分成兩個部分:mp3部分和PRO部分。mp3部分分析低頻段(Low Frequency Band)信息,并將其編碼成通常的mp3文件數據流。這就使得編碼器能夠集中編碼更少的有用信息,獲得更佳品質的編碼效果。同時,這也保證了mp3PRO文件同老的mp3播放器的兼容性。PRO部分分析的則是高頻段(High Frequency Band)信息,并將其編碼成mp3數據流的一部分,而這些通常在老的mp3解碼器里是被忽略的。新的mp3PRO解碼器會有效地利用這部分數據流,將兩段(高頻段和低頻段)合并起來產生完全的音頻帶,達到增強音質的效果。)

  WMA:WMA就是Windows Media Audio編碼后的文件格式,由微軟開發,WMA針對的不是單機市場,是網絡!競爭對手就是網絡媒體市場中著名的Real Networks。微軟聲稱,在只有64kbps的碼率情況下,WMA可以達到接近CD的音質。和以往的編碼不同,WMA支持防復制功能,她支持通過Windows Media Rights Manager 加入保護,可以限制播放時間和播放次數甚至于播放的機器等等。WMA支持流技術,即一邊讀一邊播放,因此WMA可以很輕松的實現在線廣播,由于是微軟的杰作,因此,微軟在Windows中加入了對WMA的支持,WMA有著優秀的技術特征,在微軟的大力推廣下,這種格式被越來越多的人所接受。

  WAV:這是一種古老的音頻文件格式,由微軟開發。WAV是一種文件格式,符合 PIFF Resource Interchange File Format規范。所有的WAV都有一個文件頭,這個文件頭音頻流的編碼參數。WAV對音頻流的編碼沒有硬性規定,除了PCM之外,還有幾乎所有支持ACM規范的編碼都可以為WAV的音頻流進行編碼。很多朋友沒有這個概念,我們拿AVI做個示范,因為AVI和WAV在文件結構上是非常相似的,不過AVI多了一個視頻流而已。我們接觸到的AVI有很多種,因此我們經常需要安裝一些Decode才能觀看一些AVI,我們接觸到比較多的DivX就是一種視頻編碼,AVI可以采用DivX編碼來壓縮視頻流,當然也可以使用其他的編碼壓縮。同樣,WAV也可以使用多種音頻編碼來壓縮其音頻流,不過我們常見的都是音頻流被PCM編碼處理的WAV,但這不表示WAV只能使用PCM編碼,MP3編碼同樣也可以運用在WAV中,和AVI一樣,只要安裝好了相應的Decode,就可以欣賞這些WAV了。在Windows平臺下,基于PCM編碼的WAV是被支持得最好的音頻格式,所有音頻軟件都能完美支持,由于本身可以達到較高的音質的要求,因此,WAV也是音樂編輯創作的首選格式,適合保存音樂素材。因此,基于PCM編碼的WAV被作為了一種中介的格式,常常使用在其他編碼的相互轉換之中,例如MP3轉換成WMA。


  Ogg Vorbis :號稱MP3殺手!Ogg Vorbis究竟什么來頭呢?OGG是一個龐大的多媒體開發計劃的項目名稱,將涉及視頻音頻等方面的編碼開發。整個OGG項目計劃的目的就是向任何人提供完全免費多媒體編碼方案!OGG的信念就是:OPEN!FREE!Vorbis這個詞匯是特里·普拉特柴特的幻想小說《Small Gods》中的一個"花花公子"人物名。這個詞匯成為了OGG項目中音頻編碼的正式命名。目前Vorbis已經開發成功,并且開發出了編碼器。Ogg Vorbis是高質量的音頻編碼方案,官方數據顯示:Ogg Vorbis可以在相對較低的數據速率下實現比MP3更好的音質!Ogg Vorbis這種編碼也遠比90年代開發成功的MP3先進,她可以支持多聲道,這意味著什么?這意味著Ogg Vorbis在SACD、DTSCD、DVD AUDIO抓軌軟件(目前這種軟件還沒有)的支持下,可以對所有的聲道進行編碼,而不是MP3只能編碼2個聲道。多聲道音樂的興起,給音樂欣賞帶來了革命性的變化,尤其在欣賞交響時,會帶來更多臨場感。這場革命性的變化是MP3無法適應的。和MP3一樣,Ogg Vorbis是一種靈活開放的音頻編碼,能夠在編碼方案已經固定下來后還能對音質進行明顯的調節和新算法的改良。因此,它的聲音質量將會越來越好,和MP3相似,Ogg Vorbis更像一個音頻編碼框架,可以不斷導入新技術逐步完善。和MP3一樣,OGG也支持VBR。

  RA:RA就是RealAudio格式,這是各位網蟲接觸得非常多的一種格式,大部分音樂網站的在線試聽都是采用了RealAudio,這種格式完全針對的就是網絡上的媒體市場,支持非常豐富的功能。最大的閃爍點就是這種格式可以根據聽眾的帶寬來控制自己的碼率,在保證流暢的前提下盡可能提高音質。RA可以支持多種音頻編碼,包括ATRAC3。和WMA一樣,RA不但都支持邊讀邊放,也同樣支持使用特殊協議來隱匿文件的真實網絡地址,從而實現只在線播放而不提供下載的欣賞方式。這對唱片公司和唱片銷售公司很重要,在各方的大力推廣下,RA和WMA是目前互聯網上,用于在線試聽最多的音頻媒體格式。

  APE:APE是Monkey's Audio提供的一種無損壓縮格式。Monkey's Audio提供了Winamp的插件支持,因此這就意味著壓縮后的文件不再是單純的壓縮格式,而是和MP3一樣可以播放的音頻文件格式。這種格式的壓縮比遠低于其他格式,但能夠做到真正無損,因此獲得了不少發燒用戶的青睞。在現有不少無損壓縮方案種,APE是一種有著突出性能的格式,令人滿意的壓縮比以及飛快的壓縮速度,成為了不少朋友私下交流發燒音樂的唯一選擇。

  ACC:AAC(高級音頻編碼技術,Advanced Audio Coding)是杜比實驗室為音樂社區提供的技術。AAC號稱「最大能容納48通道的音軌,采樣率達96 KHz,并且在320Kbps的數據速率下能為5.1聲道音樂節目提供相當于ITU-R廣播的品質」。和MP3比起來,它的音質比較好,也能夠節省大約30%的儲存空間與帶寬。它是遵循MPEG-2的規格所開發的技術。

  ATRAC 3/ATRAC 3 plus:ATRAC3(AdaptiveTransformAcousticCoding3)由日本索尼公司開發,是MD所采用的ATRAC的升級版,其壓縮率(約為ATRAC的2倍)和音質均與MP3相當。壓縮原理包括同時掩蔽、時效掩蔽和等響度曲線等,與MP3大致相同。ATRAC3的版權保護功能采用的是OpenMG。目前,對應ATRAC3的便攜式播放機主要是索尼公司自己的產品。不過,該公司已于2000年2月與富士通、日立、NEC、Rohm、三洋和TI等半導體制造商簽署了制造并銷售ATRAC3用LSI的專利許可協議。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/455173.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/455173.shtml
英文地址,請注明出處:http://en.pswp.cn/news/455173.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Docker Compose 項目

二、Docker Compose 項目compose項目簡介compose項目來源于之前的Fig項目,使用python代碼編寫。compose項目主要用于編排部署基于docker的應用。本身與docker/swarm配合度很高。Docker Compose 是 Docker 編排服務的一部分,可以讓用戶在其它平…

Goland安裝-工欲善其事必先利其器

?、安裝Goland開發?具 (?)、介紹 Goland是由JetBrains公司旨在為go開發者提供的?個符合?體?程學的新 的商業IDE。這個IDE整合了IntelliJ平臺的有關go語?的編碼輔助功能和?具集成 特點。它具有以下特點: 編碼輔助功能符合?體?程學…

android 獲取sd卡目錄失敗_樹莓派對SD卡的大小,速度有哪些要求?

SD卡容量的大小通過NOOBS安裝帶有桌面和推薦軟件(完整)的 Raspberry Pi OS,SD卡最小為16GB。 對于帶有桌面和推薦軟件的 Raspberry Pi OS 鏡像安裝,SD卡最小為8GB。對于安裝 Raspberry Pi OS Lite,建議 SD 卡最小為4GB…

OGG音頻格式解析

OGG 什么是Ogg Ogg全稱是OGG Vobis(ogg Vorbis) ,是一種新的音頻壓縮格式,類似于MP3等現有的音樂格式。但有一點不同的是,它是完全免費、開放和沒有專利限制的。OGG Vobis有一個很出眾的特點,就是支持多聲道,隨…

區分同源與非同源

2019獨角獸企業重金招聘Python工程師標準>>> JSONP和AJAX相同,都是客戶端向服務器端發送請求:1、給服務器端傳遞內容2、從服務器端獲取數據 的方式 AJAX屬于同源策略 JSONP屬于非同源策略(跨域請求) -> 實現跨域請求的方式有很多種&#x…

Golang語言寫99乘法表-雙重for循環

個人博客點這里 1. 標準寫法: for 表達式1;表達式2;表達式3{循環體 }2. 同時省略表達式1和表達式3 for 表達式2{循環體 } // 相當于while(條件)3. 同時省略3個表達式 for{循環體 } // 相當于while(true) // 注意:當for循環中,省略了表達式2,就相當于直接作用在了true上4. 其…

移動APP怎樣保存用戶password

<span style"font-size:14px;">為了更好的用戶體驗,移動APPclient一般都會將用戶信息進行保存以便興許能夠自己主動登錄.</span> 保存了用戶信息便涉及到了安全問題. 解決辦法大概有一下幾種: 1.首先,假設client和服務端都是你來設計開發,那么有兩種比較…

extjs2.0 文件上傳_extjs數據存儲與傳輸

本章內容qExt.data簡介qExt.data.ConnectionqExt.data.RecordqExt.data.Storeq常用proxyq常用readerq高級storeqEXT中的Ajaxq關于scope和createDelegate()qDWR與EXT整合10.1Ext.data簡介Ext.data在命名空間中定義了一系列store、reader和proxy。Grid和ComboxBox都是以Ext.data為…

盤點key value在各個編程語言中的類型

個人博客點這里 起步 在編程語言中,有這么一種數據類型,我們經常會使用到,他就是類似于json的鍵值對類型 那么今天我們就對比一下,在各大編程語言中的key value類型的特點 main python key value 叫做字典 dict類型 聲明 字典操作 以鍵值對方式存在的無序數據的組合就是…

音頻格式詳解 CD WAV MP3 WMA MIDI RM RA OGG VOF AAC M4A APE FLAC TAK TTA MV RealAudio AIFF AU

以下是常見音頻文件格式的特點。 要在計算機內播放或是處理音頻文件&#xff0c;也就是要對聲音文件進行數、模轉換&#xff0c;這個過程同樣由采樣和量化構成&#xff0c;人耳所能聽到的聲音&#xff0c;最低的頻率是從20Hz起一直到最高頻率20KHZ&#xff0c;20KHz以上人耳是聽…

Spring MVC-表單(Form)標簽-下拉框(Dropdown)示例(轉載實踐)

以下內容翻譯自&#xff1a;https://www.tutorialspoint.com/springmvc/springmvc_dropdown.htm 說明&#xff1a;示例基于Spring MVC 4.1.6。 以下示例顯示如何使用Spring Web MVC框架在表單中使用Dropdown。首先&#xff0c;讓我們使用Eclipse IDE&#xff0c;并按照以下步驟…

vuex的命名空間有哪些_Vuex在vue路由器中訪問命名空間模塊的getter

我試圖通過檢查用戶是否經過身份驗證來保護我的路由&#xff0c;這是示例路由&#xff1a;{path: /intranet,component: search,meta: { requiresAuth: true },props: {tax: type,term: intranet-post,name: Intranet}},我正在這樣設置警衛&#xff1a;router.beforeEach((to, …

阿里巴巴中文站架構設計實踐(何崚)圖書

阿里巴巴中文站架構實踐 何崚阿里巴巴 全文地址:阿里巴巴中文站架構設計實踐(何崚).pdf 更多課件可到:這里查看 后續內容還在更新…

使用sqlite3創建數據庫表的時候須要注意

使用sqlite3創建數據庫表的時候須要注意&#xff1a; 1. 不能使用純數字 2. 不能帶有"-",""等字符。也不能以數字打頭。一、以下是log打出來的信息&#xff1a; DB Error: 1 "unrecognized token: "47464636265757265763393573649"" D…

物聯網世界的承諾與挑戰

最初參與到與物聯網&#xff08;Internet of Things / IoT&#xff09;相關的行業對話時&#xff0c;我對整個行業的發展充滿疑問。“ 物聯網”和 “萬聯網”&#xff08;Internet of Everything&#xff09;有什么區別&#xff1f;這場變革現今是處于啟蒙階段&#xff0c;亦或…

音樂文件基本格式,wave,mod,midi,mp3,wma,flac

經典的WAVE WAVE文件作為最經典的Windows多媒體音頻格式&#xff0c;應用非常廣泛&#xff0c;它使用三個參數來表示聲音&#xff1a;采樣位數、采樣頻率和聲道數。 聲道有單聲道和立體聲之分&#xff0c;采樣頻率一般有11025Hz&#xff08;11kHz&#xff09;、22050Hz&#xf…

bilibili go框架_最好的開發語言一定是那位嗎?Go語言有話說

魯迅先生說過&#xff0c;所有能用 JS 寫的前端項目最終都會被用 JS 重寫一遍&#xff0c;所有能用 Go 寫的后端項目最終也都會被用 Go 重寫一遍。作為一名開發者&#xff0c;周六的我們能做什么呢&#xff1f;是因為產品經理的各種需求在加班嗎&#xff1f;給你說了實現不了實…

關于虛擬機棧的理解

虛擬機棧 虛擬機棧出現的背景 由于跨平臺性的設計,Java的指令都是根據棧來設計的. 不同平臺CPU架構不同,所以不能設置為基于寄存器的 優點是跨平臺,指令集小,編譯器容易實現,缺點是性能下降,實現同樣的功能需要更多的指令. 有不少Java開發人員一提到Java內存結構,就會非常粗…

抓取各個瀏覽器引擎關鍵字,,百度學術關鍵字

百度學術 $list_arr getbaiduxueshu($row[name]); $list_arr explode((,$list_arr); $list_arr explode(),$list_arr[1]); $list_arr json_decode($list_arr[0]); $list_arr $list_arr->s; //百度學術平臺熱詞地址function getbaiduxueshu($keyname 100){ $url http:…