音頻中采樣率和幀是什么?怎么理解?

視頻中的“幀”是指一張圖片,那么在音頻中,“幀”的含義就完全不同了。理解音頻中的“幀”概念,對做音視頻處理、流媒體開發非常關鍵。

一、聲音是怎么采集的?

音頻采集是指通過麥克風等設備捕捉周圍環境中的聲波,并將其轉換為電信號,再通過模數轉換器(ADC)將這些模擬電信號轉換為數字信號的過程。這樣,計算機就能對音頻數據進行處理、存儲或傳輸。

簡單理解下:
1、聲音的產生
麥克風是采集到周圍環境中的聲音。那聲音是怎么產生的?實際上,聲音是由振動產生的。人說話是通過聲帶產生了對周圍的空氣的振動;走路等運動也會根據幅度等因素產生不同等級的振動;各種振動混合造成了我們周圍的聲音。
2、聲音數據怎么傳輸和存儲
麥克風獲取到周圍的聲音后,通過電信號的方式來標識采集到的數據。為了將數據在網絡中進行傳輸,需要借助模數轉化器,將模擬信號轉化為數字信號,這樣就可以在網絡中傳輸了。
3、聲音的存儲
此時接收端收到的音頻數據就是123456…這樣的數字。實際上是一個非常大的浮點數組,對這些數據進行不同格式編碼(wav,mp3等),在保存到磁盤上。
4、聲音數據播放
存儲的音頻文件通過數模轉換器(DAC)轉換回模擬信號。在將模擬信號放大并通過揚聲器或耳機等設備轉換成聲波,人耳就可以聽到了。

二、采樣率是什么?

采樣率指的是每秒鐘從連續信號中提取并組成離散信號的樣本數量,通常以赫茲(Hz)為單位表示。例如,44.1kHz意味著每秒采集44,100個樣本。
根據奈奎斯特定理,為了準確地重建原始音頻信號而不產生混疊失真,采樣率至少需要是最高音頻頻率的兩倍。對于人類聽覺范圍(大約20Hz到20kHz),常用的CD質量音頻采樣率為44.1kHz。

三、音頻中的幀是什么?

在音頻處理中,“幀”通常指的是一組樣本集合,這些樣本可能來自單聲道或多聲道。幀的概念主要用于編碼和解碼過程中,作為最小處理單元。它不像視頻幀那樣是“圖像”,而是一段短時間內的聲音數據。

公式:

- 一個音頻幀 = 所有聲道在一個時間點上的采樣值。
- 每個音頻幀包含:- 采樣數(samples per frame)- 聲道數(channels)

假設你有一個立體聲(2聲道)音頻,每個音頻幀包含1024個采樣點:

  • 那么這個幀中就有:1024 × 2 = 2048個采樣值
  • 左右聲道各 1024 個采樣

幀的作用:
不同的音頻編碼格式可能有不同的幀大小。幀不僅包含音頻樣本數據,還可能包括用于同步、錯誤檢測等功能的額外信息。

擴展一下:
位深度(Bit Depth)是什么?
位深度決定了每次采樣所用的數據位數,直接影響到音頻動態范圍的大小。常見的位深度有16位、24位等。較大的位深度允許更大的動態范圍和更低的噪音底。
比特率是什么?
比特率指的是每秒鐘音頻數據的傳輸速率。對于未壓縮音頻格式,比如WAV,比特率由采樣率、位深度和通道數決定。例如,CD質量的音頻具有44.1kHz的采樣率、16位的位深度和2個聲道(立體聲),其比特率為 44100×16×2=1411.2 kbps。
公式:
比特率 = 采樣率 × 位深度 × 聲道數
提高任意一個參數(比特率、采樣率或位深度)都可以提升音頻的質量,但這也會增加文件的大小。
簡單來說,比特率越高,音質也就越好。

四、音頻幀和時間的關系

音頻幀并不是以“每秒多少幀”來衡量的(像視頻那樣),而是通過采樣率(Sample Rate)和每幀的采樣數(Samples Per Frame)來計算它的持續時間。

計算公式:
在這里插入圖片描述
示例:

  • 采樣率 = 48000 Hz(即每秒采集48000個樣本)
  • 每幀采樣數 = 1024

那么一幀音頻的時長為:
在這里插入圖片描述
也就是說,每一幀音頻大約持續21ms。

簡單理解下:
假如你用麥克風采集了10秒的音頻數據,采樣率是48000Hz,幀的大小為1024。
那么這10秒內,每秒采集48000個采樣值,10秒共采集480000個采樣值。每秒包含48000/1024≈46.8個幀。音頻的處理通常都是按照幀的大小來處理的。

五、常見音頻幀大小(采樣數)

不同編碼格式或協議中,每幀的采樣數可能不同:
在這里插入圖片描述

六、音頻幀的重要性?

1、同步音視頻:

  • 視頻通常是以固定幀率(如25 FPS)播放;
  • 音頻則按幀的時間長度進行對齊,才能與視頻同步。

2、網絡傳輸:

  • 在RTMP、RTP等流媒體協議中,音頻是以幀為單位打包發送的;
  • 每幀對應一定時間的聲音,便于控制延遲和緩沖。

3、音頻編碼/解碼:

  • 多數音頻編碼器(如FFmpeg中的aac, opus)都要求輸入的是完整的音頻幀;
  • 如果數據不夠一幀,就不能編碼。

七、類比理解(視頻 vs 音頻)

在這里插入圖片描述

八、總結

音頻采集是一個將聲波轉換為數字信號的過程,其中采樣率決定了信號的質量,而幀則是在編碼和解碼過程中使用的結構化數據單元。要播放采集的數據,需先通過DAC將數字信號轉回模擬信號,再通過物理設備如揚聲器播放出來。理解幀和采樣率的作用有助于更好在聲音領域的相關研發。

向陽而生,Dare To Be!!!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/87742.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/87742.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/87742.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

第三方檢測護航軟件登記:企業合規的技術通行證與市場信任基石

一、軟件產品登記測試:合規化的必經之路 根據《軟件產品管理辦法》,所有上市軟件必須通過第三方檢測機構的專業評估,確保功能、性能、安全性等指標符合國家標準(如GB/T 25000系列)。這一強制性要求不僅規避了法律風險…

產品頁不被收錄的6個技術原因(非重復內容/爬蟲限制類)

頁面未被收錄的原因可能藏在代碼架構或服務器配置中 比如爬蟲無法“看懂”你的動態內容,或是某個參數設置錯誤導致頁面被判定為重復。 本文從技術排查角度出發,整理6個最易被忽視但直接影響收錄的實操問題。 頁面加載速度拖慢爬蟲抓取 例如&#xff0…

如何在FastAPI中打造一個既安全又靈活的權限管理系統?

title: 如何在FastAPI中打造一個既安全又靈活的權限管理系統? date: 2025/06/16 08:17:05 updated: 2025/06/16 08:17:05 author: cmdragon excerpt: FastAPI權限系統通過依賴注入實現三級驗證:身份認證、角色驗證和權限校驗。數據庫模型包括用戶、角色和權限注冊表,支持…

通過Radius認證服務器實現飛塔/華為防火墻二次認證:原理、實踐與安全價值解析

引言:數字化轉型中的身份認證挑戰 在數字化轉型加速的今天,企業網絡邊界日益模糊,混合云架構、遠程辦公、物聯網設備接入等場景對網絡安全提出全新挑戰。傳統防火墻基于IP/端口的訪問控制已無法滿足動態安全需求,如何構建"持…

golang--context的使用指南與核心特性

Go 語言 context 包:使用指南與核心特性 一、context 的本質與設計目的 context 是 Go 語言中管理請求生命周期的核心機制,它提供了一套統一的方式來: 傳遞請求范圍數據(如用戶認證信息)控制跨 goroutine 的生命周期…

耗時3小時,把這兩天做好的爬蟲程序,用Python封裝成exe文件

先執行命令如下: pip install pyinstaller py -m PyInstaller --log-levelDEBUG --add-data "config.ini;." nmpa_gui.py很快在dist目錄下就有生成一個nmpa_gui文件夾,運行 nmpa_gui.exe,報錯: 1??初始化爬蟲… 程序…

Linux下nginx訪問路徑頁面

第一步:通過Xshell在虛擬機中下載nginx sudo apt-get install nginx 第二步:進入nginx配置頁面 cd /etc/nginx 我這里創建了一個html文件夾 在進入去創建頁面并且重新加載 boahuboahu-VMware-Virtual-Platform:/$ cd /etc/nginx boahuboahu-VMware-Vir…

三維視頻融合怎么弄?三步實現精準投射與自由修剪

分享大綱: 1、場景引入:為什么你的三維場景視頻融合效果不理想? 2、解決方案:捷碼視頻融合三步操作指南 3、捷碼平臺:低代碼構建動態三維視界 在智慧城市中的安防領域,將實時視頻與三維場景融合已是大勢需求…

探索阿里云網絡與CDN產品:解鎖高效網絡體驗

阿里云網絡產品概述 在云計算蓬勃發展的當下,網絡作為連接計算、存儲與用戶的關鍵紐帶,其重要性不言而喻。阿里云作為全球知名的云計算服務提供商,憑借其豐富且強大的網絡產品體系,為企業數字化轉型筑牢了堅實的網絡根基&#xf…

深入理解C語言指針(二):從數組到多級指針的全面解析

作為C語言的核心概念,指針常常讓初學者感到困惑。本文將從數組與指針的關系入手,逐步揭開指針在數組操作、函數傳參以及多級指針中的神秘面紗,幫助你建立系統的指針知識體系。 一、數組名的雙重身份:首地址與整體標識 在C語言中&a…

Windows PPT/word怎么pdf不降低分辨率,插入可編輯

Windows PPT/word怎么pdf不降低分辨率 下載軟件Inkscape:Inkscape - Draw Freely. | Inkscape 然后使用Inkscape將你的PDF轉為svg, 然后用office的PPT打開,將svg復制進PPT/word,然后保存就可以了 插入可編輯的(只能通過Mac的才可…

vue3 select 選中值時,即獲得id,也獲得name值并且輸入框正確選中

1.獲取 name和id 直接綁定對象 將 value 綁定為整個對象&#xff0c;通過 change 事件獲取完整數據 value-key 綁定唯一標識 value 綁定為整個對象&#xff0c;通過 change 事件獲取完整數據 <el-select v-model"selectedItem" change"handleChange"…

什么是Seata

Seata的實現原理主要圍繞其核心架構&#xff08;TC/TM/RM&#xff09;和事務模式&#xff08;如AT、TCC等&#xff09;展開&#xff0c;通過協調全局事務與分支事務的協作保證數據一致性。以下是核心實現原理的詳細解析&#xff1a; ?? ??一、核心架構協作機制?? Seata通…

linux ARM64架構用戶空間和內核空間的區分

一、ARM64 架構地址空間的「黃金分割」 ARM64&#xff08;ARMv8-A&#xff09;采用 48 位虛擬地址&#xff08;Linux 默認配置&#xff09;&#xff0c;總空間為 256TB&#xff0c;分為高低兩個 128TB 區域&#xff1a; 1. 地址空間整體布局 虛擬地址空間&#xff08;48位&a…

51單片機重要知識點1

1. 在讀IO口狀態前必須先寫該IO口1. 即讓下拉MOS高阻斷路。如&#xff1a; P221; KEYP22; 復位狀態各IO口1的。另外大多數情況都不會IO口即做輸入又做輸出的。設計思想永遠不要復雜化高難度編程&#xff0c;而要簡單明了。 2.

【解析法與幾何法在阻尼比設計】自控

解析法與幾何法在阻尼比設計中的詳細對比 一、解析法&#xff1a;基于數學方程的定量求解 核心思想&#xff1a;通過特征方程與根軌跡條件建立代數關系&#xff0c;直接求解滿足阻尼比要求的系統參數。 1. 適用場景 二階系統或可簡化為二階系統的高階系統&#xff08;主導極…

搭建pikachu靶場

文章目錄 一、pikachu是什么?二、搭建環境1.下載鏈接三、安裝教程phpstudy安裝配置pikachu 靶場安裝配置總結一、pikachu是什么? Pikachu 靶場是一個專門為網絡安全愛好者和學習者設計的 Web 安全靶場。它旨在幫助用戶學習和實踐常見的 Web安全漏洞和攻擊手法。Pikachu 靶場通…

OpenStack Dashboard在指定可用域(Availability Zone)、指定節點啟動實例

通過OpenStack Dashboard在指定可用域&#xff08;Availability Zone&#xff09;中創建實例的完整配置&#xff0c;涵蓋可用域創建、節點管理、關系與限制的詳細步驟&#xff1a; 一、可用域&#xff08;Availability Zone&#xff09;的概念與關系 0.指定域、指定節點、指定…

6.時間序列預測的模型部署

6.1實驗設置和python版的Azure機器學習SDK介紹 6.1.1 WorkSpace 6.1.2 Experiment 6.1.3 Run 6.1.4 Model 6.1.5 ComputeTarget、RunConfiguration和ScriptRunConfig 6.1.6 Image 和 Webservice 6.2 機器學習模型部署 6.3 時間序列預測的解決方案體系結構部署示例 6.3.1 訓練…

加密貨幣:比特幣

比特幣&#xff08;Bitcoin&#xff0c;簡稱BTC是一種去中心化的數字貨幣&#xff0c;由中本聰&#xff08;Satoshi Nakamoto&#xff09;在2008年提出&#xff0c;并于2009年正式推出。它是首個基于區塊鏈技術的加密貨幣&#xff0c;旨在實現點對點的價值傳輸&#xff0c;無需…