Python音頻信號處理 1.短時傅里葉變換及其逆變換

短時傅里葉變換及其逆變換

本篇文章主要記錄了使用python進行短時傅里葉變換,分析頻譜,以及通過頻譜實現在頻域內降低底噪的代碼及分析,希望可以給同樣在學習信號處理的大家一點幫助,也希望大家對我的文章多提意見建議。

一. 短時傅里葉變換與離散傅里葉變換

在這篇文章中我們主要運用了短時傅里葉變換,要想清楚地理解短時傅里葉變換,首先必須要了解離散傅里葉變換(Discrete Fourier Transform,DFT)。

1.離散傅里葉變換

離散傅里葉的定義:
?k∈[0,M?1],X[k]=∑n=0N?1x[n]e?2jπnfkFe=∑n=0N?1x[n]e?2jπnkFeMFe\\{\forall} k\in [0,M-1] ,X[k]=\sum^{N-1}_{n=0}x[n] e^{-\cfrac{2j\pi nf_k} {F_e}} = \sum^{N-1}_{n=0}x[n]e^{-\cfrac{2j\pi nk\frac{F_e}{M}}{Fe}} ?k[0,M?1],X[k]=n=0N?1?x[n]e?Fe?2jπnfk??=n=0N?1?x[n]e?Fe2jπnkMFe???
=∑n=0N?1x[n]e?2jπknM\qquad \qquad \qquad \qquad = \sum^{N-1}_{n=0}x[n]e^{-\cfrac{2j\pi kn}{M}}=n=0N?1?x[n]e?M2jπkn?

離散傅里葉變換適用于在時域上不連續且有限的數字信號,在上述公式中,x[n] 就是我們在時域中的初始數字信號,Fe 對應這個信號的采樣頻率。在離散傅里葉變換中,首先初始數字信號本身是離散的,在上式中初始信號x[n]是在時域內的一段有限信號,N代表了該段數字信號一共包含N個采樣點,即其在時域上的長度為1/Fe * N。同時離散傅里葉變換所得的結果X[k]在頻域上也是離散的,簡而言之,是將頻域[0,Fe]等分成了M份 :
在這里插入圖片描述
X[k]也可以理解為包含了M個復數值的向量。在離散傅里葉變換中,采樣點的個數N(時域上的取樣長度),以及頻域上的采樣個數M都是可調整的,兩個采樣個數的選擇對于DFT的解析度和精確度會有影響,這里就不過多展開。

我們在實際應用離散傅里葉變換時,會發現,有的時域上完全不同的信號,他們的離散傅里葉變換頻譜卻是一致的,因此我們引入一個新的 短時傅里葉變換(STFT)。

2.短時傅里葉變換

短時傅里葉變換的定義 :

X(τ,f)=∫Rx(t)h?(t?τ)e?2jπftdtX(\tau,f)=\int_Rx(t)h^*(t-\tau)e^{-2j\pi ft}dtX(τ,f)=R?x(t)h?(t?τ)e?2jπftdt

其中,h?(t?τ)\ h^*(t-\tau)?h?(t?τ) 是一個中心為τ\tauτ的窗函數

當引入了時間變量τ\tauτ之后我們就可以針對不同瞬間進行頻譜分析,對于每一個瞬間τ\tauτ我們都可以獲取信號在該時刻的頻譜。

二. 使用python 進行短時傅里葉變換

在這一部分我會分享基于python的短時傅里葉變換的實現,可供參考。
首先是可能使用到的python庫

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
from IPython.display import display, Audio
from numpy import log10

接下來就是短時傅里葉變換的python實現

def TFCT(trame, Fe, Nfft,fenetre,Nwin,Nhop):L = round((len(trame) - len(fenetre))/Nhop)+1M = Nfftxmat = np.zeros((M,L))print('xmat',xmat.shape)print(Nwin+Nhop)for j in range(L):xmat[:,j] = np.fft.fft(trame[j*Nhop:Nwin+Nhop*j]*fenetre,Nfft)  x_temporel = np.linspace(0,(1/Fe)*len(trame),len(trame))x_frequentiel = np.linspace(0, Fe,Nfft)return xmat,x_temporel,x_frequentiel

上述函數解釋:
參數部分
trameFe : 初始的數字信號和它的采樣頻率
Nfft : 上文提到的離散傅里葉變換中,頻域的采樣個數M
fenetre : 短時傅里葉變換中使用的窗函數,在接下來的實現中我都使用了漢明窗np.hamming。
Nwin : 窗函數的長度(包含點的個數)
Nhop : 窗函數每次滑動的長度,一般規定為Nwin/2,窗函數長度的一半

首先創建一個M行L列的矩陣xmat,該矩陣的每一行代表一個0-Fe的頻率,單位為Hz,每一列對應該段被窗函數截取的信號的FFT快速傅里葉變換。

三. 使用overlapp-add算法進行短時傅里葉變換的逆變換重構原信號

在這一部分中,我們使用了overlapp-add算法來進行短時傅里葉變換的逆變換。
下面是該部分的全部代碼,之后會逐步解釋算法的實現 :

def ITFD(xmat,Fe,Nfft,Nwin,Nhop):window = np.hamming(Nwin)Te = 1/Feyvect = np.zeros(Nfft + (xmat.shape[1]-1)*Nhop,dtype=complex)t_vecteur = np.arange(0,Te*len(yvect),Te)index = 0K = 0L = xmat.shape[1]yl = np.zeros(xmat.shape,dtype=complex)for j in range(L):yl[:,j] = np.fft.ifft(xmat[:,j])# 平移和求和for k in range(L):yvect[Nhop*k:Nfft+Nhop*k] += yl[:,k]# 標準化幅值for n in range(Nwin-1):K +=  window[n]K /= Nhopyvect /=Kreturn t_vecteur, yvect

該算法的實現需要三步。

1. 快速傅里葉逆變換

yl = np.zeros(xmat.shape,dtype=complex)
for j in range(L):yl[:,j] = np.fft.ifft(xmat[:,j])

第一步,對上一部分得出的矩陣xmat進行快速傅里葉變換的逆變換,得出同樣規格M行L列的矩陣yl。

2. 對各列進行平移并疊加

 # 平移和求和for k in range(L):yvect[Nhop*k:Nfft+Nhop*k] += yl[:,k]

對yl矩陣的每一列平移 (l-1)Nhop,l ∈\in [1,L],例如第一列不變,第二列平移Nhop,第三列平移2Nhop,以此類推。之后將所有列的轉置,疊加到總長度為Nfft +(L-1)*Nhop的向量yvect中。
在這里插入圖片描述

3. 標準化

# 標準化幅值
for n in range(Nwin-1):K +=  window[n]K /= Nhopyvect /=K
return t_vecteur, yvect

window[n] (w[n]) 是長度為Nwin的窗函數,在選取窗函數的時候,我們總滿足規則 K=∑l=1Lw[n?(l?1)Nhop]\ K=\sum^L_{l=1}w[n-(l-1)Nhop]?K=l=1L?w[n?(l?1)Nhop] K的值與n無關。在此基礎上不難證明
K≈∑n=0Nwin?1w[n]/Nhop\ K \approx \sum^{Nwin-1}_{n=0}w[n] / Nhop?Kn=0Nwin?1?w[n]/Nhop

那么通過以上的三個步驟,我們就可以從信號的短時傅里葉變換矩陣中完美重構原信號了。
下一篇文章我們將使用這些算法,使用譜減法進行聲音信號的降噪處理。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/387009.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/387009.shtml
英文地址,請注明出處:http://en.pswp.cn/news/387009.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Java多線程同步機制

一段synchronized的代碼被一個線程執行之前,他要先拿到執行這段代碼的權限,在 java里邊就是拿到某個同步對象的鎖(一個對象只有一把鎖); 如果這個時候同步對象的鎖被其他線程拿走了,他(這個線程…

SpringBoot與數據訪問

pom依賴&#xff1a; <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-jdbc</artifactId></dependency><dependency><groupId>mysql</groupId><artifactId>mysql-conne…

Python音頻信號處理 2.使用譜減法去除音頻底噪

使用譜減法去除音頻底噪 上一篇文章我主要分享了短時傅立葉變換及其逆變換在python中的實現&#xff0c;有興趣的可以閱讀一下該篇文章&#xff0c;地址如下&#xff1a; Python音頻信號處理 1.短時傅里葉變換及其逆變換 那么在本篇文章中&#xff0c;我們將利用短時傅立葉變…

線程池的優點

線程池的優點 1、線程是稀缺資源&#xff0c;使用線程池可以減少創建和銷毀線程的次數&#xff0c;每個工作線程都可以重復使用。 2、可以根據系統的承受能力&#xff0c;調整線程池中工作線程的數量&#xff0c;防止因為消耗過多內存導致服務器崩潰。 線程池的創建 public…

ROS(Robot Operating System)筆記 : 2.創建并配置package

ROS(Robot Operating System)筆記 : 2.創建一個ROS包并設置其依賴 1.首先來到ros的工作目錄下&#xff0c;接著使用 catkin_make [包名稱] [依賴1] [依賴2] … 創建一個包名為 challenge_project 的 ros包。 $ catkin_create_pkg challenge_project rospy std_msgs cv_bri…

Java線程相關的熱門面試題

1) 什么是線程&#xff1f; 線程是操作系統能夠進行運算調度的最小單位&#xff0c;它被包含在進程之中&#xff0c;是進程中的實際運作單位。程序員可以通過它進行多處理器編程&#xff0c;你可以使用多線程對運算密集型任務提速。比如&#xff0c;如果一個線程完成一個任務要…

linux運維、架構之路-jumpserver

linux運維、架構之路-jumpserver 一、jumpserver介紹 是一款由python編寫開源的跳板機(堡壘機)系統&#xff0c;實現了跳板機應有的功能。基于ssh協議來管理&#xff0c;客戶端無需安裝agent。 特點&#xff1a; 完全開源&#xff0c;GPL授權 Python編寫&#xff0c;容易再次開…

C++ STL學習筆記 : 1. template 模板函數

本篇文章是學習C STL庫的第一篇筆記&#xff0c;主要記錄了使用template關鍵字創建模板函數的方法。 下面用一個非常簡單的例子解釋模板函數的用法 : #include <iostream> using namespace std;template <class T> void myswap(T& a, T& b) {T temp a;a…

C++ STL學習筆記 : 2. unordered map 容器

本文中&#xff0c;簡單總結一下使用unordered map 的心得。unordered_map容器屬于STL中關聯表的一種&#xff0c;常用的map容器與unordered_map容器在使用中有著很大程度的相同點&#xff0c;在之后的文章中我可能會針對二者的相同點與不同點進行細致的分析&#xff0c;這里就…

tensorflow 安裝在Anaconda

python環境&#xff1a;win10 64下anaconda4.2.0(python3.5)。安裝tensorflow過程是在Anaconda Prompt中進行安裝 1&#xff1a;打開Anaconda Prompt 在安裝之前&#xff0c;說幾個關于conda的小命令 conda list&#xff1a;可以顯示已經安裝好的庫。 conda install 庫名 &…

伯努利數學習筆記的說...

經過一天的學習&#xff0c;我們發現伯努利數是個非常有用 &#xff08;個屁&#xff09; 的數列 定義 但是...伯努利數是什么呢&#xff1f;我們先給伯努利數一個定義&#xff1a; 令 \(B(i)\) 表示 伯努利數第 i 項&#xff0c;那么有&#xff1a; \[\sum_{i0}^{n} \begin{pm…

Dijkstra迪杰斯特拉算法 C++實現

本篇文章主要介紹了Dijkstra迪杰斯特拉算法的C實現&#xff0c;文章包含兩個部分&#xff0c;在第一部分中我會簡單介紹迪杰斯特拉算法以及一些個人的理解&#xff0c;第二部分會對C代碼的邏輯進行解釋。下面是我已經上傳的代碼資源&#xff0c;大家有興趣的可以點擊鏈接下載資…

Python開發一個股票類庫

前言 使用Python開發一個股票項目。 項目地址&#xff1a; https://github.com/pythonstock/stock 相關資料&#xff1a; http://blog.csdn.net/freewebsys/article/details/78294566 主要使用開發語言是python。 使用的lib庫是pandas&#xff0c;tushare&#xff0c;Tens…

LeetCode 105. Construct Binary Tree from Preorder and Inorder Traversal 由前序和中序遍歷建立二叉樹 C++...

LeetCode 105. Construct Binary Tree from Preorder and Inorder Traversal 由前序和中序遍歷建立二叉樹 C Given preorder and inorder traversal of a tree, construct the binary tree. Note:You may assume that duplicates do not exist in the tree. For example, given…

C++ STL 學習筆記 3. 文本文件操作

本文主要總結了C中對文本文件的基本操作以及使用心得&#xff0c;第一部分中總結了C對文本文件的基本操作&#xff0c;第二部分中會以csv文件為例&#xff0c;進行讀取存儲由逗號分隔的字符串的操作。 1. 文本讀取寫入基礎 要使用文件輸入輸出流&#xff0c;首先需要include相…

C# 調用python

1.C# 調用python 本質上是使用命令行運行python 1.1 C# 使用命令行 program.cs using System; using System.Diagnostics; using System.IO;namespace test {class Program{static void Main(string[] args){Program p new Program();string result p.run_cmd("ping…

4-17

1、html 中div class是什么&#xff1f; 在這里我將用id與class的比較&#xff0c;讓這個問題更容易理解&#xff08;1&#xff09;、使用區別id具有唯一性&#xff0c;在一個網頁中同一個命名只能使用一次&#xff1b;class命名的類可以在一個網頁中使用無數次。&#xff08;2…

python pandas serie簡介及基本使用

本篇文章主要羅列了pandas模塊中serie的基本使用。環境是jupyter notebook python 3.7。 serie是能夠保存任何類型數據的一維數組&#xff0c;軸標簽統稱為索引&#xff0c;索引必須是唯一的散列且與數據的長度相同&#xff0c;默認情況下為np.arange(n)。 首先是import pand…

Linux系統中nc工具那些不為人知的用法

Linux nc命令用法 參考地址&#xff1a;https://www.cnblogs.com/jjzd/p/6306273.html -g<網關>&#xff1a;設置路由器躍程通信網關&#xff0c;最多設置8個; -G<指向器數目>&#xff1a;設置來源路由指向器&#xff0c;其數值為4的倍數; -h&#xff1a;在線幫助;…

python pandas dataframe基本使用整理

dataframe是一種表格型的數據存儲結構&#xff0c;可以看作是幾個serie的集合。dataframe既有行索引&#xff0c;也有列索引。 以下代碼環境為google colab/jupyter notebook。 接下來就對dataframe的基本使用進行整理。 dataframe也從屬于pandas模塊&#xff0c;因此還是老規矩…