1.音頻信號處理的基本問題


1.簡述

該篇文章只是以初學者的心態提出一些問題,同時通過瀏覽資料自答這些問題。

參考書籍:
a.離散時間語音信號處理.pdf
b.數字信號處理:理論與應用.pdf
c.數字信號處理(吳鎮揚).pdf
d.漫畫傅立葉解析.pdf
e.Digital Audio Signal Processing.2nd Edition.pdf
f.通信原理.pdf

1.能處理語音信號的基礎條件是什么?

答:首先必須要有數學模型,而在時域分析,都是一系列的波形,分析起來也必定比較復雜,所以必須要尋求另外一個方式的分析。在做完另外一個方式的分析、處理操作之后,也必須要能轉回到原來的數學模型中,其實這整個過程就是傅立葉變換與逆變換了。中間對信號的處理,就涉及到了濾波器等等知識。

2.對語音信號做fft根據是什么?

答:我們知道,對于計算機而言,語音信號就是一系列的離散值,并沒有數學模型,那是如何做出fft的呢?這里就要說明一個函數了:


任意信號的表達式

這個是任意音頻信號的逼近表達式,也就是說,不管獲取的是什么數據,都可以通過這個函數來逼近。現在剩余的就是怎么去求解三個系數了,求系數的過程其實就是傅立葉變換,而如果對系數的計算做算法處理,讓速度更快,就成了快速傅立葉變換。所以說,傅立葉變化只是將分析方法搬移到了頻率域而已,因為變換之后還是能變換回來的,只是中間會有不同程度的精度損失。

3.音頻信號處理為什么都用IIR濾波器?

答:1個方面是因為計算復雜度降低,也就是說計算速度快,相位效果好,而弊端是引入一個恒定的相位移。從模擬濾波器到數字濾波器,可以使用脈沖響應不變法和雙線性變換法來從模擬濾波器轉換到數字濾波器。iir濾波器有一些指標:

iir濾波器指標

通帶和阻帶的容限一般使用的是db值描述。

再給出兩個公式定義:


通帶最大衰減和阻帶最小衰減定義

上式中,分子的值歸一化為1,所以3db通帶截至頻率值為0.707.

4.為什么音頻信號要從時域轉換到頻域?

答:主要是分析信號的頻率的組成成分。

5.怎么使用matlab處理音頻信號,fft怎么做?

答:首先看離散fft的基本轉換公式:


離散傅里葉變換
離散傅里葉變換展開
clf;
fs=100;N=1024;                   %采樣頻率和數據點數
n=0:N-1;t=n/fs;                 %時間序列
x=0.5*sin(2*pi*15*t)+2*sin(2*pi*40*t); %信號

subplot(2,1,1),plot(t,x);

y=fft(x,N);                     %對信號進行快速Fourier變換
mag=abs(y);                     %求得Fourier變換后的振幅
f=n*fs/N;                       %頻率序列

subplot(2,1,2),plot(f,mag);     %繪出隨頻率變化的振幅

離散傅里葉變換圖

6.音頻信號的工程應用中,使用了哪些測試信號?

答:有高斯白噪聲和粉紅噪聲。高斯白噪聲可以在matlab中使用randn函數來產生,而粉紅噪聲就可以在高斯白噪聲的基礎上加一個濾波器,這樣就可以達到效果了。

7.信號怎么分類?

信號分為確定性信號和隨機信號,隨機信號常用統計量來描述。最常用統計量有均值、方差相關函數與功率譜密度,3階、4階高階矩和高階累積量,高階譜等。隨機信號有平穩隨機信號和非平穩隨機信號。
FFT分析是建立在平穩信號的基礎上的。從這個意義上講,并不是說fft不能分析非平穩信號,而是說,如果能將非平穩信號轉為平穩信號,也是可以做分析的。

8.GEQ與PEQ是什么?它們有什么重要的衡量指標?

一般認為EQ可以分為3類,分別為圖示均衡器(GEQ)、參量均衡器(PEQ)與房間均衡器。

GEQ與PEQ分別是圖示均衡器與參量均衡器。它們都有3個重要的指標參數:Q值、Gain增益、Freq頻率。Q值指的是頻率線的彎曲幅度。Q越大則表示所選的頻率范圍越集中,Q越小則所選的范圍越廣闊。

EQ可以改變頻率,它看起來與濾波器很像,但是濾波器確是砍去波形。

因為EQ可以增強與衰減某一個頻率段的頻率,所以可以通過粉紅噪聲,再結合EQ,可以訓練耳朵聽某一個頻率的變換。

目前常用的圖示均衡器將頻率分為10段、15段、27段與31是段。10段均衡器的頻點是以倍頻程間隔分布,使用在一般的場合中,15段均衡器是2/3倍頻程均衡器,用在專業擴聲上,31段均衡器是1/3倍頻程均衡器,多數有在比較重要的需要精細補償的場合下。關于這部分可以在cooledit的Effects---->Filters---->Graphic Equaizer有實際效果圖,可以推拉柱狀圖查看,如下圖所示:

圖示均衡器

10段均衡器的頻率分布為:[100Hz, 200Hz, 400Hz, 600Hz, 1KHz, 3KHz, 6KHz, 12KHz, 14KHz, 16KHz]
15段均衡器的頻率分布為:[40Hz, 63Hz,100Hz,160Hz,250Hz, 400Hz, 630Hz, 1KHz, 1.6KHz,2.5KHz,4KHz, 6.3KHz, 10KHz, 14KHz, 16KHz]
31段均衡器的頻率分布為:[20Hz, 25Hz, 32Hz, 40Hz, 50Hz, 63Hz, 80Hz, 100Hz,125Hz, 160Hz, 200Hz, 250Hz, 315Hz, 400Hz, 500Hz, 630Hz,800Hz, 1KHz, 1.25KHz, 1.6KHz, 2KHz, 2.5KHz, 3.15KHz, 4KHz,5KHz, 6.3KHz, 8KHz, 10KHz, 12.5KHz, 16KHz, 20KHz]

目前常用的參數均衡器可以對聲音做更精細的調節,多附設在調音臺上,調節的參數內容包括頻點、頻段、增益和品質因數Q值等。關于這部分的實際調參圖,可以參考下圖:


參數均衡器

通過均衡器的圖形帶來的沖擊感,就會發現,聲音也是可以拿來玩的。同樣,cooledit也的確是一個神器。

cooledit也是可以making music的,如下圖所示:


創作音樂

9.常用效果器有哪些?

  1. 失真效果器(distortion)
  2. 混響效果器(reverb)
  3. 延遲效果器
  4. 弗蘭哥效果器(Flanger),鑲邊器
  5. 合唱效果器(chorus)
  6. 哇音效果器(WAH-WAH)
  7. 均衡器(Equalizer)
  8. 壓限器(compressor)
  9. 調制效果器(Modulation)
    有相位器(phaser)
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 一、傅立葉變換的由來 關于傅立葉變換,無論是書本還是在網上可以很容易找到關于傅立葉變換的描述,但是大都是些故弄玄虛...
    constant007閱讀 4,471評論 1 10
  • reference 《spoken language processing》 1 語音基礎 名詞解釋 pitch ...
    藝術叔閱讀 16,776評論 2 48
  • 我愿意陪你 呀呀學語 聽你一聲媽媽 我愿意陪你 蹣跚學步 看你走向我的懷抱 我愿意陪你 探索世界 看螞蟻搬家的奧秘...
    牟若水閱讀 393評論 14 7
  • 沒有月光和星辰 沒有蟬鳴和蛙叫 沒有小草的輕撫 清風在無意間 帶來了 遠方的點點星火
    俞語閱讀 370評論 1 10
  • 霧靄貼著蒼山的紋路向后延綿而去,近海的公路和村莊早已被籠罩在這層蠶絲般的水霧之中,淡青色的海面與以往晴空下的碧藍不...
    櫟柟閱讀 170評論 0 0