聲音編碼解碼基本原理

人類的語音信號處理過程依次如下:

  1. 人嘴說話
  2. 聲電轉(zhuǎn)換
  3. 抽樣(模數(shù)轉(zhuǎn)換)
  4. 量化(將數(shù)字信號用適當(dāng)?shù)臄?shù)值表示)
  5. 編碼(數(shù)據(jù)壓縮)
  6. 傳輸(網(wǎng)絡(luò)或者其他方式)
  7. 解碼(數(shù)據(jù)還原)
  8. 反抽樣(數(shù)模轉(zhuǎn)換)
  9. 電聲轉(zhuǎn)換
  10. 人耳聽聲

不同物種動物的聽覺頻率范圍有哪些?

  • 蝙蝠:1000~120000Hz
    
  • 海豚:2000~100000Hz
    
  •  貓:60~65000Hz
    
  •  狗:40~50000Hz
    
  •  人:20~20000Hz
    

脈沖編碼調(diào)制是什么?

  • 未經(jīng)過數(shù)據(jù)壓縮,直接量化進行傳輸則被稱為PCM(脈沖編碼調(diào)制)。

如何計算PCM音頻流的碼率?

  • 采樣率值 × 采樣大小值 × 聲道數(shù) bps = 碼率
  • 例如: 一個采樣率為44.1KHz,采樣大小為16bit,雙聲道的PCM編碼的WAV文件,它的數(shù)據(jù)速率則為 44.1K×16×2 =1411.2 Kbps。
    也被稱為數(shù)據(jù)帶寬,它和ADSL中的帶寬是一個概念。將碼率除以8,就可以得到這個WAV的數(shù)據(jù)速率,即176.4KB/s。
    這表示存儲一秒鐘采樣率為44.1KHz,采樣大小為16bit,雙聲道的PCM編碼的音頻信號,需要176.4KB的空間,1分鐘則約為10.34M

MP3是什么 ?

  • MPEG-1 or MPEG-2 Audio Layer III 一種數(shù)字音頻編碼和有損壓縮格式,它被設(shè)計來大幅降低音頻數(shù)據(jù)量.

MP3原理是什么?

  • 它舍棄脈沖編碼調(diào)制(PCM)音頻數(shù)據(jù)中,對人類聽覺不重要的數(shù)據(jù)(類似于JPEG是一個有損圖像壓縮),從而達(dá)到了壓縮成小得多的文件大小。

AAC 又是什么?

  • 高級音頻編碼(英語:Advanced Audio Coding,AAC),出現(xiàn)于1997年,基于MPEG-2的音頻編碼技術(shù)。

比特率是什么?

  • 單位時間內(nèi)的數(shù)據(jù)傳輸率時通常使用碼流或碼率,單位是kbps(千位每秒)。

低比特率的注意事項?

  • 使用過低的比特率,“壓縮噪聲(compression artifact)”(原始錄音中沒有的聲音)將會在回放時出現(xiàn)。

采樣率是什么?

  • 也稱為采樣速度或者采樣頻率,定義了每秒從連續(xù)信號中提取并組成離散信號的采樣個數(shù),它用赫茲(Hz)來表示。
    實際中,人發(fā)出的聲音信號為模擬信號,想要在實際中處理必須為數(shù)字信號,即采用抽樣、量化、編碼的處理方案。處理的第一步為抽樣,即模數(shù)轉(zhuǎn)換。
    簡單地說就是通過波形采樣的方法記錄1秒鐘長度的聲音,需要多少個數(shù)據(jù)。
    根據(jù)奈魁斯特(NYQUIST)采樣定理,用兩倍于一個正弦波的頻繁率進行采樣就能完全真實地還原該波形。
    所以,對于聲音信號而言,要想對離散信號進行還原,必須將抽樣頻率定為40KHz以上。
    實際中,一般定為44.1KHz。44.1KHz采樣率的聲音就是要花費44000個數(shù)據(jù)來描述1秒鐘的聲音波形。

MP3比特率參考值有哪些?

* 32 kbit/s—MW(AM)質(zhì)量
* 96 kbit/s—FM質(zhì)量
* 128 - 160 kbit/s –相當(dāng)好的質(zhì)量,有時有明顯差別
* 192 kbit/s—優(yōu)良質(zhì)量,偶爾有差別
* 224 - 320 kbit/s—高質(zhì)量
* 800 bit/s –能夠分辨的語音所需最低碼率(需使用專用的FS-1015 語音編解碼器)
* 8 kbit/s—電話質(zhì)量(使用語音編碼)
* 32-500 kbit/s -- Ogg Vorbis中使用的有損音頻模式
* 500 kbit/s–1 Mbit/s—無損音頻,格式為FLAC,ALAC,WavPack或Monkey's Audio
* 1411.2 kbit/s—脈沖編碼調(diào)制(PCM)聲音格式為光盤(CD)的數(shù)字音頻
* 5644.8 kbit/s—SACD使用的Direct Stream Digital格式

采樣率參考值有哪些?

* 8,000 Hz - 電話所用采樣率,對于人的說話已經(jīng)足夠
* 11,025 Hz
* 22,050 Hz - 無線電廣播所用采樣率
* 32,000 Hz - miniDV數(shù)碼視頻camcorder、DAT(LP mode)所用采樣率
* 44,100 Hz - 音頻CD,也常用于MPEG-1音頻(VCD, SVCD, MP3)所用采樣率
* 47,250 Hz - Nippon Columbia(Denon)開發(fā)的世界上第一個商用PCM錄音機所用采樣率
* 48,000 Hz - miniDV、數(shù)字電視、DVD、DAT、電影和專業(yè)音頻所用的數(shù)字聲音所用采樣率
* 50,000 Hz - 二十世紀(jì)七十年代后期出現(xiàn)的3M和Soundstream開發(fā)的第一款商用數(shù)字錄音機所用采樣率
* 50,400 Hz - 三菱X-80數(shù)字錄音機所用所用采樣率
* 96,000或者192,000 Hz - DVD-Audio、一些LPCM DVD音軌、Blu-ray Disc(藍(lán)光盤)音軌、和HD-DVD(高清晰度DVD)音軌所用所用采樣率
* 2.8224 MHz - SACD、索尼和飛利浦聯(lián)合開發(fā)的稱為Direct Stream Digital的1位sigma-delta modulation過程所用采樣率。

H5 audio 標(biāo)簽中 各瀏覽器對音頻格式支持情況

+---------------------+-----+-----+-----+-----+
| Browser             | Ogg | MP3 | AAC | Wav |
+---------------------+-----+-----+-----+-----+
| Internet Explorer 9 | No  | Yes | Yes | No  |
| Firefox 5           | Yes | No  | No  | Yes |
| Chrome 12           | Yes | Yes | Yes | Yes |
| Safari 5            | No  | Yes | Yes | Yes |
| Opera 11.5          | Yes | No  | No  | Yes |
+---------------------+-----+-----+-----+-----+

關(guān)于延時

IP網(wǎng)中話音分組的端到端時延,150ms以下的時延,對于大多數(shù)應(yīng)用來說是可接受的;150~400ms之間的時延,在用戶預(yù)知時延狀況的前提下可以接受;大于400ms的時延不可接受。

關(guān)于丟包率

丟包對VoIP語音質(zhì)量的影響較大,當(dāng)丟包率大于10%時,已不能接受,而在丟包率為5%時,基本可以接受。因此,要求IP承載網(wǎng)的丟包率小于5%。

數(shù)據(jù)參考 google 維基百科wiki

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,501評論 6 544
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 99,673評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,610評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,939評論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 72,668評論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 56,004評論 1 329
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 44,001評論 3 449
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 43,173評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,705評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 41,426評論 3 359
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,656評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,139評論 5 364
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,833評論 3 350
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,247評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,580評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,371評論 3 400
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 48,621評論 2 380

推薦閱讀更多精彩內(nèi)容