iOS音頻播放 (一):概述

本篇為《iOS音頻播放》系列的第一篇,主要將對(duì)iOS下實(shí)現(xiàn)音頻播放的方法進(jìn)行概述。


基礎(chǔ)

先來(lái)簡(jiǎn)單了解一下一些基礎(chǔ)的音頻知識(shí)。

目前我們?cè)谟?jì)算機(jī)上進(jìn)行音頻播放都需要依賴(lài)于音頻文件,音頻文件的生成過(guò)程是將聲音信息采樣、量化和編碼產(chǎn)生的數(shù)字信號(hào)的過(guò)程,人耳所能聽(tīng)到的聲音,最低的頻率是從20Hz起一直到最高頻率20KHZ,因此音頻文件格式的最大帶寬是20KHZ。根據(jù)奈奎斯特的理論,只有采樣頻率高于聲音信號(hào)最高頻率的兩倍時(shí),才能把數(shù)字信號(hào)表示的聲音還原成為原來(lái)的聲音,所以音頻文件的采樣率一般在40~50KHZ,比如最常見(jiàn)的CD音質(zhì)采樣率44.1KHZ。

對(duì)聲音進(jìn)行采樣、量化過(guò)程被稱(chēng)為脈沖編碼調(diào)制(Pulse Code Modulation),簡(jiǎn)稱(chēng)PCM。PCM數(shù)據(jù)是最原始的音頻數(shù)據(jù)完全無(wú)損,所以PCM數(shù)據(jù)雖然音質(zhì)優(yōu)秀但體積龐大,為了解決這個(gè)問(wèn)題先后誕生了一系列的音頻格式,這些音頻格式運(yùn)用不同的方法對(duì)音頻數(shù)據(jù)進(jìn)行壓縮,其中有無(wú)損壓縮(ALAC、APE、FLAC)和有損壓縮(MP3、AAC、OGG、WMA)兩種。

目前最為常用的音頻格式是MP3,MP3是一種有損壓縮的音頻格式,設(shè)計(jì)這種格式的目的就是為了大幅度的減小音頻的數(shù)據(jù)量,它舍棄PCM音頻數(shù)據(jù)中人類(lèi)聽(tīng)覺(jué)不敏感的部分,從下面的比較圖我們可以明顯的看到MP3數(shù)據(jù)相比PCM數(shù)據(jù)明顯矮了一截(圖片引自imp3論壇)。



MP3格式中的碼率(BitRate)代表了MP3數(shù)據(jù)的壓縮質(zhì)量,現(xiàn)在常用的碼率有128kbit/s、160kbit/s、320kbit/s等等,這個(gè)值越高聲音質(zhì)量也就越高。MP3編碼方式常用的有兩種固定碼率(Constant bitrate,CBR)和可變碼率(Variable bitrate,VBR)。

MP3格式中的數(shù)據(jù)通常由兩部分組成,一部分為ID3用來(lái)存儲(chǔ)歌名、演唱者、專(zhuān)輯、音軌數(shù)等信息,另一部分為音頻數(shù)據(jù)。音頻數(shù)據(jù)部分以幀(frame)為單位存儲(chǔ),每個(gè)音頻都有自己的幀頭,如圖所示就是一個(gè)MP3文件幀結(jié)構(gòu)圖(圖片同樣來(lái)自互聯(lián)網(wǎng))。MP3中的每一個(gè)幀都有自己的幀頭,其中存儲(chǔ)了采樣率等解碼必須的信息,所以每一個(gè)幀都可以獨(dú)立于文件存在和播放,這個(gè)特性加上高壓縮比使得MP3文件成為了音頻流播放的主流格式。幀頭之后存儲(chǔ)著音頻數(shù)據(jù),這些音頻數(shù)據(jù)是若干個(gè)PCM數(shù)據(jù)幀經(jīng)過(guò)壓縮算法壓縮得到的,對(duì)CBR的MP3數(shù)據(jù)來(lái)說(shuō)每個(gè)幀中包含的PCM數(shù)據(jù)幀是固定的,而VBR是可變的。


iOS音頻播放概述

了解了基礎(chǔ)概念之后我們就可以列出一個(gè)經(jīng)典的音頻播放流程(以MP3為例):

1,讀取MP3文件

2,解析采樣率、碼率、時(shí)長(zhǎng)等信息,分離MP3中的音頻幀

4,對(duì)分離出來(lái)的音頻幀解碼得到PCM數(shù)據(jù)

5,對(duì)PCM數(shù)據(jù)進(jìn)行音效處理(均衡器、混響器等,非必須)

6,把PCM數(shù)據(jù)解碼成音頻信號(hào)

7,音頻信號(hào)交給硬件播放

8,1-6步直到播放完成

在iOS系統(tǒng)中apple對(duì)上述的流程進(jìn)行了封裝并提供了不同層次的接口(圖片引自官方文檔)。


下面對(duì)其中的中高層接口進(jìn)行功能說(shuō)明:


Audio File Services:讀寫(xiě)音頻數(shù)據(jù),可以完成播放流程中的第2步;

Audio File Stream Services:對(duì)音頻進(jìn)行解碼,可以完成播放流程中的第2步;

Audio Converter services:音頻數(shù)據(jù)轉(zhuǎn)換,可以完成播放流程中的第3步;

Audio Processing Graph Services:音效處理模塊,可以完成播放流程中的第4步;

Audio Unit Services:播放音頻數(shù)據(jù):可以完成播放流程中的第5步、第6步;

Extended Audio File Services:Audio File Services和Audio Converter services的結(jié)合體;

AVAudioPlayer/AVPlayer(AVFoundation):高級(jí)接口,可以完成整個(gè)音頻播放的過(guò)程(包括本地文件和網(wǎng)絡(luò)流播放,第4步除外);

Audio Queue Services:高級(jí)接口,可以進(jìn)行錄音和播放,可以完成播放流程中的第3、5、6步;

OpenAL:用于游戲音頻播放,暫不討論


可以看到apple提供的接口類(lèi)型非常豐富,可以滿(mǎn)足各種類(lèi)別類(lèi)需求:


如果你只是想實(shí)現(xiàn)音頻的播放,沒(méi)有其他需求AVFoundation會(huì)很好的滿(mǎn)足你的需求。它的接口使用簡(jiǎn)單、不用關(guān)心其中的細(xì)節(jié);

如果你的app需要對(duì)音頻進(jìn)行流播放并且同時(shí)存儲(chǔ),那么AudioFileStreamer加AudioQueue能夠幫到你,你可以先把音頻數(shù)據(jù)下載到本地,一邊下載一邊用NSFileHandler等接口讀取本地音頻文件并交給AudioFileStreamer或者AudioFile解析分離音頻幀,分離出來(lái)的音頻幀可以送給AudioQueue進(jìn)行解碼和播放。如果是本地文件直接讀取文件解析即可。(這兩個(gè)都是比較直接的做法,這類(lèi)需求也可以用AVFoundation+本地server的方式實(shí)現(xiàn),AVAudioPlayer會(huì)把請(qǐng)求發(fā)送給本地server,由本地server轉(zhuǎn)發(fā)出去,獲取數(shù)據(jù)后在本地server中存儲(chǔ)并轉(zhuǎn)送給AVAudioPlayer。另一個(gè)比較trick的做法是先把音頻下載到文件中,在下載到一定量的數(shù)據(jù)后把文件路徑給AVAudioPlayer播放,當(dāng)然這種做法在音頻seek后就回有問(wèn)題了。);

如果你正在開(kāi)發(fā)一個(gè)專(zhuān)業(yè)的音樂(lè)播放軟件,需要對(duì)音頻施加音效(均衡器、混響器),那么除了數(shù)據(jù)的讀取和解析以外還需要用到AudioConverter來(lái)把音頻數(shù)據(jù)轉(zhuǎn)換成PCM數(shù)據(jù),再由AudioUnit+AUGraph來(lái)進(jìn)行音效處理和播放(但目前多數(shù)帶音效的app都是自己開(kāi)發(fā)音效模塊來(lái)坐PCM數(shù)據(jù)的處理,這部分功能自行開(kāi)發(fā)在自定義性和擴(kuò)展性上會(huì)比較強(qiáng)一些。PCM數(shù)據(jù)通過(guò)音效器處理完成后就可以使用AudioUnit播放了,當(dāng)然AudioQueue也支持直接使對(duì)PCM數(shù)據(jù)進(jìn)行播放。)。下圖描述的就是使用AudioFile + AudioConverter + AudioUnit進(jìn)行音頻播放的流程(圖片引自官方文檔)。



參考資料

音頻文件格式

脈沖編碼調(diào)制

采樣率

奈奎斯特頻率

MP3

ID3

Core Audio Essential

Common Tasks in OS X


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀(guān)點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容

  • 前言 學(xué)習(xí)AudioToolBox有一段時(shí)間了,期間有遇到不少坑(主要還是英文不夠好,看官方文檔不甚明了)。隨著一...
    anyoptional閱讀 8,249評(píng)論 4 26
  • 原文鏈接http://www.cnblogs.com/kenshincui/p/4186022.html 音頻在i...
    Hyman0819閱讀 21,790評(píng)論 4 74
  • Linear PCM 在介紹Core Audio之前,先介紹一下最常用的非壓縮數(shù)字音頻格式Linear PCM(線(xiàn)...
    huangjun0閱讀 4,401評(píng)論 0 2
  • 最近嚴(yán)重拒絕各種速溶,只一心喜歡掛耳,有如遇到了人生的初戀。那股一經(jīng)撕開(kāi)紙包就撲鼻而來(lái)的醇香,讓人心生許多滿(mǎn)...
    Lucyxiu閱讀 225評(píng)論 1 1
  • 閉上眼,不是純黑,紅與黑的結(jié)合透露著點(diǎn)點(diǎn)星光,后方此起彼伏的雜聲,一個(gè)個(gè)字符不成規(guī)矩,一句句話(huà)語(yǔ)不成句。眾人皆醉我...
    超級(jí)妮閱讀 225評(píng)論 0 0