要在計(jì)算機(jī)內(nèi)播放或是處理音頻文件,也就是要對(duì)聲音文件進(jìn)行數(shù)、模轉(zhuǎn)換,這個(gè)過程同樣由采樣和量化構(gòu)成,人耳所能聽到的聲音,最低的頻率是從20Hz起一直到最高頻率20KHZ,20KHz以上人耳是聽不到的,因此音頻文件格式的最大帶寬是20KHZ,故而采樣速率需要介于40~50KHZ之間,而且對(duì)每個(gè)樣本需要更多的量化比特?cái)?shù)。音頻數(shù)字化的標(biāo)準(zhǔn)是每個(gè)樣本16位-96dB的信噪比,采用線性脈沖編碼調(diào)制PCM,每一量化步長(zhǎng)都具有相等的長(zhǎng)度。下面介紹幾種常用的音頻格式。
WAV
WAV為微軟公司(Microsoft)開發(fā)的一種聲音文件格式,它符合RIFF(Resource Interchange File Format)文件規(guī)范,用于保存Windows平臺(tái)的音頻信息資源,被Windows平臺(tái)及其應(yīng)用程序所廣泛支持,該格式也支持MSADPCM,CCITT A LAW等多種壓縮運(yùn)算法,支持多種音頻數(shù)字,取樣頻率和聲道,標(biāo)準(zhǔn)格式化的WAV文件和CD格式一樣,也是44.1K的取樣頻率,16位量化數(shù)字,因此在聲音文件質(zhì)量和CD相差無幾! WAV打開工具是WINDOWS的媒體播放器。
通常使用三個(gè)參數(shù)來表示聲音,量化位數(shù),取樣頻率和采樣點(diǎn)振幅。量化位數(shù)分為8位,16位,24位三種,聲道有單聲道和立體聲之分,單聲道振幅數(shù)據(jù)為n*1矩陣點(diǎn),立體聲為n*2矩陣點(diǎn),取樣頻率一般有11025Hz(11kHz) ,22050Hz(22kHz)和44100Hz(44kHz) 三種,不過盡管音質(zhì)出色,但在壓縮后的文件體積過大!相對(duì)其他音頻格式而言是一個(gè)缺點(diǎn),其文件大小的計(jì)算方式為:WAV格式文件所占容量(B) = (取樣頻率 X量化位數(shù)X 聲道) X 時(shí)間 / 8 (字節(jié)= 8bit) 每一分鐘WAV格式的音頻文件的大小為10MB,其大小不隨音量大小及清晰度的變化而變化。
WAV是最接近無損的音樂格式,所以文件大小相對(duì)也比較大。
MP3
MP3是一種音頻壓縮技術(shù),其全稱是動(dòng)態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面3(Moving Picture Experts Group Audio Layer III),簡(jiǎn)稱為MP3。它被設(shè)計(jì)用來大幅度地降低音頻數(shù)據(jù)量。利用 MPEG Audio Layer 3 的技術(shù),將音樂以1:10 甚至 1:12 的壓縮率,壓縮成容量較小的文件,而對(duì)于大多數(shù)用戶來說重放的音質(zhì)與最初的不壓縮音頻相比沒有明顯的下降。它是在1991年由位于德國(guó)埃爾朗根的研究組織Fraunhofer-Gesellschaft的一組工程師發(fā)明和標(biāo)準(zhǔn)化的。用MP3形式存儲(chǔ)的音樂就叫作MP3音樂,能播放MP3音樂的機(jī)器就叫作MP3播放器。
MP3是利用人耳對(duì)高頻聲音信號(hào)不敏感的特性,將時(shí)域波形信號(hào)轉(zhuǎn)換成頻域信號(hào),并劃分成多個(gè)頻段,對(duì)不同的頻段使用不同的壓縮率,對(duì)高頻加大壓縮比(甚至忽略信號(hào))對(duì)低頻信號(hào)使用小壓縮比,保證信號(hào)不失真。這樣一來就相當(dāng)于拋棄人耳基本聽不到的高頻聲音,[1]? 只保留能聽到的低頻部分,從而將聲音用1∶10甚至1∶12的壓縮率壓縮。由于這種壓縮方式的全稱叫MPEG Audio Player3,所以人們把它簡(jiǎn)稱為MP3。
根據(jù)MPEG規(guī)范的說法,MPEG-4中的AAC(Advanced audio coding)將是MP3格式的下一代。MP3還分為耳機(jī)MP3和外放MP3兩大類,傳統(tǒng)MP3需要帶耳機(jī)才有很好的音質(zhì),但是對(duì)人們的耳膜有所傷害,新型的MP3主要方向是外放MP3,對(duì)耳膜幾乎沒有任何傷害,從而得到人們的喜愛。
最高參數(shù)的MP3(320Kbps)的音質(zhì)較之CD的,FLAC和APE無損壓縮格式的差別不多,其優(yōu)點(diǎn)是壓縮后占用空間小,適用于移動(dòng)設(shè)備的存儲(chǔ)和使用。
MP3 PRO
MP3Pro是新一代的MP3格式,是Mp3編碼格式的升級(jí)版本。MP3Pro是由瑞典Coding科技公司開發(fā)的,在保持相同的音質(zhì)下同樣可以把聲音文件的文件量壓縮到原有MP3格式的一半大小。而且可以在基本不改變文件大小的情況下改善原先的MP3音樂音質(zhì)。它能夠在用較低的比特率壓縮音頻文件的情況下,最大程度地保持壓縮前的音質(zhì)。
通常收聽的mp3音樂文件一般都以128kbps的比特率壓縮而成的。但如果采用更低的比特率(如96kbps或64kbps),我們可以非常明顯的感覺到聲音的高頻部分丟失現(xiàn)象明顯,嚴(yán)重時(shí)聲音還會(huì)產(chǎn)生扭曲現(xiàn)象。這其中的原因在于,以這些低比特率壓縮而成的mp3在編碼時(shí)無法對(duì)聲音的整個(gè)頻帶進(jìn)行壓縮,從而丟失了高頻段一些重要的聲音信息。
為了能夠在低比特率下獲得更高音質(zhì)的mp3文件,一項(xiàng)稱作SBR(Spectral Band Replication)的技術(shù)被用于新的mp3PRO編碼中,其主要的用處在于保留了聲音中的高頻音,使得以低比特率壓縮的mp3文件音質(zhì)得到顯著的增強(qiáng)。
mp3PRO在進(jìn)行編碼時(shí),mp3PRO編碼器將音頻的錄音分成兩個(gè)部分:mp3部分和PRO部分。mp3部分分析低頻段(Low Frequency Band)信息,并將其編碼成通常的mp3文件數(shù)據(jù)流。這就使得編碼器能夠集中編碼更少的有用信息,獲得更佳品質(zhì)的編碼效果。同時(shí),這也保證了mp3PRO文件同老的mp3播放器的兼容性。PRO部分分析的則是高頻段(High Frequency Band)信息,并將其編碼成mp3數(shù)據(jù)流的一部分,而這些通常在老的mp3解碼器里是被忽略的。新的mp3PRO解碼器會(huì)有效地利用這部分?jǐn)?shù)據(jù)流,將兩段(高頻段和低頻段)合并起來產(chǎn)生完全的音頻帶,達(dá)到增強(qiáng)音質(zhì)的效果。
既然MP3存在的好好的,為什么會(huì)有MP3Pro的出現(xiàn)呢??這要從網(wǎng)絡(luò)流媒體格式的出現(xiàn)說起。由于要在網(wǎng)絡(luò)上收看聲音和視頻的需求不斷增加,網(wǎng)絡(luò)流媒體real和windowsmedia格式慢慢興起。隨著這些媒體的編碼器不斷改進(jìn),他們的質(zhì)量已經(jīng)不斷提升,已經(jīng)能夠做到文件尺寸又小,質(zhì)量又好,大有趕超MP3之勢(shì)。以前MP3所倍受推崇的高壓縮比,低質(zhì)量損失已經(jīng)不再是一張王牌,昔日輝煌的地位正在不斷受到威脅。面對(duì)這一情況,Thomson Multimedia ,一個(gè)制作mp3編碼格式的公司現(xiàn)今推出了一個(gè)MP3格式的升級(jí)版本----Mp3 Pro。
2001年6月14日,美國(guó)湯姆森多媒體公司(Thomson Multimedia SA)與佛朗赫弗協(xié)會(huì)(Fraunhofer Institute)于6月14日發(fā)布了一種新的音樂格式版本,名稱為mp3PRO,這是一種基于mp3編碼技術(shù)的改良方案,從官方公布的特征看來確實(shí)相當(dāng)吸引人。從各方面的資料顯示,mp3PRO并不是一種全新的格式,完全是基于傳統(tǒng)mp3編碼技術(shù)的一種改良,本身最大的技術(shù)亮點(diǎn)就在于SBR(Spectral Band Replication 頻段復(fù)制),這是一種新的音頻編碼增強(qiáng)算法。它提供了改善低位率情況下音頻和語音編碼的性能的可能。這種方法可在指定的位率下增加音頻的帶寬或改善編碼效率。SBR最大的優(yōu)勢(shì)就是在低數(shù)據(jù)速率下實(shí)現(xiàn)非常高效的編碼,與傳統(tǒng)的編碼技術(shù)不同的是,SBR更像是一種后處理技術(shù),因此解碼器的算法的優(yōu)劣直接影響到音質(zhì)的好壞。高頻實(shí)際上是由解碼器(播放器)產(chǎn)生的,SBR編碼的數(shù)據(jù)更像是一種產(chǎn)生高頻的命令集,或者稱為指導(dǎo)性的信號(hào)源,這有點(diǎn)駇idi的工作方式。我們可以看到,mp3PRO其實(shí)是一種mp3信號(hào)流和SBR信號(hào)流的混合數(shù)據(jù)流編碼。有關(guān)資料顯示,SBR技術(shù)可以改善低數(shù)據(jù)流量下的高頻音質(zhì),改善程度約為30%,我們不管這個(gè)30%是如何得來的,但可以事先預(yù)知這種改善可以讓64kbps的mp3達(dá)到128kbps的mp3的音質(zhì)水平(注:在相同的編碼條件下,數(shù)據(jù)速率的提升和音質(zhì)的提升不是成正比的,至少人耳聽覺上是這樣的),這和官方聲稱的64kbps的mp3PRO可以媲美128kbps的mp3的宣傳基本是吻合的。
APE
APE是流行的數(shù)字音樂無損壓縮格式之一,因出現(xiàn)較早,在全世界特別是中國(guó)大陸有著廣泛的用戶群。與MP3這類有損壓縮格式不可逆轉(zhuǎn)地刪除(人耳聽力不敏感的)數(shù)據(jù)以縮減源文件體積不同,APE這類無損壓縮格式,是以更精煉的記錄方式來縮減體積,還原后數(shù)據(jù)與源文件一樣,從而保證了文件的完整性。APE由軟件Monkey's audio壓制得到,開發(fā)者為Matthew T. Ashland,源代碼開放,因其界面上有只“猴子”標(biāo)志而出名。相較同類文件格式FLAC,ape有查錯(cuò)能力但不提供糾錯(cuò)功能,以保證文件的無損和純正;其另一個(gè)特色是壓縮率約為55%,比FLAC高,體積大概為原CD的一半,便于存儲(chǔ)。
APE作為一種無損壓縮音頻格式,通過Monkey's Audio這個(gè)軟件可以將龐大的WAV音頻文件壓縮為APE,,體積雖然變小了,但音質(zhì)和原來一樣。通過Monkey's Audio解壓縮還原以后得到的WAV文件可以做到與壓縮前的源文件完全一致。所以APE被譽(yù)為“無損音頻壓縮格式”,Monkey''s Audio被譽(yù)為“無損音頻壓縮軟件”。
簡(jiǎn)單來講,APE 壓縮與WinZip或WinRAR這類專業(yè)數(shù)據(jù)壓縮軟件壓縮原理類似,只是APE等無損壓縮數(shù)字音樂之后的APE音頻文件是可以直接被播放的。APE的壓縮速率是動(dòng)態(tài)的,壓縮時(shí)只壓縮可被壓縮部分,不能被壓縮的部分還是會(huì)保留下來。
FLAC
FLAC中文可解釋為無損音頻壓縮編碼。FLAC是一套著名的自由音頻壓縮編碼,其特點(diǎn)是無損壓縮。不同于其他有損壓縮編碼如MP3 及AAC,它不會(huì)破壞任何原有的音頻資訊,所以可以還原音樂光盤音質(zhì)。2012年以來它已被很多軟件及硬件音頻產(chǎn)品(如CD等)所支持.
FLAC與MP3不同,MP3是音頻壓縮編碼,但FLAC是無損壓縮,也就是說音頻以FLAC編碼壓縮后不會(huì)丟失任何信息,將FLAC文件還原為WAV文件后,與壓縮前的WAV文件內(nèi)容相同。這種壓縮與ZIP的方式類似,但FLAC的壓縮比率大于ZIP和RAR,因?yàn)镕LAC是專門針對(duì)PCM音頻的特點(diǎn)設(shè)計(jì)的壓縮方式。而且可以使用播放器直接播放FLAC壓縮的文件,就象通常播放你的MP3文件一樣(近幾年已經(jīng)有許多汽車播放器和家用音響設(shè)備支持FLAC,在FLAC的網(wǎng)站上你可以找到這些設(shè)備廠家的鏈接)。
FLAC是免費(fèi)的并且支持大多數(shù)的操作系統(tǒng),包括Windows,基于Unix Like內(nèi)核( (Linux,BSD,Solaris,IRIX, AIX等)而開發(fā)的系統(tǒng),BeOS,OS/2,Amiga。并且FLAC提供了在開發(fā)工具autotools,MSVC,Watcom C,Project Builder上的build系統(tǒng)。
AAC
Real Media
網(wǎng)絡(luò)流媒體的道理其實(shí)非常簡(jiǎn)單,簡(jiǎn)單說就是將原來連續(xù)不斷的音頻分割成一個(gè)一個(gè)帶有順序標(biāo)記的小數(shù)據(jù)包,將這些小數(shù)據(jù)包通過網(wǎng)絡(luò)進(jìn)行傳遞,在接收的時(shí)候再將這些數(shù)據(jù)包重新按順序組織起來播放。如果網(wǎng)絡(luò)質(zhì)量太差,有些數(shù)據(jù)包收不到或者延緩了到達(dá),它就跳過這些數(shù)據(jù)包不播放,以保證用戶在聆聽的內(nèi)容是基本連續(xù)的。就是這么簡(jiǎn)單的道理,促成了網(wǎng)絡(luò)上的又一個(gè)傳奇。
由于Real Media是從極差的網(wǎng)絡(luò)環(huán)境下發(fā)展過來的,所以Real Media的音質(zhì)并不怎樣,包括在高比特率的時(shí)候,甚至差于mp3。特別是有相當(dāng)長(zhǎng)的一段時(shí)間Real Networks公司只顧著往Real Media里面加入各種各樣的新特性比如廣告插播什么的,而忽略了隨著網(wǎng)絡(luò)速度的提升和寬帶網(wǎng)的普及,用戶對(duì)質(zhì)量的要求也不斷提高。后來Real Networks通過與SONY公司合作,利用SONY的ATRAC技術(shù)(http://www.minidisc.org/,也就是MD的壓縮技術(shù))實(shí)現(xiàn)高比特率的高保真壓縮,但這些舉措始終都帶給用戶一個(gè)姍姍來遲的感覺。由于Real Media的用途是在線聆聽,并不適于編輯,所以相應(yīng)的處理軟件并不多。一些主流軟件可以支持Real Media的讀/寫,可以實(shí)現(xiàn)直接剪輯的軟件是Real Networks自己提供的捆綁在Real Media Encoder編碼器中的Real Media Editor。但功能非常有限。這一點(diǎn)與現(xiàn)在的Windows Media相比是兩個(gè)世界。
Windows Media
Windows Media是一種網(wǎng)絡(luò)流媒體技術(shù),隸屬于微軟。任何事情都少不了Microsoft的份。在意識(shí)到網(wǎng)絡(luò)流媒體之于互聯(lián)網(wǎng)的重要性之后,Microsoft立馬就推出了Windows Media與Real Media相抗衡,同時(shí)開始對(duì)其他音頻壓縮技術(shù)說不:一律不提供直接支持。到了Windows XP版本還把原來提供的mp3壓縮功能都拿掉了。
Windows Media 也是一種網(wǎng)絡(luò)流媒體技術(shù),本質(zhì)上跟Real Media是相同的。但Real Media是有限開放的技術(shù),比如rtsp(Real Time Stream Protocol實(shí)時(shí)流協(xié)議)這樣的網(wǎng)絡(luò)傳輸協(xié)議是提交到網(wǎng)絡(luò)工作組RFC網(wǎng)絡(luò)協(xié)議集的其中一個(gè)(編號(hào)RFC2326),而Windows Media則沒有公開任何技術(shù)細(xì)節(jié),據(jù)稱是為了更好地進(jìn)行版權(quán)保護(hù),因此要完全封閉,還創(chuàng)造出一種名為mms(Multi-Media Stream多媒體流)的傳輸協(xié)議。所有這些事情綜合起來可以看出Microsoft意圖一統(tǒng)江湖的野心。
MIDI
MIDI(Musical Instrument Digital Interface)樂器數(shù)字接口 ,是20 世紀(jì)80 年代初為解決電聲樂器之間的通信問題而提出的。MIDI是編曲界最廣泛的音樂標(biāo)準(zhǔn)格式,可稱為“計(jì)算機(jī)能理解的樂譜”。它用音符的數(shù)字控制信號(hào)來記錄音樂。一首完整的MIDI音樂只有幾十KB大,而能包含數(shù)十條音樂軌道。幾乎所有的現(xiàn)代音樂都是用MIDI加上音色庫(kù)來制作合成的。MIDI 傳輸?shù)牟皇锹曇粜盘?hào), 而是音符、控制參數(shù)等指令, 它指示MIDI 設(shè)備要做什么,怎么做, 如演奏哪個(gè)音符、多大音量等。它們被統(tǒng)一表示成MIDI 消息(MIDI Message) 。傳輸時(shí)采用異步串行通信, 標(biāo)準(zhǔn)通信波特率為31.25×( 1±0.01) KBaud。
MIDI發(fā)明者,是美國(guó)的加州音樂人,Dave Smith。
三十年前,音樂人沒法同時(shí)操縱多個(gè)樂器,因?yàn)楫?dāng)時(shí)各種樂器是不可連接的。需要左右手同時(shí)彈奏兩個(gè)鍵盤。此后,合成器制造商Dave Smith,說服了唱片商采用了一種叫做“樂器數(shù)字接口”(Musical Instrument Digital Interface,MIDI)的通用格式,這種格式能夠讓合成器受到外部鍵盤信號(hào)控制,可以由唱片商的競(jìng)爭(zhēng)對(duì)手制作,甚至直接從電腦輸出。使運(yùn)算速度足夠快的電腦處理音符采樣,并能同時(shí)控制多個(gè)鍵盤和鼓機(jī)。
MIDI標(biāo)準(zhǔn)能讓人們?cè)谧约杭依镞M(jìn)行音樂創(chuàng)作,使人們終于能夠把合成器和鼓機(jī)連接到電腦上。于是,MIDI很快變成了連接各種型號(hào)的合成器、鼓機(jī)、采樣數(shù)據(jù)和計(jì)算機(jī)的產(chǎn)業(yè)標(biāo)準(zhǔn)。
MIDI無論放置在哪里,都能在一個(gè)合成器上演奏些東西,并能在另外一個(gè)合成器上播放完全一樣的聲響。復(fù)雜而精心控制的的合成器聲效、鼓機(jī)和采樣樣本見證了編曲技術(shù)從不可能到可能的轉(zhuǎn)變。隨著這種全新定義的制作方式,舞曲這種新的音樂類型誕生了。
第一臺(tái)能夠兼容MIDI格式的是一個(gè)由Dave Smith制作、叫做Prophet-900的合成器。它在1982年12月退役。 在當(dāng)時(shí)的青少年游戲玩家中流行的Atari以及Commodore64型計(jì)算機(jī)也能通過一個(gè)5針的線纜控制另一端的MIDI樂器。
MIDI音樂格式,帶有強(qiáng)烈的電子感,以及廣泛適用性和便利性,催生了那個(gè)年代眾多的音樂類型。重塑了1980年代的流行樂。
MIDI格式早期的的“開源精神”概念,讓每個(gè)人都能創(chuàng)作”復(fù)雜的音樂片段”,MIDI標(biāo)準(zhǔn)的支持者推動(dòng)它成為連接著著全世界的自由紐帶。三十年以后,MIDI仍然強(qiáng)勁不衰,作為專業(yè)音樂錄制和制作的關(guān)鍵組件而存續(xù)著。
OGG
Ogg全稱是OGGVobis(oggVorbis)是一種音頻壓縮格式,類似于MP3等的音樂格式。Ogg是完全免費(fèi)、開放和沒有專利限制的。OggVorbis文件的擴(kuò)展名是".ogg"。Ogg文件格式可以不斷地進(jìn)行大小和音質(zhì)的改良,而不影響舊有的編碼器或播放器。
MP3是有損壓縮格式,因此壓縮后的數(shù)據(jù)與標(biāo)準(zhǔn)的CD音樂相比是有損失的。VORBIS也是有損壓縮,通過使用更加先進(jìn)的聲學(xué)模型去減少損失,因此,同樣位速率(Bit Rate)編碼的OGG與MP3相比聽起來更好一些。另外,還有一個(gè)原因,MP3格式是受專利保護(hù)的(mp3專利費(fèi)已經(jīng)極低,誕生近20年快該過保護(hù)期了)。如果你想使用MP3格式發(fā)布自己的作品,則需要付給Fraunhofer(發(fā)明MP3的公司)專利使用費(fèi)。而VORBIS就完全沒有這個(gè)問題。對(duì)于樂迷來說想要高品質(zhì)的音頻,使用FLAC是個(gè)更好的選擇,因?yàn)镕LAC是無損壓縮音頻,又沒有專利授權(quán)費(fèi)用,現(xiàn)在很多播放器都加入了FLAC的行列,就連sony的頂級(jí)高解析音頻播放器都已經(jīng)支持。
優(yōu)點(diǎn)1:Ogg Vorbis的音質(zhì)和MP3不相上下,但無法和FLAC比。
由于Vorbis 使用了與MP3相比完全不同的數(shù)學(xué)原理,因此在壓縮音樂時(shí)受到的挑戰(zhàn)也不同。在聆聽測(cè)試中,同樣位速率編碼的Vorbis 和MP3文件具有同等的聲音質(zhì)量。
如果兩個(gè)文件都是以同樣的位速率和CBR(常量位速率,指文件從頭到尾都是一種位速率)方式來編碼的話,那他們的大小肯定相同。當(dāng)前 Vorbis 是以VBR方式編碼的,(很久以前MP3也可以用VBR方式編碼,除此以外還支持ABR(平局碼率)方式,ABR方式可以事先確定大小的情況下獲得盡可能好的音質(zhì),并且MP3支持通過左右聲道聯(lián)合立體聲編碼方式提高音質(zhì)。)這使得Ogg的文件可以更小,因?yàn)閂BR方式可以處理能大幅度進(jìn)行壓縮的音頻數(shù)據(jù)(比如無聲的時(shí)段)而節(jié)省空間。
優(yōu)點(diǎn)2:Ogg Vorbis支持類似于MP3的ID3信息
Vorbis格式中包括有一個(gè)靈活而又完整的注釋欄,可用于填寫各種相關(guān)信息。
優(yōu)點(diǎn)3:Ogg Vorbis格式支持流式播放
音頻流是Vorbis的一個(gè)重要組成部分.vorbis格式從設(shè)計(jì)的一開始就是立足于可以容易地進(jìn)行流式處理。并且,Vorbis的設(shè)計(jì)者正與Icecast流媒體軟件的創(chuàng)造者一起使Icecast兼容Vorbis。
優(yōu)點(diǎn)4:Ogg Vorbis避免了像MP3文件的ID3標(biāo)記那樣煩瑣的操作(有很多針對(duì)MP3的ID3修改軟件標(biāo)記早已不繁瑣)
Vorbis具有一個(gè)設(shè)計(jì)良好、靈活的注釋,避免了像MP3文件的ID3標(biāo)記那樣煩瑣的操作;Vorbis還具有位速率縮放:可以不用重新編碼便可調(diào)節(jié)文件的位速率。Vorbis文件可以被分成小塊并以樣本粒度進(jìn)行編輯;Vorbis支持多通道; Vorbis文件可以以邏輯方式相連接等。
缺點(diǎn)1:播放兼容性差。mp3已經(jīng)成了便攜隨身聽的代名詞。絕大多數(shù)播放器、包括手機(jī)、pad等設(shè)備都支持mp3格式(其實(shí)mp3專利芯片授權(quán)費(fèi)極低),而支持ogg格式的播放器很少。
缺點(diǎn)2:mp3是1997年以前就已經(jīng)誕生,將近20年壟斷了消費(fèi)機(jī)市場(chǎng)。ogg音頻普及性非常差,相對(duì)于mp3而言音質(zhì)也沒有競(jìng)爭(zhēng)力,普及的可能性極低。
缺點(diǎn)3:相對(duì)于已經(jīng)普及的微軟WMA格式,ogg沒有任何優(yōu)勢(shì)。不管是播放軟件兼容性,碼率,流媒體等方面。
缺點(diǎn)4:多聲道系統(tǒng)已經(jīng)由DOLBY、DTS兩家公司壟斷,他們都有完整的制作發(fā)行體系。大型多聲道電影、電視、音樂制作都是基于這兩家公司的技術(shù)和標(biāo)準(zhǔn)。ogg只能望洋興嘆了。
缺點(diǎn)5:很多專業(yè)音頻制作軟件不支持ogg文件格式。
缺點(diǎn)6:現(xiàn)今HIFI已經(jīng)被HIRES(高解析)代替,隨著存儲(chǔ)、網(wǎng)速等限制,用戶的聆聽設(shè)備已經(jīng)上了一個(gè)臺(tái)階,有損格式已經(jīng)漸漸失去市場(chǎng)。
VQF
VQF指的是TwinVQ(Transform-domain WeightedI Nterleave Vector Quantization),VQF是一種音頻壓縮技術(shù)。VQF所采用的是一種稱為“矢量化編碼(vectorquantization)”的壓縮技術(shù)。對(duì)計(jì)算機(jī)的配置要求為奔騰75或更高。
VQF格式實(shí)際指的是TwinVQ(transform-domain weighted interleave vector quantization),是日本ntt(nippon telegraph and telephone)集團(tuán)屬下的ntt human interface laboratories開發(fā)的一種音頻壓縮技術(shù)。VQF格式技術(shù)受到y(tǒng)amaha公司的支持,vqf是其文件的擴(kuò)展名。VQF格式和mp3的實(shí)現(xiàn)方法相似,都是通過采用有失真的算法來將聲音進(jìn)行壓縮,不過VQF格式與mp3的壓縮技術(shù)相比卻有著本質(zhì)上的不同:VQF格式的目的是對(duì)音樂而不是聲音進(jìn)行壓縮,因此,VQF格式所采用的是一種稱為“矢量化編碼(vector quantization)”的壓縮技術(shù)。該技術(shù)先將音頻數(shù)據(jù)矢量化,然后對(duì)音頻波形中相類似的波形部分統(tǒng)一與平滑化,并強(qiáng)化突出人耳敏感的部分,最后對(duì)處理后的矢量數(shù)據(jù)標(biāo)量化再進(jìn)行壓縮而成。
VQF使用范圍從電話、AM短波乃至音頻CD;從單聲道信號(hào)到立體聲信號(hào),它都能提供了很好的編碼/壓縮支持。還有糾錯(cuò)能力。VQF特別提供了一個(gè)糾錯(cuò)環(huán)境來處理數(shù)據(jù)錯(cuò)誤及幀丟失的情況。它使用修正幀頻率技術(shù),然后強(qiáng)化矢量量化以保證音質(zhì)。
MOD
MOD是一種類似波表的音樂格式,但它的結(jié)構(gòu)卻類似 MIDI,使用真實(shí)采樣,體積很小,在以前的DOS年代,MOD經(jīng)常被作為游戲的背景音樂?,F(xiàn)在的MOD可以包含很多音軌,而且格式眾多,如S3M、NST、669、MTM、XM、IT、XT和RT等。
Module(簡(jiǎn)稱mod)是數(shù)碼音樂文件,由一組samples(樂器的聲音采樣)、曲譜和時(shí)序信息組成,告訴一個(gè)mod播放器何時(shí)以何種音高去演奏在某條音軌的某個(gè)樣本,附帶演奏一些效果比如顫音等。因而mod與純正的象WAV或AU那樣的沒有包含時(shí)序信息的樣本文件不同,與象MIDI文件那樣的不攜帶任何附加樣本/樂器的文件也不同(與現(xiàn)在支持DLS技術(shù)的MIDI倒是有點(diǎn)相似,不過mod的體積要比DLS MIDI小得多。)。
mod起源于Amiga計(jì)算機(jī),當(dāng)時(shí)的文件擴(kuò)展名是MOD,為了區(qū)分具體的類型和整個(gè)結(jié)構(gòu)體系,通常使用MOD來表示整個(gè)Module格式體系。
由于該格式起源很早,因此曾經(jīng)非常流行,因?yàn)閙od提供了一種具有可以接受的音質(zhì)水平而又非常廉價(jià)的制作音樂的方法。而且這種文件的音質(zhì)效果對(duì)于當(dāng)時(shí)的電腦硬件水平來說效果比MIDI要好,文件的體積也不大,好處是顯而易見的。隨著高質(zhì)量的音響硬件的使用,新一代的mod的聲音質(zhì)量甚至可以提升到接近專業(yè)設(shè)備的水平。這使得mod成為一種介乎于象WAV或VOC那樣的純正樣本數(shù)據(jù)文件和象General MIDI那樣的純正時(shí)序信息文件之間的混合體,成為一種比較靈活的音頻格式。
但是,mod的最大缺點(diǎn)是具體的格式變化太多。由于原本的MOD格式只支持4條音軌,而且MOD格式并沒有版權(quán)限制,導(dǎo)致后來涌現(xiàn)了一大堆在MOD的基礎(chǔ)上改進(jìn)而來的格式,比如xm這種支持高達(dá)32條音軌128種采樣的格式。但由于mod格式的不統(tǒng)一,最終結(jié)果就是這種格式在商業(yè)領(lǐng)域沒有多大的作為。Windows平臺(tái)上曾經(jīng)有一個(gè)非常好的播放器名為MOD4WIN,后來也停止了開發(fā)。目前支持播放Mod的播放器主要有WinAMP。
Monkey's audio
Monkey's Audio這款軟件并不是由什么大公司發(fā)明的,完全是一個(gè)個(gè)人業(yè)余興趣作品。
為了使Monkey's Audio能有更好的發(fā)展,現(xiàn)在這個(gè)軟件已經(jīng)公開了源代碼。
這種壓縮格式的特點(diǎn)是無損壓縮,也就是說對(duì)壓縮數(shù)據(jù)進(jìn)行還原之后得到的數(shù)據(jù)與原來的數(shù)據(jù)是完全相同的。該格式的特點(diǎn)尤其適合那些擁有一對(duì)“金耳朵”并且一直對(duì)mp3的音質(zhì)耿耿于懷的音樂發(fā)燒友。
使用普通的壓縮軟件進(jìn)行壓縮無疑是可以得到不錯(cuò)的壓縮效果,有時(shí)候甚至更優(yōu)于使用Monkey's Audio,但是壓縮軟件生成的壓縮包必須要先解壓還原之后才能播放里面的內(nèi)容,而Monkey's Audio這種無損壓縮編碼得到的文件可以直接使用播放器(比如WinAMP)進(jìn)行播放。
Monkey's Audio的壓縮效果大約在2:1左右,也就是說壓縮結(jié)果是原來的二分之一大小。一張CD的存儲(chǔ)空間大約在680MB左右,在經(jīng)過Monkey's Audio壓縮之后的文件大約需要330MB左右的空間存放,相比之下還是比較占空間的。由于這個(gè)原因,所以對(duì)音質(zhì)要求不是太高的人通常都選擇VBR方式的mp3而不是選擇它。
與Monkey's Audio類似的編碼格式還包括WavPack、RKAU、Shorten等等。由于相對(duì)不是那么出名,又或者在某些方面不夠Monkey's Audio做得好,因此獲得的關(guān)注程度就遜色很多。
AIFF
Apple蘋果電腦(http://www.apple.com)上面的標(biāo)準(zhǔn)音頻格式,屬于QuickTime技術(shù)(http://www.apple.com/quicktime)的一部分。這一格式的特點(diǎn)就是格式本身與數(shù)據(jù)的意義無關(guān),因此受到了Microsoft的青睞,并據(jù)此搞出來WAV格式。AIFF雖然是一種很優(yōu)秀的文件格式,但由于它是蘋果電腦上的格式,因此在PC平臺(tái)上并沒有得到很大的流行。不過由于Apple電腦多用于多媒體制作出版行業(yè),因此幾乎所有的音頻編輯軟件和播放軟件都或多或少地支持AIFF格式。只要蘋果電腦還在,AIFF就始終還占有一席之地。
由于AIFF的包容特性,所以它支持許多壓縮技術(shù)。這里順帶說說的是在蘋果平臺(tái)上原生的流媒體壓縮技術(shù)是QDesign公司(http://www.qdesign.com)的QDMC,QDesign
Music Codec。據(jù)官方資料介紹,QDesign Music
Codec 2能在全帶寬立體聲的設(shè)置下將音頻壓縮為原來的百分之一大小。與其他純粹基于知覺音頻編碼技術(shù)(mp3等)不同的是,QDesign
Music Codec 2使用了新的專利的算法技術(shù),因此,可以在modem的速度上達(dá)到相當(dāng)?shù)囊纛l質(zhì)量。該技術(shù)最大支持128kbps。
AU
AU是UNIX系統(tǒng)開發(fā)的一種音樂格式,起源于Sun公司(http://www.sun.com)的Solaris系統(tǒng).
這是為UNIX系統(tǒng)開發(fā)的一種音樂格式,和WAV非常相像,在大多數(shù)的音頻編輯軟件中也都支持它們這幾種常見的音樂格式。在JAVA自帶的類庫(kù)中能得到播放支持。
voc
創(chuàng)新公司(Creative)的聲音卡成了PC平臺(tái)上的多媒體聲音卡事實(shí)標(biāo)準(zhǔn)的時(shí)候,VOC格式也跟同著成為了DOS系統(tǒng)下面的音頻文件格式標(biāo)準(zhǔn)。因?yàn)樗莿?chuàng)新公司發(fā)明的音頻文件格式。由于該格式屬于硬件公司的產(chǎn)品,因此不可避免地帶有濃厚的硬件相關(guān)色彩。這一點(diǎn)隨著Windows平臺(tái)本身提供了標(biāo)準(zhǔn)的文件格式WAV之后就變成了明顯的缺點(diǎn)。加上Windows平臺(tái)不提供對(duì)VOC格式的直接支持,所以VOC格式很快便消失在人們的視線中。不過很多播放器和音頻編輯器都還是支持該格式的。