音視頻基礎

音視頻原始文件

  1. 采集的音頻原始文件為PCM格式。
  2. 采集的視頻原始文件為YUV/RGB格式。

由于采集的原始的音視頻文件數據量超大,不易于傳輸和存儲,所以必須要對音視頻文件進行編碼壓縮。

音視頻編碼

視頻編碼的主要作用是將視頻像素數據(RGB,YUV等)壓縮成為視頻碼流,從而降低視頻的數據量。如果視頻不經過壓縮編碼的話,體積通常是非常大的,一部電影可能就要上百G的空間。視頻編碼是視音頻技術中最重要的技術之一。視頻碼流的數據量占了視音頻總數據量的絕大部分。高效率的視頻編碼在同等的碼率下,可以獲得更高的視頻質量。

A. 軟編軟解與硬編解碼的概念

1. 軟編軟解: 利用CPU做視頻的編碼和解碼; 占用CPU資源,編解碼效率不高;
2. 硬編解碼: 利用GPU或者專用處理器來對視頻流進行編解碼,也就是硬件編碼和解碼.在iOS 8.0后,
蘋果將該Video/Audio ToolBox(之前在Mac系統中使用)框架引入iOS系統。

在此之前我們通常使用的FFmpeg多媒體庫,利用CPU來進行視頻的編解碼,占用CPU資源,效率低下,俗稱軟編解碼.而蘋果在2014年的iOS8中,開放了VideoToolbox.framwork框架,此框架使用GPU或專用的處理器來進行編解碼,俗稱硬編解碼.而此框架在此之前只有MAC OS系統中可以使用,在iOS作為私有框架.終于蘋果在iOS8.0中得到開放引入.

B. 編碼格式

  • 音頻編碼格式:AAC
    AAC(Advanced Audio Coding),中文名:高級音頻編碼,出現于1997年,基于MPEG-2的音頻編碼技術。由Fraunhofer IIS、杜比實驗室、AT&T、Sony等公司共同開發,目的是取代MP3格式。2000年,MPEG-4標準出現后,AAC重新集成了其特性,加入了SBR技術和PS技術,為了區別于傳統的MPEG-2 AAC又稱為MPEG-4 AAC。

  • 視頻編碼格式:H264
    H.264,同時也是MPEG-4第十部分,是由ITU-T視頻編碼專家組(VCEG)和ISO/IEC動態圖像專家組(MPEG)聯合組成的聯合視頻組(JVT,Joint Video Team)提出的高度壓縮數字視頻編解碼器標準。這個標準通常被稱之為H.264/AVC(或者AVC/H.264或者H.264/MPEG-4 AVC或MPEG-4/H.264 AVC)而明確的說明它兩方面的開發者。

視頻封裝格式

封裝格式的主要作用是把編碼壓縮后的視頻碼流和音頻碼流按照一定的格式存儲在一個文件中。現如今流行的封裝格式如下表所示:

封裝格式和編碼格式的區別:

編碼(codec),比如視頻編碼h264,h265,音頻編碼aac,mp3,它存在的目的主要是壓縮原始數據的體積。封裝格式(container),比如mp4,mkv,用來存儲/傳輸編碼數據,并按一定規則把音視頻、字幕等數據組織起來,里面都會有一些信息,比如當前流中包含哪些編碼類型,時間戳等,播放器可以按照這些信息來匹配解碼器、同步音視頻。

視頻播放流程

視頻播放器播放一個互聯網上的視頻文件,需要經過以下幾個步驟:解協議,解封裝,解碼視音頻,視音頻同步。如果播放本地文件則不需要解協議,為以下幾個步驟:解封裝,解碼視音頻,視音頻同步。他們的過程如圖所示。

流媒體協議是服務器與客戶端之間通信遵循的規定。當前網絡上主要的流媒體協議如表所示。

VideoToolbox的基本數據

Video Toolbox視頻編解碼前后需要應用的數據結構進行說明。

  • CVPixelBuffer:編碼前和解碼后的圖像數據結構。此內容包含一系列的CVPixelBufferPool內容

  • CMBlockBuffer:編碼后,結果圖像的數據結構。

  • CMTime、CMClock和CMTimebase:時間戳相關。時間以64-bit/32-bit的形式出現。

  • pixelBufferAttributes:字典設置.可能包括Width/height、pixel format type、? Compatibility (e.g., OpenGL ES, Core Animation)

  • CMVideoFormatDescription:圖像存儲方式,編解碼器等格式描述。

  • CMSampleBuffer:存放編解碼前后的視頻圖像的容器數據結構。

音視頻質量

開始中我們要了解幾種影響音視頻的質量的關鍵概念:

  • 碼流(也通常稱碼率、比特率)
    指在單位時間傳輸或解碼的位數(數據流量),是視頻中畫面質量控制的最重要部分。在分辨率相同的情況下,碼流越大,壓縮的比例就越小,畫面質量越高,視頻文件的體積也就越大.碼流越大,說明單位時間內采樣率越大,數據流和精度也越高,所以圖像畫面質量越好、越清晰,但要求設備的解碼能力也越強;

  • 采樣率(也稱為采樣速度或采樣頻率)
    指每秒從連續的信號中提取并組成離散信號的采樣個數,使用Hz(赫茲)來表示。 能夠將模擬信號轉換成數字信號時的采樣頻率,也就是單位時間內采樣多少點。一個采樣點數據有多少個比特。采集的數值越大,音視頻的質量越好。

  • 比特率
    指每秒傳送的比特數,單位我bps(Bit Per Second),比特率越大,輸送的數據也就越大,音質越好.視頻中的比特率通常為碼率。
    比特率 =采樣率 * 采用位數 *聲道數.

  • 幀速度(幀率)
    指每秒刷新圖片的幀數(FPS),幀數越多,圖像動作越流暢.

  • 分辨率
    即為幀的大小.每一幀都是一副圖像。一個音頻編碼率為128Kbps,視頻編碼率為800Kbps的文件,其總編碼率為928Kbps,意思是經過編碼后的數據每秒鐘需要用928K比特來表示。
    計算輸出文件大小公式:

音頻編碼率(KBit為單位)/8 +視頻編碼率(KBit為單位)/8 *影片總長度(秒為單位)
=文件大小(MB為單位)

由此從上述概念可知:

碼流、采樣率、幀率值越大,視頻和音頻的質量和清晰度越大.分辨率影響圖像大小,所以分辨率越高,圖像越大,分辨率越低,圖像越小。

因此,碼率一定的情況下,分辨率越高,圖像越不清晰.

但事實情況下,硬件設備也會影響,我們不能無限制的讓這些參數變大,同時,碼率一定的情況下,分辨率在一定的范圍內取值圖像都是清晰的;同樣分辨率一定,碼率在一定的范圍內取值也都是清晰。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,565評論 6 539
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,115評論 3 423
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,577評論 0 382
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,514評論 1 316
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,234評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,621評論 1 326
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,641評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,822評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,380評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,128評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,319評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,879評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,548評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,970評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,229評論 1 291
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,048評論 3 397
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,285評論 2 376

推薦閱讀更多精彩內容

  • 視頻編碼與封裝方式詳解 1.編碼方式和封裝格式 2.視頻編碼標準兩大系統 MPEG-1 MPEG-2 MPEG-3...
    latthias閱讀 6,397評論 0 22
  • [TOC] 音視頻&流媒體 是什么促使我要寫這一篇音視頻入門文章?那是因為和一妹子打賭碼率的概念,結果輸了;對一個...
    AllenWu閱讀 4,873評論 1 24
  • 前言 說到視頻,大家自己腦子里基本都會想起電影、電視劇、在線視頻等等,也會想起一些視頻格式 AVI、MP4、RMV...
    ForestSen閱讀 23,142評論 10 203
  • “隨著技術的不斷進步,視頻技術的制作加工門檻逐漸降低,信息資源的不斷增長,同時由于視頻信息內容更加豐富完整的先天優...
    陳墨啊閱讀 2,968評論 2 53
  • 好記性不如爛鍵盤,持續整理了一下視頻里面一些基礎的概念。 文件格式 封裝格式 視頻編解碼方式H.26X 系列MPE...
    vedon_fu閱讀 2,236評論 0 3