引言
更多文章請訪問 自己動手寫 H.264 解碼器
目前 H.264 流行的包裝方式有兩種,一種叫做 AnnexB,一種叫做 avcC。對于這兩種格式,各家的支持程度也不太一樣,例如,Android 硬解碼 MediaCodec 只接受 AnnexB 格式的數據,而 Apple 的 VideoToolBox,只支持 avcC 的格式。所以這就需要我們從業者對兩種格式都有一個了解。本章,我們先來介紹 AnnexB
AnnexB
假如我們把多個 NALU 寫到一個文件里面去,多個 NALU 首位相連穿成一串,因為 NALU 本身長度不一,也沒有具體的標識符用來表明自己是一個獨立的 NALU,那么我們在讀取這個文件的時候其實并沒有辦法將寫到一起 NALU 有效得進行區分。為了解決這個問題,我們必須給 NALU 添加上一些數據,將各個 NALU 進行分割。 AnnexB 就是用來對 NALU 層進行包裝的一種格式。
AnnexB 格式的原理非常簡單,就是在一個 NALU 前面加上三個或者四個字節,這些字節的內容是 0 0 0 1 或者 0 0 1。當我們讀取一個 H264 流的時候,一旦遇到 0 0 0 1 或者 0 0 1,我們就認為一個新的 NALU 開始了,因此,這些用來做分隔符的字節,一般也被稱為 start code, 起始碼。
防競爭字節 (Emulation Prevention Bytes)
但是只在 NALU 前面加上起始碼是會產生問題了,因為原始碼流中,是有可能出現 0 0 0 1 或者 0 0 1 的,這樣就會導致讀取程序將一個 NALU 誤分割成多個 NALU。為了防止這種情況發生,AnnexB 引入了防競爭字節(Emulation Prevention Bytes)的概念。
所謂防競爭字節(Emulation Prevention Bytes),就是在給 NALU 添加起始碼之前,先對碼流進行一次遍歷,查找碼流里面的存在的 0 0 0,0 0 1,0 0 2,0 0 3 的字節,然后對其進行如下修改
0 0 0 => 0 0 3 0
0 0 1 => 0 0 3 1
0 0 2 => 0 0 3 2
0 0 3 => 0 0 3 3
即在上面的 4 種情況下,在 0 0 之后,插入一個字節,內容是 3。經過這樣處理的碼流,就不會再和起始碼(0 0 1, 0 0 0 1)重復而發生沖突。
當然,在解碼過程中,通過起始碼成功分割 NALU 數據之后,還要將防競爭字節去掉。
0 0 3 0 => 0 0 0
0 0 3 1 => 0 0 1
0 0 3 2 => 0 0 2
0 0 3 3 => 0 0 3
這樣才能得到真正的 NALU 碼流。
avcC
AnnexB 的原理是在每個 NALU 前面寫上一個特殊的起始碼,通過這個起始碼來當做 NALU 的分隔符,從而分割每個 NALU。而 avcC 則采用了另外一種方式。那就是在 NALU 前面寫上幾個字節,這幾個字節組成一個整數(大端字節序)這個整數表示了整個 NALU 的長度。在讀取的時候,先把這個整數讀出來,拿到這個 NALU 的長度,然后按照長度讀取整個 NALU。
avcC 詳解
在介紹 avcC 格式之前,我們先來介紹一下兩個特殊的 NALU,這兩個 NALU 就是 SPS 和 PPS,SPS 和 PPS 存放了解碼一路 H.264 碼流的必要的參數信息,也就是說,你想要解碼一路 H.264,就必須首先獲取到 SPS 和 PPS。在后面的課程中,我們會詳細介紹 SPS 和 PPS,現在你只需要知道,SPS 和 PPS 是特殊且重要的兩個 NALU。
在 AnnexB 中,SPS 和 PPS 被當做了普通的 NALU 進行處理;而在 avcC 中,SPS 和 PPS 信息被當做了特殊的信息進行了處理。
在一路采用 avcC 打包的 H.264 流之中,我們首先看到的將是一段被稱之為 extradata 的數據,這段數據定義了這個 H.264 流的基本屬性數據,當然,也包含了 SPS 和 PPS 數據。
我們來看一下 extradata 數據格式
bits
8 version ( always 0x01 )
8 avc profile ( sps[0][1] )
8 avc compatibility ( sps[0][2] )
8 avc level ( sps[0][3] )
6 reserved ( all bits on )
2 NALULengthSizeMinusOne // 這個值是(前綴長度-1)
3 reserved ( all bits on )
5 number of SPS NALUs (usually 1)
repeated once per SPS:
16 SPS size
variable SPS NALU data
8 number of PPS NALUs (usually 1)
repeated once per PPS
16 PPS size
variable PPS NALU data
我們注意一下這個值 NALULengthSizeMinusOne,通過將這個值加 1 ,我們就得出了后續每個 NALU 前面前綴(也就是表示長度的整數)的字節數
例如,這個 NALULengthSizeMinusOne 是 3,那么每個 NALU 前面前綴的長度就是 4 個字節。我們在讀取后續數據時,可以先讀 4 個字節,然后把這四個字節轉成整數,就是這個 NALU 的長度了,注意,這個長度并不包含起始的4個字節,是單純 NALU 的長度。