iOS8系統(tǒng)H264視頻硬件編解碼說明

公司項(xiàng)目原因,接觸了一下視頻流H264的編解碼知識,之前項(xiàng)目使用的是FFMpeg多媒體庫,利用CPU做視頻的編碼和解碼,俗稱為軟編軟解。該方法比較通用,但是占用CPU資源,編解碼效率不高。一般系統(tǒng)都會(huì)提供GPU或者專用處理器來對視頻流進(jìn)行編解碼,也就是硬件編碼和解碼,簡稱為硬編解碼。蘋果在iOS 8.0系統(tǒng)之前,沒有開放系統(tǒng)的硬件編碼解碼功能,不過Mac OS系統(tǒng)一直有,被稱為Video ToolBox的框架來處理硬件的編碼和解碼,終于在iOS 8.0后,蘋果將該框架引入iOS系統(tǒng)。

由此,開發(fā)者便可以在iOS里面,調(diào)用Video Toolbox框架提供的接口,來對視頻進(jìn)行硬件編解碼的工作,為VOIP視頻通話,視頻流播放等應(yīng)用的視頻編解碼提供了便利。

(PS:按照蘋果WWDC2014 513《direct access to media encoding and decoding》的描述,蘋果之前提供的AVFoundation框架也使用硬件對視頻進(jìn)行硬編碼和解碼,但是編碼后直接寫入文件,解碼后直接顯示。Video Toolbox框架可以得到編碼后的幀結(jié)構(gòu),也可以得到解碼后的原始圖像,因此具有更大的靈活性做一些視頻圖像處理。)

一,VideoToolbox基本數(shù)據(jù)結(jié)構(gòu)。

Video Toolbox視頻編解碼前后需要應(yīng)用的數(shù)據(jù)結(jié)構(gòu)進(jìn)行說明。

(1)CVPixelBuffer:編碼前和解碼后的圖像數(shù)據(jù)結(jié)構(gòu)。

(2)CMTime、CMClock和CMTimebase:時(shí)間戳相關(guān)。時(shí)間以64-bit/32-bit的形式出現(xiàn)。

(3)CMBlockBuffer:編碼后,結(jié)果圖像的數(shù)據(jù)結(jié)構(gòu)。

(4)CMVideoFormatDescription:圖像存儲方式,編解碼器等格式描述。

(5)CMSampleBuffer:存放編解碼前后的視頻圖像的容器數(shù)據(jù)結(jié)構(gòu)。

1.1視頻H264編解碼前后數(shù)據(jù)結(jié)構(gòu)示意圖

如圖1.1所示,編解碼前后的視頻圖像均封裝在CMSampleBuffer中,如果是編碼后的圖像,以CMBlockBuffe方式存儲;解碼后的圖像,以CVPixelBuffer存儲。CMSampleBuffer里面還有另外的時(shí)間信息CMTime和視頻描述信息CMVideoFormatDesc。

二,硬解碼使用方法。

通過如圖2.1所示的一個(gè)典型應(yīng)用,來說明如何使用硬件解碼接口。該應(yīng)用場景是從網(wǎng)絡(luò)處傳來H264編碼后的視頻碼流,最后顯示在手機(jī)屏幕上。

2.1 H264典型應(yīng)用場景

1,將H264碼流轉(zhuǎn)換成解碼前的CMSampleBuffer。

由圖1.1所示,解碼前的CMSampleBuffer = CMTime + FormatDesc + CMBlockBuffer。需要從H264的碼流里面提取出以上的三個(gè)信息。最后組合成CMSampleBuffer,提供給硬解碼接口來進(jìn)行解碼工作。

H264的碼流由NALU單元組成,NALU單元包含視頻圖像數(shù)據(jù)和H264的參數(shù)信息。其中視頻圖像數(shù)據(jù)就是CMBlockBuffer,而H264的參數(shù)信息則可以組合成FormatDesc。具體來說參數(shù)信息包含SPS(Sequence Parameter Set)和PPS(Picture Parameter Set)。圖2.2顯示一個(gè)H264碼流的結(jié)構(gòu)。

2.2 H264碼流結(jié)構(gòu)

(1)提取sps和pps生成format description。

a,每個(gè)NALU的開始碼是0x00 00 01,按照開始碼定位NALU。

b,通過類型信息找到sps和pps并提取,開始碼后第一個(gè)byte的后5位,7代表sps,8代表pps。

c,CMVideoFormatDescriptionCreateFromH264ParameterSets函數(shù)來構(gòu)建CMVideoFormatDescriptionRef。具體代碼可以見demo。

(2)提取視頻圖像數(shù)據(jù)生成CMBlockBuffer。

a,通過開始碼,定位到NALU。

b,確定類型為數(shù)據(jù)后,將開始碼替換成NALU的長度信息(4 Bytes)。

c,CMBlockBufferCreateWithMemoryBlock接口構(gòu)造CMBlockBufferRef。具體代碼可以見demo。

(3)根據(jù)需要,生成CMTime信息。(實(shí)際測試時(shí),加入time信息后,有不穩(wěn)定的圖像,不加入time信息反而沒有,需要進(jìn)一步研究,這里建議不加入time信息)

根據(jù)上述得到CMVideoFormatDescriptionRef、CMBlockBufferRef和可選的時(shí)間信息,使用CMSampleBufferCreate接口得到CMSampleBuffer數(shù)據(jù)這個(gè)待解碼的原始的數(shù)據(jù)。見圖2.3的H264數(shù)據(jù)轉(zhuǎn)換示意圖。

2.3 H264碼流轉(zhuǎn)換CMSampleBuffer示意圖

2,硬件解碼圖像顯示。

硬件解碼顯示的方式有兩種:

(1)通過系統(tǒng)提供的AVSampleBufferDisplayLayer來解碼并顯示。

AVSampleBufferDisplayLayer是蘋果提供的一個(gè)專門顯示編碼后的H264數(shù)據(jù)的顯示層,它是CALayer的子類,因此使用方式和其它CALayer類似。該層內(nèi)置了硬件解碼功能,將原始的CMSampleBuffer解碼后的圖像直接顯示在屏幕上面,非常的簡單方便。圖2.4顯示了這一解碼過程。

2.4 AVSampleBufferDisplayLayer硬解壓后顯示圖像

顯示的接口為[_avslayer enqueueSampleBuffer:sampleBuffer];

(2)通過VTDecompression接口來,將CMSampleBuffer解碼成圖像,將圖像通過UIImageView或者OpenGL上顯示。

a,初始化VTDecompressionSession,設(shè)置解碼器的相關(guān)信息。初始化信息需要CMSampleBuffer里面的FormatDescription,以及設(shè)置解碼后圖像的存儲方式。demo里面設(shè)置的CGBitmap模式,使用RGB方式存放。編碼后的圖像經(jīng)過解碼后,會(huì)調(diào)用一個(gè)回調(diào)函數(shù),將解碼后的圖像交個(gè)這個(gè)回調(diào)函數(shù)來進(jìn)一步處理。我們就在這個(gè)回調(diào)里面,將解碼后的圖像發(fā)給control來顯示,初始化的時(shí)候要將回調(diào)指針作為參數(shù)傳給create接口函數(shù)。最后使用create接口對session來進(jìn)行初始化。

b,a中所述的回調(diào)函數(shù)可以完成CGBitmap圖像轉(zhuǎn)換成UIImage圖像的處理,將圖像通過隊(duì)列發(fā)送到Control來進(jìn)行顯示處理。

c,調(diào)用VTDecompresSessionDecodeFrame接口進(jìn)行解碼操作。解碼后的圖像會(huì)交由a,b步驟設(shè)置的回調(diào)函數(shù),來進(jìn)一步的處理。

圖2.5顯示來硬解碼的過程步驟。

2.5 VTDecompression硬解碼過程示意圖

三,硬編碼使用方法。

硬編碼的使用也通過一個(gè)典型的應(yīng)用場景來描述。首先,通過攝像頭來采集圖像,然后將采集到的圖像,通過硬編碼的方式進(jìn)行編碼,最后編碼后的數(shù)據(jù)將其組合成H264的碼流通過網(wǎng)絡(luò)傳播。

1,攝像頭采集數(shù)據(jù)。

攝像頭采集,iOS系統(tǒng)提供了AVCaptureSession來采集攝像頭的圖像數(shù)據(jù)。設(shè)定好session的采集解析度。再設(shè)定好input和output即可。output設(shè)定的時(shí)候,需要設(shè)置delegate和輸出隊(duì)列。在delegate方法,處理采集好的圖像。

注意,需要說明的是,圖像輸出的格式,是未編碼的CMSampleBuffer形式。

2,使用VTCompressionSession進(jìn)行硬編碼。

(1)初始化VTCompressionSession。

VTCompressionSession初始化的時(shí)候,一般需要給出width寬,height長,編碼器類型kCMVideoCodecType_H264等。然后通過調(diào)用VTSessionSetProperty接口設(shè)置幀率等屬性,demo里面提供了一些設(shè)置參考,測試的時(shí)候發(fā)現(xiàn)幾乎沒有什么影響,可能需要進(jìn)一步調(diào)試。最后需要設(shè)定一個(gè)回調(diào)函數(shù),這個(gè)回調(diào)是視頻圖像編碼成功后調(diào)用。全部準(zhǔn)備好后,使用VTCompressionSessionCreate創(chuàng)建session。

(2)提取攝像頭采集的原始圖像數(shù)據(jù)給VTCompressionSession來硬編碼。

攝像頭采集后的圖像是未編碼的CMSampleBuffer形式,利用給定的接口函數(shù)CMSampleBufferGetImageBuffer從中提取出CVPixelBufferRef,使用硬編碼接口VTCompressionSessionEncodeFrame來對該幀進(jìn)行硬編碼,編碼成功后,會(huì)自動(dòng)調(diào)用session初始化時(shí)設(shè)置的回調(diào)函數(shù)。

(3)利用回調(diào)函數(shù),將因編碼成功的CMSampleBuffer轉(zhuǎn)換成H264碼流,通過網(wǎng)絡(luò)傳播。

基本上是硬解碼的一個(gè)逆過程。解析出參數(shù)集SPS和PPS,加上開始碼后組裝成NALU。提取出視頻數(shù)據(jù),將長度碼轉(zhuǎn)換成開始碼,組長成NALU。將NALU發(fā)送出去。

圖2.6顯示了整個(gè)硬編碼的處理邏輯。

2.6硬編碼處理流程示意圖

四,硬編解碼的一些編碼說明。

由于Video Toolbox是基礎(chǔ)的core Foundation庫函數(shù),C語言寫成,和使用core Foundation所有的其它功能一樣需要適應(yīng),記得Github有個(gè)同志,將其改成了OC語言能方便調(diào)用的模式,但是地址忘了,以后有緣找到,就會(huì)提供下鏈接。


Demo : https://github.com/manishganvir/iOS-h264Hw-Toolbox

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容