ffmpeg 2.3版本, 關于ffplay音視頻同步的分析

最近學習播放器的一些東西,所以接觸了ffmpeg,看源碼的過程中,就想了解一下ffplay是怎么處理音視頻同步的,之前只大概知道通過pts來進行同步,但對于如何實現卻不甚了解,所以想借助這個機會,從最直觀的代碼入手,詳細分析一下如何處理音視頻同步。在看代碼的時候,剛開始腦袋一片混亂,對于ffplay.c里面的各種時間計算完全摸不著頭腦,在網上查找資料的過程中,發現關于分析ffplay音視頻同步的東西比較少,要么就是ffplay版本太過于老舊,代碼和現在最新版本已經不一樣,要么就是簡單的分析了一下,沒有詳細的講清楚為什么要這么做。遂決定,在自己學習的過程中,記錄下自己的分析思路,以供大家指正和參考。我用的ffmpeg版本是2.3, SDL版本為1.2.14,編譯環境是windos xp下使用MinGw+msys.

轉自:http://www.oooo.club/archives/646/

一、先簡單介紹下ffplay的代碼結構。如下:

1.??????Main函數中需要注意的有

(1)??????av_register_all接口,該接口的主要作用是注冊一些muxer、demuxer、coder、和decoder. 這些模塊將是我們后續編解碼的關鍵。每個demuxer和decoder都對應不同的格式,負責不同格式的demux和decode

(2)??????stream_open接口,該接口主要負責一些隊列和時鐘的初始化工作,另外一個功能就是創建read_thread線程,該線程將負責文件格式的檢測,文件的打開以及frame的讀取工作,文件操作的主要工作都在這個線程里面完成

(3)??????event_loop:事件處理,event_loop->refresh_loop_wait_event-> video_refresh,通過這個順序進行視頻的display

2.Read_thread線程

(1)? 該線程主要負責文件操作,包括文件格式的檢測,音視頻流的打開和讀取,它通過av_read_frame讀取完整的音視頻frame packet,并將它們放入對應的隊列中,等待相應的解碼線程進行解碼

3. video_thread線程,該線程主要負責將packet隊列中的數據取出并進行解碼,然將解碼完后的picture放入picture隊列中,等待SDL進行渲染

4. sdl_audio_callback,這是ffplay注冊給SDL的回調函數,其作用是進行音頻的解碼,并在SDL需要數據的時候,將解碼后的音頻數據寫入SDL的緩沖區,SDL再調用audio驅動的接口進行播放。

5. video_refresh,該接口的作用是從picture隊列中獲取pic,并調用SDL進行渲染,音視頻同步的關鍵就在這個接口中

二、音視頻的同步

要想了解音視頻的同步,首先得去了解一些基本的概念,video的frame_rate. Pts, audio的frequency之類的東西,這些都是比較基礎的,網上資料很多,建議先搞清楚這些基本概念,這樣閱讀代碼才會做到心中有數,好了,閑話少說,開始最直觀的源碼分析吧,如下:

(1)??????首先來說下video和audio 的輸出接口,video輸出是通過調用video_refresh-> video_display-> video_image_display-> SDL_DisplayYUVOverlay來實現的。Audio是通過SDL回調sdl_audio_callback(該接口在打開音頻時注冊給SDL)來實現的。

(2)??????音視頻同步的機制,據我所知有3種,(a)以音頻為基準進行同步(b)以視頻為基準進行同步(c)以外部時鐘為基準進行同步。Ffplay中默認以音頻為基準進行同步,我們的分析也是基于此,其它兩種暫不分析。

(3)??????既然視頻和音頻的播放是獨立的,那么它們是如何做到同步的,答案就是通過ffplay中音視頻流各自維護的clock來實現,具體怎么做,我們還是來看代碼吧。

(4)??????代碼分析:

(a)??????先來看video_refresh的代碼, 去掉了一些無關的代碼,像subtitle和狀態顯示

static voidvideo_refresh(void *opaque, double *remaining_time)

{

VideoState *is = opaque;

double time;

SubPicture *sp, *sp2;

if (!is->paused &&get_master_sync_type(is) == AV_SYNC_EXTERNAL_CLOCK && is->realtime)

check_external_clock_speed(is);

if(!display_disable && is->show_mode != SHOW_MODE_VIDEO &&is->audio_st)

{

time = av_gettime_relative() /1000000.0;

if (is->force_refresh ||is->last_vis_time + rdftspeed < time) {

video_display(is);

is->last_vis_time = time;

}

*remaining_time =FFMIN(*remaining_time, is->last_vis_time + rdftspeed - time);

}

if (is->video_st) {

int redisplay = 0;

if (is->force_refresh)

redisplay = pictq_prev_picture(is);

retry:

if (pictq_nb_remaining(is) == 0) {

// nothing to do, no picture todisplay in the queue

} else {

double last_duration, duration, delay;

VideoPicture *vp, *lastvp;

/* dequeue the picture */

lastvp =&is->pictq[is->pictq_rindex];

vp =&is->pictq[(is->pictq_rindex + is->pictq_rindex_shown) % VIDEO_PICTURE_QUEUE_SIZE];

if (vp->serial !=is->videoq.serial) {

pictq_next_picture(is);

is->video_current_pos = -1;

redisplay = 0;

goto retry;

}

/*不管是vp的serial還是queue的serial, 在seek操作的時候才會產生變化,更準確的說,應該是packet 隊列發生flush操作時*/

if (lastvp->serial !=vp->serial && !redisplay)

{

is->frame_timer =av_gettime_relative() / 1000000.0;

}

if (is->paused)

goto display;

/*通過pts計算duration,duration是一個videoframe的持續時間,當前幀的pts 減去上一幀的pts*/

/* compute nominal last_duration */

last_duration = vp_duration(is,lastvp, vp);

if (redisplay)

{

delay = 0.0;

}

/*音視頻同步的關鍵點*/

else

delay =compute_target_delay(last_duration, is);

/*time 為系統當前時間,av_gettime_relative拿到的是1970年1月1日到現在的時間,也就是格林威治時間*/

time=av_gettime_relative()/1000000.0;

/*frame_timer實際上就是上一幀的播放時間,該時間是一個系統時間,而 frame_timer + delay 實際上就是當前這一幀的播放時間*/

if (time < is->frame_timer +delay && !redisplay) {

/*remaining 就是在refresh_loop_wait_event 中還需要睡眠的時間,其實就是現在還沒到這一幀的播放時間,我們需要睡眠等待*/

*remaining_time =FFMIN(is->frame_timer + delay - time, ?*remaining_time);

return;

}

is->frame_timer += delay;

/*如果下一幀的播放時間已經過了,并且其和當前系統時間的差值超過AV_SYNC_THRESHOLD_MAX,則將下一幀的播放時間改為當前系統時間,并在后續判斷是否需 ? ? ? ? ? ? ? 要丟幀,其目的是立刻處理?*/

if (delay > 0 && time -is->frame_timer > AV_SYNC_THRESHOLD_MAX)

{

is->frame_timer = time;

}

SDL_LockMutex(is->pictq_mutex);

/*視頻幀的pts一般是從0開始,按照幀率往上增加的,此處pts是一個相對值,和系統時間沒有關系,對于固定fps,一般是按照1/frame_rate的速度往上增加,可變fps暫 ? ? ? ? ? ?時沒研究*/

if (!redisplay &&!isnan(vp->pts))

/*更新視頻的clock,將當前幀的pts和當前系統的時間保存起來,這2個數據將和audio? clock的pts 和系統時間一起計算delay*/

update_video_pts(is,vp->pts, vp->pos, vp->serial);

SDL_UnlockMutex(is->pictq_mutex);

if (pictq_nb_remaining(is) > 1){

VideoPicture *nextvp =&is->pictq[(is->pictq_rindex + is->pictq_rindex_shown + 1) %VIDEO_PICTURE_QUEUE_SIZE];

duration = vp_duration(is, vp,nextvp);

/*如果延遲時間超過一幀,并且允許丟幀,則進行丟幀處理*/

if(!is->step &&(redisplay || framedrop>0 || (framedrop && get_master_sync_type(is)!= AV_SYNC_VIDEO_MASTER)) && time > is->frame_timer + duration){

if (!redisplay)

is->frame_drops_late++;

/*丟掉延遲的幀,取下一幀*/

pictq_next_picture(is);

redisplay = 0;

goto retry;

}

}

display:

/* display picture */

/*刷新視頻幀*/

if (!display_disable &&is->show_mode == SHOW_MODE_VIDEO)

video_display(is);

pictq_next_picture(is);

if (is->step &&!is->paused)

stream_toggle_pause(is);

}

}

}

(b)??????視頻的播放實際上是通過上一幀的播放時間加上一個延遲來計算下一幀的計算時間的,例如上一幀的播放時間pre_pts是0,延遲delay為33ms,那么下一幀的播放時間則為0+33ms,第一幀的播放時間我們可以輕松獲取,那么后續幀的播放時間的計算,起關鍵點就在于delay,我們就是更具delay來控制視頻播放的速度,從而達到與音頻同步的目的,那么如何計算delay?接著看代碼,compute_target_delay接口:

static doublecompute_target_delay(double delay, VideoState *is)

{

double sync_threshold,diff;

/* update delay to followmaster synchronisation source */

/*如果主同步方式不是以視頻為主,默認是以audio為主進行同步*/

if(get_master_sync_type(is) != AV_SYNC_VIDEO_MASTER) {

/* if video is slave,we try to correct big delays by

duplicating ordeleting a frame */

/*get_clock(&is->vidclk)獲取到的實際上是:從處理最后一幀開始到現在的時間加上最后一幀的pts,具體參考set_clock_at 和get_clock的代碼

get_clock(&is->vidclk) ==is->vidclk.pts, av_gettime_relative() / 1000000.0 -is->vidclk.last_updated? +is->vidclk.pts*/

/*driff實際上就是已經播放的最近一個視頻幀和音頻幀pts的差值+ 兩方系統的一個差值,用公式表達如下:

pre_video_pts: 最近的一個視頻幀的pts

video_system_time_diff: 記錄最近一個視頻pts 到現在的時間,即av_gettime_relative()/ 1000000.0 - is->vidclk.last_updated

pre_audio_pts: 音頻已經播放到的時間點,即已經播放的數據所代表的時間,通過已經播放的samples可以計算出已經播放的時間,在sdl_audio_callback中被設置

audio_system_time_diff: 同video_system_time_diff

最終視頻和音頻的diff可以用下面的公式表示:

diff = (pre_video_pts-pre_audio_pts) +(video_system_time_diff - ?audio_system_time_diff)

如果diff<0, 則說明視頻播放太慢了,如果diff>0,

則說明視頻播放太快,此時需要通過計算delay來調整視頻的播放速度如果

diffAV_SYNC_THRESHOLD_MAX 則不用調整delay?*/

diff =get_clock(&is->vidclk) - get_master_clock(is);

/* skip or repeatframe. We take into account the

delay to computethe threshold. I still don't know

if it is the bestguess */

sync_threshold=FFMAX(AV_SYNC_THRESHOLD_MIN,FFMIN(AV_SYNC_THRESHOLD_MAX,delay));

if (!isnan(diff)&& fabs(diff) < is->max_frame_duration) {

if (diff <=-sync_threshold)

delay =FFMAX(0, delay + diff);

else if (diff >= sync_threshold&& delay > AV_SYNC_FRAMEDUP_THRESHOLD)

delay = delay+ diff;

else if (diff>= sync_threshold)

delay = 2 *delay;

}

}

av_dlog(NULL, "video:delay=%0.3f A-V=%f\n",

delay, -diff);

return delay;

}

(c)看了以上的分析,是不是對于如何將視頻同步到音頻有了一個了解,那么音頻clock是在哪里設置的呢?繼續看代碼,sdl_audio_callback 分析

static void sdl_audio_callback(void *opaque, Uint8 *stream, int len)

{

VideoState *is = opaque;

int audio_size, len1;

/*當前系統時間*/

audio_callback_time =av_gettime_relative();

/*len為SDL中audio buffer的大小,單位是字節,該大小是我們在打開音頻設備時設置*/

while (len > 0) {

/*如果audiobuffer中的數據少于SDL需要的數據,則進行解碼*/

if(is->audio_buf_index >= is->audio_buf_size) {

audio_size = audio_decode_frame(is);

if (audio_size <0) {

/* if error,just output silence */

is->audio_buf????? =is->silence_buf;

is->audio_buf_size =sizeof(is->silence_buf) / is->audio_tgt.frame_size *is->audio_tgt.frame_size;

}

else

{

if(is->show_mode != SHOW_MODE_VIDEO)

update_sample_display(is, (int16_t *)is->audio_buf, audio_size);

is->audio_buf_size = audio_size;

}

is->audio_buf_index = 0;

}

/*判斷解碼后的數據是否滿足SDL需要*/

len1 =is->audio_buf_size - is->audio_buf_index;

if (len1 > len)

len1 = len;

memcpy(stream,(uint8_t *)is->audio_buf + is->audio_buf_index, len1);

len -= len1;

stream += len1;

is->audio_buf_index+= len1;

}

is->audio_write_buf_size = is->audio_buf_size -is->audio_buf_index;

/* Let's assume the audiodriver that is used by SDL has two periods. */

if(!isnan(is->audio_clock))

{

/*set_clock_at第二個參數是計算音頻已經播放的時間,相當于video中的上一幀的播放時間,如果不同過SDL,例如直接使用linux下的dsp設備進行播放,那么我們可以通 ? ? ? ? 過ioctl接口獲取到驅動的audiobuffer中還有多少數據沒播放,這樣,我們通過音頻的采樣率和位深,可以很精確的算出音頻播放到哪個點了,但是此處的計算方法有點讓人 ? ? ? ? 看不懂*/

set_clock_at(&is->audclk,is->audio_clock - (double)(2 * is->audio_hw_buf_size +is->audio_write_buf_size) / is->audio_tgt.bytes_per_sec,is->audio_clock_serial, ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?audio_callback_time / 1000000.0);

sync_clock_to_slave(&is->extclk, &is->audclk);

}

}

三、總結

音視頻同步,拿以音頻為基準為例,其實就是將視頻當前的播放時間和音頻當前的播放時間作比較,如果視頻播放過快,則通過加大延遲或者重復播放來使速度降下來,如果慢了,則通過減小延遲或者丟幀來追趕音頻播放的時間點,而且關鍵就在于音視頻時間的比較以及延遲的計算。

四、還存在的問題

關于sdl_audio_callback中 set_clock_at第二個參數的計算,為什么要那么做,還不是很明白,也有可能那只是一種假設的算法,只是經驗,并沒有什么為什么,但也有可能是其他,希望明白的人給解釋一下。大家互相學習,互相進步。

huzn

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,001評論 6 537
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,786評論 3 423
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,986評論 0 381
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,204評論 1 315
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,964評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,354評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,410評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,554評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,106評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,918評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,093評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,648評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,342評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,755評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,009評論 1 289
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,839評論 3 395
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,107評論 2 375

推薦閱讀更多精彩內容

  • 教程一:視頻截圖(Tutorial 01: Making Screencaps) 首先我們需要了解視頻文件的一些基...
    90后的思維閱讀 4,735評論 0 3
  • 在上一篇筆記中我們已經完成了使用SDL播放聲音和視頻,聲音播放沒有什么問題,而視頻播放太快,很明顯視頻沒有同步。在...
    762683ff5d3d閱讀 1,346評論 0 1
  • 本文轉自:[FFmpeg 入門(5):視頻同步 | www.samirchen.com][2] 視頻如何同步 在之...
    SamirChen閱讀 2,809評論 0 5
  • 根據ffmpeg官方網站上的例子程序開始學習ffmpeg和SDL編程。 SDL是一個跨平臺的多媒體開發包。適用于游...
    762683ff5d3d閱讀 1,824評論 0 2
  • 這是一個跨平臺的播放器ijkplayer,iOS上集成看【如何快速的開發一個完整的iOS直播app】(原理篇)。 ...
    FindCrt閱讀 7,107評論 2 46