第四章 特征檢測與匹配
特征檢測與匹配是諸多計算機視覺應用中的重要組成部分,目的是為了配準以建立復合圖像,或者建立密集對應集合從而生成三維模型或中間視圖。
有哪些特征?
為了在圖像之間建立對應,有點和塊特征(關鍵點特征又稱角點特征),邊緣特征,線段特征。
如何檢測?
第五章? 分割
圖像分割是為了尋找相互匹配的像素組,在統(tǒng)計學中被稱為聚類分析。
如何分割?
早期方法趨向于區(qū)域分裂與歸并,基于活動輪廓和水平集,均值移位(模態(tài)發(fā)現(xiàn)),規(guī)范圖割,二值馬爾可夫隨機場。
第六章 ? ? 基于特征的配準
審視幾何圖像的配準問題,目的是驗證匹配的特征是否在幾何上一致,方法是基于2D和3D的變換,應用是攝像機標定(姿態(tài)估計和攝像機內標定的計算)。
第七章 ? ? ? 由運動到結構
處理特征配準的逆問題,給出多幅圖像特征的稀疏集合,估計3D點的位置。結構就是3D幾何,運動就是攝像機的姿態(tài)。分為低層和高層結構的處理方法,低層即點結構,包括多臺攝像機,單臺攝像機,兩幀和多幀。高層即線和面結構。
第八章 ? ? ?? 稠密運動估計
為了實現(xiàn)圖像穩(wěn)定化,視頻序列中的圖像配準和運動估計算法廣泛運用于計算機視覺領域。對于配準,有圖像注冊算法,參數(shù)化運動估計方法。對于運動估計,有基于金字塔的由粗到精分層估計,使用傅里葉變換來加速計算。
第九章 ? ? ?? 圖像拼接
配準圖像并無縫拼合,如全景圖,最關鍵的貢獻是光束平差法,同時求解所有攝像機的位置坐標,從而得到滿足全局一致性的結果。如今的算法需要提取稀疏特征集,能夠滿足較強的魯棒性和較快的速度,并且能夠全自動的拼接圖象。
圖像拼接中,首先確定一副圖像中的像素坐標與另一副圖像之間的數(shù)學模型,其次,需要估計相關聯(lián)的圖像對之間的配準參數(shù),第四章有利于找到區(qū)分性特征,快速找到對應關系。
配準完成后,需要一個合成表面來卷繞已經配準的圖像,之后需要一些剪裁和修補,還有其他一些鏡頭畸變,場景運動造成的影響。應用是將多幅圖像拼接成寬視場場景圖。
第十章 計算攝影學
計算攝影學用于生成用普通攝像機無法拍攝的圖像,主要內容有光度學圖像標定,高動態(tài)范圍成像,改善圖像分辨率,分離和粘合,精細紋理生成(空洞填充),非真實感繪制(照片變油畫)。
第十一章 ?? 立體視覺對應
立體視覺匹配是通過尋找兩幅或多幅圖像間的匹配像素點,將它們從2D位置轉化為3D深度,從而估計出場景的3D模型。為了構建更為完整的3D模型,引入了深度圖的概念。涉及到應用立體視覺匹配來測量視差。
第十二章 ?? 3D重建
立體視覺僅是3D重建的視覺線索之一,還有其他關于由圖像推測形狀的線索。例如陰影和聚焦,將多個深度圖像融合為3D模型。表面上的陰影可以提供很多關于局部表面方向甚至整體表面形狀的信息。
第十三章 ? ? 基于圖像的繪制
基于圖像的繪制讓計算機能夠根據(jù)一個場景多個視角的圖像生成交互式的真實感體驗。采用的方法有視圖插值,層次深度圖像,光場與發(fā)光圖,環(huán)境影像形板,基于視頻的繪制。
第十四章 ? ? ? 識別
分析場景并識別場景中構成的物體而今看來依然是一個難題,識別很難,是因為場景中的物體之間常常出現(xiàn)不同的形態(tài),并且會相互遮擋。
識別的主要內容有物體檢測,人臉識別,示例識別。
最有挑戰(zhàn)性的問題是一般類別的識別,關鍵在于學習算法。
第十五章 ?? 總結
從圖像形成開始,看到了對圖像的預處理,去除噪聲和模糊,分割為區(qū)域和轉換為特征描述子,然后匹配和注冊更多圖像,將其結果用于運動估計,人體跟蹤,3D重建和圖像融合,也可分析圖像產生特定的語義描述。