姓名:杜敏剛? ? ? 學號:17021211253
【嵌牛導讀】計算機視覺是使用計算機及相關設備對生物視覺的一種模擬。它的主要任務就是通過對采集的圖片或視頻進行處理以獲得相應場景的三維信息,就像人類和許多其他類生物每天所做的那樣。由于計算機視覺學在工農業生產、地質學、天文學、氣象學、醫學及軍事并學等領域有著極大的潛在應用價值,所以它在國際上越來越受人重視。本文簡要地介紹了計算機視覺學結構和研究內容,它同附近學科的關系,計算機視覺研究中面臨的技術難點以及計算機視覺學的歷史,現狀和研究動向。
【嵌牛鼻子】計算機視覺;圖像;應用
【嵌牛提問】什么是計算機視覺?計算機視覺技術有哪些應用?
【嵌牛正文】
1緒論
計算機視覺學是自二十世紀六十年代中期迅速發展起來的一門新學科。它是個邊緣學科,集眾家之所長,是個工程性很強的技術,主要需要有空間幾何、矩陣分析、光電技術、圖像處理、應用數學、離散數學及計算機技術等等各個方面的知識,才能正確的指導視覺系統的建模、解模及實際工程問題的解決方法。計算機視覺系統一般有光源、攝像機、采集卡及PC軟件系統等組成,可以完成圖像的采集與處理、目標的識別功能,視覺系統的結構一般是從系統的模型的角度理解的。
計算機視覺既是工程領域,也是科學領域中的一個富有挑戰性重要研究領域。計算機視覺是一門綜合性的學科,它已經吸引了來自各個學科的研究者參加到對它的研究之中。其中包括計算機科學和工程、信號處理、物理學、應用數學和統計學,神經生理學和認知科學等。
計算機視覺學所研究的對象,簡單地說就是研究如何讓計算機通過圖象傳感器或其它光傳感器來感知、分析和理解周圍環境。
人類感知外界環境主要通過視覺,聽覺和觸覺等四大感覺系統。其中視覺系統是最復雜的。人類從外界獲得的信息中視覺信號量最大。
模仿人類的視覺系統,計算機視覺系統中信息的處理和分析大致可以分成兩個階段:圖象處理階段又稱視覺處理中的低水平和中水平階段;圖象分析、理解階段又稱視覺處理中的高水平處理階段。
在圖象處理階段,計算機對圖象信息進行一系列的加工處理,這主要是:
1、校正成象過程中系統引進的光度學和幾何學的畸變,抑制和去除成象過程中引進的噪聲—統稱為圖象的恢復。
2、從圖象信息如亮度分布信息中提取諸如邊沿信息,深度信息圖象點沿軸方向的尺度,表面三維傾斜方向信息等反映客觀景物特征的信息。
3、根據抽取的特征信息把反映三維客體的各個圖象基元,如輪廓、線條、紋理、邊緣、邊界、物體的各個面等從圖象中分離出來,并且建立起各個基元之間的拓樸學上的和幾何學上的關系—稱之基元的分割和關系的確定。
在圖象分析和理解階段,計算機根據事先存貯在數據庫中的預知識模型,識別出各個基元或某些基元組合所代表的客觀世界中的某些實體稱之為模型匹配以及根據圖象中各基元之間的關系在預知識的指導下得出圖象所代表的實際景物的含義,得出圖象的解釋或描述。
必須強調,預知識在視覺系統中起著相當重要的作用。在預知識庫中存放著各種實際可能遇到的物體的知識模型,和實際景物中各種物體之間的約束關系。計算機的作用是根據被分析的圖象中的各基元及其關系,利用預知識作為指導,通過匹配,搜索和推理等手段,最終得到對圖象的描述。在整個過程中預知識時刻提供處理的樣板和證據。每一步的處理結果隨時同預知識進行對比。有時,處理的中間結果和最終結果還要饋送給預知識庫作為知識的更新和積累。
2圖像分割研究
圖像分割是圖像處理與機器視覺的基本問題之一。其要點是:把圖像劃分成若干互不交迭區域的集合。這些區域要么對當前的任務有意義,要么有助于說明它們與實際物體或物體的某些部分之間的對應關系。圖像分割的應用十分廣泛,幾乎出現在有關圖像處理的所有領域,并涉及各種類型的圖像。例如,在遙感應中,合成孔徑雷達圖像中目標的分割;遙感云圖中不同云系和背景分布的分割;在交通圖像分析中,把車輛目標從背景中分割出來。在這些應用中,分割通常是為了進一步對圖像進行分析、識別、壓縮編碼,分割的準確性直接影響后續任務的有效性。
一般來講,分割出的區域需同時滿足均勻性和連通性的條件。其中均勻性是指在該區域中的所有象素點都滿足基于灰度、紋理、彩色等特征的某種相似性準則;連通性是指在該區域內存在任意兩點的路徑。盡管圖像處理和機器視覺界的研究者們為此付出了長期的努力,符合以上兩點的通用性分割仍面臨著巨大的困難;大部分研究成果都是針對某一類型圖像、某一具體應用的分割。可以概括為以下內容。
2.1數據驅動的分割
常見的數據驅動分割包括基于邊緣檢測的分割、基于區域的分割、邊緣與區域相結合的分割等。對于基于邊緣檢測的分割,其基本思想是先檢測圖像中的邊緣點,再按一定策略連接成輪廓,從而構成分割區域。難點在于邊緣檢測時抗噪聲性能和檢測精度的矛盾,若提高檢測精度,則噪聲產生的偽邊緣會導致不合理的輪廓;若提高抗噪聲性能,則會產生輪廓漏檢和位置偏差。為此,人們提出各種多尺度邊緣檢測方法,根據實際問題設計多尺度邊緣信息的結合方案,以較好地兼顧抗噪聲性能和檢測精度。
基于區域的分割的基本思想是根據圖像數據的特征將圖像空間劃分成不同的區域。常用的特征包括:直接來自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。方法有閾值法、區域生長法、聚類法、松弛法等。
邊緣檢測能夠獲得灰度或彩色值的局部變化強度,區域分割能夠檢測特征的相似性與均勻性。將兩者結合起來,通過邊緣點的限制,避免區域的過分割;同時通過區域分割補充漏檢的邊緣,使輪廓更加完整。例如,先進行邊緣檢測與連接,再比較相鄰區域的特征(灰度均值、方差),若相近則合并;對原始圖像分別進行邊緣檢測和區域生長,獲得邊緣圖和區域片段圖后,再按一定的準則融合,得到最終分割結果。
2.2模型驅動的分割
常見的模型驅動分割包括基于動態輪廓(Snakes)模型、組合優化模型、目標幾何與統計模型。Snakes模型用于描述分割目標的動態輪廓。由于其能量函數采用積分運算,具有較好的抗噪聲性,對目標的局部模糊也不敏感,因而適用性很廣。但這種分割方法容易收斂到局部最優,因此要求初始輪廓應盡可能靠近真實輪廓。
近年來對通用分割方法的研究傾向于將分割看作一個組合優化問題,并采用一系列優化策略完成圖像分割任務。主要思路是在分割定義的約束條件之外,根據具體任務再定義一個優化目標函數,所求分割的解就是該目標函數在約束條件下的全局最優解。以組合優化的觀點處理分割問題,主要是利用一個目標函數綜合表示分割的各種要求和約束,將分割變為目標函數的優化求解。由于目標函數通常是一個多變量函數,可采用隨機優化方法。
基于目標幾何與統計模型的分割是將目標分割與識別集成在一起的方法,常稱作目標檢測或提取。基本思想是將有關目標的幾何與統計知識表示成模型,將分割與識別變為匹配或監督分類。常用的模型有模板、特征矢量模型、基于連接的模型等。這種分割方法能夠同時完成部分或全部識別任務,具有較高的效率。然而由于成像條件變化,實際圖像中的目標往往與模型有一定的區別,需要面對誤檢與漏檢的矛盾,匹配時的搜索步驟也頗為費時。
2.3圖像分割的半自動方法
從人工參與程度來看,圖像分割可分為人工、半自動、自動等三種類型。其中人工分割完全由操作者利用鼠標勾畫出分割區域的輪廓,費時費力,且容易受操作者主觀因素的影響,重復性差。自動分割不需人機交互,但適應性差,很難實現對一批圖像同時獲得滿意的分割效果。半自動分割將人機交互與自動分割相結合,能夠適應不同的圖像和需求,且有效降低計算復雜度。目前半自動分割中人機交互的方式有:勾畫目標的大致輪廓,構成自動分割的初始化;根據特定的圖像和任務調整算法參數;在分割過程中加入人工交互節等。總之,從實用化的角度看,自動分割仍是長期努力的方向。目前更為現實的是在自動分割前或分割過程中加入人機交互的半自動分割。其發展方向為盡可能少和簡便的人機交互。可見,圖像分割是圖像處理和機器視覺必不可少的重要環節,也是圖像理論發展的瓶頸之一。隨著計算機速度與容量的快速進展,圖像處理與機器視覺實用化系統碩果累累。例如,基于內容的圖像檢索系統、智能監視系統、視覺引導的智能交通系統、手寫體字符/人臉/指紋/虹膜識別系統等。然而有關的理論研究并沒有取得突破性進展。
3視覺技術的研究
人類很多研究都是以延伸人類能力為目的的,早期的工作是在體力上延伸,計算機發明以來,就拓展到對人類腦力和感知能力的延伸上。對人類視覺感知能力的計算機模擬導致了計算機視覺的產生。計算機視覺也經常被稱為圖像理解,是指研究完成一項任務所需的視覺信息及如何從圖像中獲取這些信息的研究領域。其基本目的有三個:
(1)根據一幅或多幅二維投影圖像計算出觀察點到目標物體的距離;
(2)根據一幅或多幅二維投影圖像計算出觀察點到目標物體的運動參數;
(3)根據一幅或多幅二維投影圖像計算出觀察點到目標物體的表面物理特性。要達到的最終目的是實現對于三維景物世界的理解,即實現人的視覺系統的某些功能。也就是利用二維投影圖像來重構三維物體的可視部分。
3.1計算機視覺研究的對象與方法
3.1.1以模型世界為主要對象的視覺基本方法研究
這個階段以Roberts的開創性工作為標志。在Roberts的工作中引入了三維物體與二維成像的關系,采用了一些簡單的邊緣特征提取方法并引入了組合線段的方法。這些早期的工作對視覺的發展起了促進作用,但對于稍微復雜的景物便難于奏效。
為他對三維關系的分析僅僅是靠簡單的邊緣線段的約束關系,并沒有充分考慮人類或其他動物視覺系統感知三維空間關系的方式。
3.1.2以計算理論為核心的視覺模型研究
20世紀70年代開始,對計算機視覺的研究進入更為理性化的階段,主要集中于各種本征特性的恢復,包括三維形狀、運動、光源等的恢復。主要出發點是從生理學、光學和射影幾何的方法出發,研究成像及其逆問題。在這一階段中,以Marr為代表的一些研究者提出了以表示為核心、以算法為中間轉換過程的一般性視覺處理模型。在其理論中強調表示的重要性以及從不同層次上去研究信息處理問題,在計算理論和算法實現上又特別強調計算理論的重要性。在三維信息的感知方面,根據人類感知深度的不同提出了一系列ShapefromX的方法。
3.2計算機視覺的應用領域
計算機視覺的應用領域主要包括對照片、視頻資料如航空照片、衛星照片、視頻片段等的解釋、精確制導、移動機器人視覺導航、醫學輔助診斷、工業機器人的手眼系統、地圖繪制、物體三維形狀分析與識別及智能人機接口等。
早期進行數字圖像處理的目的之一就是要通過采用數字技術提高照片的質量,輔助進行航空照片和衛星照片的讀取判別與分類。由于需要判讀的照片數量很多,于是希望有自動的視覺系統進行判讀解釋,在這樣的背景下,產生了許多航空照片和衛星照片判讀系統與方法。自動判讀的進一步應用就是直接確定目標的性質,進行實時的自動分類,并與制導系統相結合。目前常用的制導方式包括激光制導、電視制導和圖像制導,在導彈系統中常常將慣性制導與圖像制導結合,利用圖像進行精確的末制導。
工業機器人的手眼系統是計算機視覺應用最為成功的領域之一,由于工業現場的諸多因素,如光照條件、成像方向均是可控的,因此使得問題大為簡化,有利于構成實際的系統。與工業機器人不同,對于移動機器人而言,由于它具有行為能力,于是就必須解決行為規劃問題,即是對環境的了解。隨著移動式機器人的發展,越來越多地要求提供視覺能力,包括道路跟蹤、回避障礙、特定目標識別等。目前移動機器人視覺系統研究仍處于實驗階段,大多采用遙控和遠視方法。
在醫學上采用的圖像處理技術大致包括壓縮、存儲、傳輸和自動/輔助分類判讀,此外還可用于醫生的輔助訓練手段。與計算機視覺相關的工作包括分類、判讀和快速三維結構的重建等方面。長期以來,地圖繪制是一件耗費人力、物力和時間的工作。以往的做法是人工測量,現在更多的是利用航測加上立體視覺中恢復三維形狀的方法繪制地圖,大大提高了地圖繪制的效率。同時,通用物體三維形狀分析與識別一直是計算機視覺的重要研究目標,并在景物的特征提取、表示、知識的存儲、檢索以及匹配識別等方面都取得了一定的進展,構成了一些用于三維景物分析的系統。
近年來,基于生物特征(biometrics)的鑒別技術得到了廣泛重視,主要集中在對人臉、虹膜、指紋、聲音等特征上,這其中大多都與視覺信息有關。與生物特征識別密切相關的另一個重要應用是用于構成智能人機接口。現在計算機與人的交流還是機械式的,計算機無法識別用戶的真實身份,除鍵盤、鼠標外,其他輸入手段還不成熟。利用計算機視覺技術可以使計算機檢測到用戶是否存在、鑒別用戶身份、識別用戶的體勢(如點頭、搖頭)。此外,這種人機交互方式還可推廣到一切需要人機交互的場合,如入口安全控制、過境人員的驗放等。
4對計算機視覺研究的認識
計算機視覺研究經歷了近40年的過程,仍面臨許多問題。主要由于這一方向是多學科的交叉與結合,同時視覺是一個涉及生理、心理的復雜過程,不僅與眼睛有關,還和大腦的推理、學習有關。研究計算機視覺的目的是要實現對人類視覺的模擬和延伸。對于人類而言,視覺是一個輕而易舉的功能,對機器卻不同。視覺過程很難用類似于問題求解的方法符號化。隨著計算機科學領域中對定量研究的重視,這種狀況會得到改善。在計算機視覺的研究過程中,應考慮將功能模擬與認知模擬相結合。人類延伸其他能力的過程中,功能模擬起到了主要作用,但視覺是涉及心理和生理兩方面的過程,因此必須在功能模擬的同時重視認知模擬。
計算理論的進步與感知手段的改進有助于計算機視覺的研究。在計算機視覺中計算理論占有十分重要的地位,計算理論的進步,新的計算模型的提出可以解決以往一些困難的問題;另一方面,感知手段的進步也可以起到同樣的作用。采用主動視覺可從另一個側面去處理面對的視覺問題。要實現完整的視覺系統,視覺知識的獲取、管理和利用是必不可少的。一個相對完備的視覺系統同時也是一個知識管理系統,在視覺過程中對一幅圖像的理解需要大量的關于任務領域的知識,這些知識不同于問題求解中的知識可以明確的顯性表示,而且人類獲取信息的80%是通過視覺得到的,因而這些知識涉及面之廣難以預測,因此視覺系統中的知識管理是一個重要問題。
從以往的研究看,過去的幾十年雖然提出、解決了一些問題,但是由于視覺問題的特殊性和復雜性,還有大量的問題需要研究。研究的重點包括對新方法、新手段的探索。當然,在原有問題上采用新的描述方法、求解手段也是一個可能的突破點。在視覺領域中多數的問題不是問題本身正確與否,而是描述是否恰當以及求解是否有效的問題,因而描述方式、求解手段的探索是十分重要的。總之,隨著對定量研究的重視,新的描述方式、求解手段的研究,以及感知手段的改進,計算機視覺的研究必將迎來一個更加繁榮的時代。
參考文獻:
[1]陳熙霖.計算機視覺:算法與系統原理,清華大學出版社,2000
[2]高滿屯.計算機視覺研究中的投影理論和方法,西北工業大學出版社,1998
[3]馬頌德,張正友.計算機視覺—計算理論與算法基礎,科學出版社,1998
[4]章毓晉.圖像工程下-圖像理解與計算機視覺,清華大學出版社,2000
[5] (美)福賽思.計算機視覺:一種現代方法,電子工業出版社,2004