One picture is worth more than thousand words
人類獲取的信息80%是通過視覺方式獲取的,而人類能看見的波段僅為可見光,而機器幾乎能對所有波段成像。
圖像處理源于:
1.改善圖像以便于人類更好理解
- 圖像復(fù)原
- 圖像增強
- 醫(yī)學(xué)圖像
- 空間圖像
- 處理圖像以便于存儲傳輸和機器感知
- 圖像壓縮
- 圖像識別
- 圖像理解
數(shù)字圖像處理基礎(chǔ)
圖像處理基礎(chǔ)內(nèi)容:
- 圖像獲取:通常包含尺度歸一化等預(yù)處理
- 圖像增強:丟失信息重現(xiàn)或強化感興趣信息,It looks better
- 圖像重建:客觀的目標(biāo),通常基于數(shù)學(xué)模型,包括后面介紹的三維重建
- 彩色圖像處理:Web上需求,基于顏色的檢索等
- 小波變換:圖像表示、圖像壓縮
- 圖像壓縮:減小存儲空間、降低傳輸壓力
- 形態(tài)學(xué)處理:形狀描述、簡單區(qū)域分割等
- 圖像分割:圖像分割成部件或目標(biāo),通常是識別和理解的基礎(chǔ)
- 圖像表示:便于圖像處理或識別或理解等
- 圖像識別和理解:包括后面介紹的視頻內(nèi)容識別和理解
圖像的概念:
-
圖像:f(x,y),x,y是空間坐標(biāo),f(x,y)是對應(yīng)位置的幅值
- 灰度圖像:每個位置是一個在某個范圍內(nèi)的灰度值
- 彩色圖像:每個位置通常有三個灰度值
- 二值圖像:每個位置可選值為0或1
采樣
均勻采樣和非均勻采樣
可以在細(xì)節(jié)區(qū)域采樣更加密集。
量化對圖像質(zhì)量影響
圖像質(zhì)量-層次
表示圖像實際擁有的灰度級數(shù)量,層數(shù)越多,視覺效果越好
圖像質(zhì)量-對比度
反應(yīng)圖像中灰度反差大小,最大亮度/最小亮度
等等
像素之間關(guān)系-近鄰
4近鄰:像素f(x,y)的4近鄰為
?f(x,y-1), f(x,y+1), f(x-1,y), f(x+1,y)
D近鄰:像素f(x,y)的D近鄰為
f(x-1,y-1), f(x-1,y+1), f(x+1,y-1), f(x+1,y+1)
8近鄰:4近鄰+D近鄰
像素之間關(guān)系-連通
連通是描述區(qū)域和邊界的重要概念
-
兩個像素連通的必要條件:
- 相鄰:對應(yīng)4連通、8連通和m連通
- 灰度值滿足特定條件
4連通:具有值V的像素p和q,如果q在p的4鄰域內(nèi),則稱p和q是4連通的。
8連通:具有值V的像素p和q,如果q在p的8鄰域內(nèi),則稱p和q是8連通的。
m連通:具有值V的像素p和q,如果q在p的4鄰域內(nèi),或q在p的D鄰域內(nèi)且p和q的4鄰域交集為空。
通路
一條從像素f(x,y)到像素f(s,t)的通路(x0,y0)(x1,y1),…,(xn,yn)滿足,(xi,yi)和(xi+1,yi+1)是相鄰的,其中(x,y)= (x0,y0)、(s,t)=(xn,yn)。N是路徑的長度。如果(x,y)= (s,t)則成為閉合通路。
距離
歐式距離、城市距離(D4距離)、棋盤距離(D8距離)