Tutorial - 1
-
(a) 為什么e時代需要生物特征識別
我們在信息時代面臨諸多問題,如病毒、黑客、計算機盜竊、越權(quán)存取等,它們無一不威脅著公司和個體。而通過生物特征識別可以有效地解決一些用戶安全與身份安全的問題。
(b) 何謂生物特征識別
生物特征識別是指利用人體生物特征進行身份認(rèn)證的一種技術(shù)。具體而言,就是通過計算機與光學(xué)、聲學(xué)、生物傳感器和生物統(tǒng)計學(xué)原理等高科技手段密切結(jié)合,利用人體固有的生理特性和行為特征來進行個人身份的鑒定。
(c) 理解生物特征識別的類型并舉例
生物特征識別的兩種類型:基于生理特征的識別和基于行為特征的識別。第一種如臉型識別、虹膜識別、指紋識別等,而第二種如語音識別、簽名識別、敲鍵盤識別、步態(tài)識別等。
(d) 給出定義
注冊:獲取用戶生物特征信息,并加以評估、處理及存儲為生物特征識別系統(tǒng)中的數(shù)據(jù)以便后續(xù)利用的過程;
(The process by which a user’s biometric data is initially acquired, assessed, processed and stored in the form of a template for ongoing use in a biometric system )數(shù)據(jù):一種對個體生物特征圖像或生物特征指標(biāo)的典型值的數(shù)學(xué)表示;(A mathematical representation of biometric data Skeletonized features of a detailed imageand typical valuesof biometric indicators of an individual. )
匹配:以兩個數(shù)據(jù)間的匹配度為標(biāo)準(zhǔn)判別其是否屬于同一類別的過程;
(e) 對用于驗證身份的生物特征有何要求
① 普遍性;② 唯一性; ③ 表現(xiàn)穩(wěn)定; ④ 可收集性;⑤ 其他(準(zhǔn)確性,處理速度,存儲大小,系統(tǒng)運營費用,收集的便利性)
(f) identification和verification的區(qū)別
前者是一對多,后者是一對一。也就是說,前者需要在生物特征識別系統(tǒng)中搜索與當(dāng)前用戶一致的信息,而后者只需驗證當(dāng)前用戶與其宣稱的個人身份是否有一致性。
-
生物特征識別系統(tǒng)的組成及例子
傳感器,特征提取器,分類器,判別器;
傳感器,預(yù)處理器,特征提取器,特征向量生成器,匹配器,數(shù)據(jù)存儲器,判別器;
例子略;
-
對比注冊模式和驗證模式
① 注冊模式是通過傳感器收集用戶信息,再對該信息進行預(yù)處理,而后提取特征,生成特征向量并存儲于系統(tǒng)數(shù)據(jù)庫中以待之后作為樣本利用。
② 驗證模式前半部分與注冊模式類同,也需要由傳感器收集信息再處理為特征向量。而下一步則是將該臨時特征向量與數(shù)據(jù)庫中的對應(yīng)特征向量進行匹配,根據(jù)門值做出判斷。
-
給出定義
① FRR: false rejection rate 對的人進不來 $FRR=\frac{tatal\ false \ rejection} {total\ true\ attempts} $
② FAR: false acceptence rate 錯的人進來 $FAR=\frac{tatal\ false \ acceptence} {total\ false\ attempts} $
③ EER: equal error rate 在靈敏度變化下FRR=FAR的那一點的概率值
④ Crossover: $\frac{1}{x}$ ( x=round($\frac{1}{EER}$) )
⑤ FTE:failure to enroll 無法注冊的概率
⑥ ATV: ability to verify $ATV=(1-FTE)*(1-FRR)$
⑦ ROC: receiver operating characteristic (一個集合FRR和FAR的圖像)
計算略
計算略
Tutorial - 2
-
(a)給出定義或解釋
① pixel 像素,即基本原色素及其灰度的基本編碼,是構(gòu)成一張圖像的基本單元
② image 圖像- An image is an artifact that depicts visual perception, for example, a photo or a two-picture, that has a similar appearance to —usually a physical object person, thus providing a depiction of it.
③ image resolution 圖像分辨率,即每英寸圖像內(nèi)有多少個像素點,單位為PPI (Pixels Per Inch)
④gray-level image 灰度圖,即把RGB統(tǒng)一用grey替換,再把白色和黑色之間按對數(shù)關(guān)系分為若干等級(256階)。
(b) 給出解釋并比較兩種類型的直方圖
① 圖像直方圖是用以量化曝光量的柱狀圖(二維坐標(biāo)圖),橫軸表示亮度,縱軸表示處于該亮度范圍的像素之相對數(shù)量。(0是黑1/255是白)
? ② 峰值就是灰度值聚集的部分,平滑處就是灰度值分布廣而數(shù)量少的部分。
? ③ 區(qū)別黑底白字和白底黑字略。
(c) 理解點處理并比較增強手段
點處理的目標(biāo)是為了實現(xiàn)二值分類,為此有三種基本方式來增強圖像。可以理解為對圖像每一個像素進行處理的函數(shù),記為$output=T(input)$。
? ① 對比增強
? 線性:使灰度更為緊湊可提高對比度 _/$^- $;
? 冪函數(shù):Power Law Function;
? 注:α<1:arrow_heading_up: 增強亮部,α>1則增強暗部
? ② 亮度增強——y=x函數(shù)平移
? 注:向上是增白,向下是暗化;
? ③ 均衡化——層次化
? 注:線性化概率
(d)為何要進行鄰域處理?給出鄰域處理的應(yīng)用
處理鄰近信息可以保持圖像特征內(nèi)在的一些聯(lián)系;鄰域操作可以去噪,增強邊界以及放大。
-
理解
Power Law Function是一個對圖像直方圖進行對比度處理的冪函數(shù)(非線性函數(shù))。對于參數(shù)γ,其值小于1時,圖像亮部增強;其值大于1時,圖像暗部增強。LUT即look-up table,將0~1(step=0.1)的對應(yīng)值寫出即可。
卷積計算略;
卷積計算略;
-
對比
① 高通濾波器是銳化圖像,均勻取均值(0)
② 低通濾波器是平滑化圖像,均勻取均值(1)
③ 邊界增強過濾器
? Soble 垂直/水平方向一正一負(0)
? Shift and Difference 垂直/水平/對角取一個(0)
? Laplacian 環(huán)繞均勻正負(0)
④0-和過濾器是增強邊界,1-和過濾器是模糊化(邊界增強)
理解——0和:差不多的區(qū)域抹0,有特殊邊界的保持,因此邊界增強。1和:全部抹在一起,模糊。
Tutorial - 3
-
(a)定義pattern并舉例子
形式就是指一個客觀存在事件或物品的表現(xiàn)形式,特別的,在生物特征識別中,可以用向量或矩陣來表示作為度量和觀察量的形式。日常中的形式諸如云朵的形狀,動物的斑紋,瓷器的花紋,波形圖,樂譜,化學(xué)式,腳印等等。
? (b)對模式識別舉例
模式識別的例子諸如車牌識別,以車牌號作為特征;簽名識別,以標(biāo)準(zhǔn)簽名作為特征;人臉識別,以平均臉等作為特征。
? (c)PR系統(tǒng)的組成
The design of aPR system essentially involves the following three aspects : 1) dataacquisition and preprocessing; 2) data representation; 3) decision making.
Sensor(CapturingData)Image & Signal Processing(Extracting Feature)PatternRecognition(Comparing the features)Decision Theory(Making the decision)
? (d)定義
Classification: 分門別類,將輸入數(shù)據(jù)分類至給定集合中;
Recognition: 分類的能力;
c: 把數(shù)據(jù)分為c種特定類型;
c+1: 在特定類型的基礎(chǔ)上附加“無法確定”類型;
以上兩者需要的類型數(shù)有區(qū)別是因為分類的均為有效數(shù)據(jù),都適得其所,而辨別則是面向所有數(shù)據(jù),有可能越界。
Description: Description is an alternative to classification where a structural description of the input pattern is desired. It is common to resort to linguistic or structural models in description.
Pattern Class: 模式的集合;
Preprocessing: 對原始數(shù)據(jù)轉(zhuǎn)換為易計算、易提取特征且噪音小的數(shù)據(jù)的處理;
? (e) What is correlation between two vectors, x and y? (Maximum when x and y point in the same direction). Please use this definition in the function $||x-m_k||$.How about orthogonal or uncorrelated between two vectors?
? Maximum correlationand minimum error.
? (f)何謂決策方程
? 決策方程指各類之間兩兩的分界集合,它可以有效地將所給數(shù)據(jù)歸類。
-
課堂3D物品特征
邊界,對稱性,對稱軸;
A minimum-error classifier based on $|| x - m_k ||$ is defined. How to get a linear discriminant function,$ g(x) = m_k^Tx - 0.5 || m_k ||^2$? Which difference between the following two classifiersusing the approaches mentioned above.
前者距離越小越好,后者函數(shù)和越大越好(在歐氏距離意義下是一樣的)
-
計算略;
注意maximum correlation approach就是算$\frac{一樣的}{所有的}$ ,minimum error approach是算1減去它;
Tutorial - 4
-
(a) **What is the scatter matrix? Understand what about eigenvector and eigenvalue as well as their functions? **
散布矩陣是用來估計多維正態(tài)分布協(xié)方差的統(tǒng)計量。PCA的目的就是把現(xiàn)有數(shù)據(jù)降維,找到一組能夠極大程度保留特征信息的特征向量作為子空間的基表示出原數(shù)據(jù)。因此,計算協(xié)方差矩陣的特征向量和特征值便可以篩選出最具有代表性的特征向量組成理想的降維變換矩陣。
(b) 理解“特征臉“
特征臉“實際上就是一個對于訓(xùn)練數(shù)據(jù)構(gòu)成的協(xié)方差矩陣之特征向量。
(c) 為何使用人工神經(jīng)網(wǎng)絡(luò),人工神經(jīng)網(wǎng)絡(luò)和生物神經(jīng)網(wǎng)絡(luò)有何聯(lián)系
? ① ANN對于特征和結(jié)構(gòu)不明確的生物特征識別有良好的效果,它可以通過定義分層、分類樹的方法來找到訓(xùn)練樣本間的內(nèi)在聯(lián)系。
? ② 電信號(數(shù)據(jù))——感受器;分類器——神經(jīng)元;權(quán)值——突觸;偏置——閾值;激活函數(shù)——細胞體;
(d) 解釋如何給人工神經(jīng)網(wǎng)絡(luò)設(shè)置權(quán)值
通過后饋處理修改權(quán)值。具體而言,先有一個初始權(quán)值,通過處理元件得到一個輸出,將輸出與期望進行比較,若不達到期望的要求,則反復(fù)調(diào)整輸入權(quán)值使輸出向期望靠近,知道通過ANN得到的輸出滿足輸出期望為止。
-
Consider the sentence: ‘The powerful computer could do many things for us.’ produced by using your sequence of ‘rewriting’ rules.
<artical> <adjective><noun><modal verb><verb><adjective><noun><preposition><pronoun>
-
為何能以BP算法作為學(xué)習(xí)方式?它的主要思想是什么?
① 后饋處理能夠?qū)τ谟?xùn)練數(shù)據(jù)及時地調(diào)整隱藏層中的權(quán)值,在這種修改中,能夠抓取到最重要的特征,且分層明朗,從而提高深度學(xué)習(xí)的精度。
② i. 前饋處理:運算得到輸出結(jié)果;
? ii. 訓(xùn)練過程(計算且后饋相關(guān)錯誤):計算對應(yīng)層次的錯誤程度;
? iii.調(diào)整權(quán)重;修改偏差最大的位置的權(quán)重; -
用人工神經(jīng)網(wǎng)絡(luò)設(shè)計異或門
一個隱藏層,四個神經(jīng)元,輸入層兩個神經(jīng)元,輸出層一個神經(jīng)元。建議畫圖表示。
理解PCA
將原始數(shù)據(jù)按列組成一個$m*n$矩陣X;
將X的每一行(代表一個屬性字段(feature))進行0均值化(減去均值);
求出協(xié)方差矩陣C,$C=\frac{1}{m}XX^\mathsf{T}$
求出C的特征值及對應(yīng)的特征向量;
將特征向量按對應(yīng)特征值大小從上到下按行排列成矩陣,取前k行組成矩陣P;
Y=PX即為降維到k維后的數(shù)據(jù);
- $r_{λ}$ 問題,略;主要思想是盡可能選取特征值大的特征向量。
Tutorial - 5
-
(a)理解LDA相關(guān)內(nèi)容
? 第一步,計算散布矩陣$S_w$和類內(nèi)散布矩陣$S_b$;
? 第二步,計算$S_w^{-1}S_b$的特征值;
? $S_w$和$S_b$的區(qū)別在于后者是前者在某一空間上的投影,信息缺失,但類別關(guān)系保留。
// LDA要分別計算類內(nèi)協(xié)方差矩陣和類間協(xié)方差矩陣,并把類內(nèi)協(xié)方差矩陣的轉(zhuǎn)置和類間協(xié)方差矩陣的乘積作為LDA變換的矩陣。
? 類內(nèi)協(xié)方差矩陣即把所有樣本中各個樣本根據(jù)自己所屬的類計算出樣本與總體的協(xié)方差矩陣的總和,這從宏觀上描述了所有類和總體之間的離散冗余程度。同理可以的得出類間協(xié)方差矩陣中為分類內(nèi)各個樣本和所屬類之間的協(xié)方差矩陣之和,它所刻畫的是從總體來看類內(nèi)各個樣本與類之間(這里所刻畫的類特性是由是類內(nèi)各個樣本的平均值矩陣構(gòu)成)離散度。(b) 為何使用2dPCA?有何優(yōu)勢?
2dPCA可以保留圖像鄰域之間隱含的關(guān)系和內(nèi)在結(jié)構(gòu),且縮小協(xié)方差矩陣的規(guī)模。因而識別準(zhǔn)確率比較高,計算復(fù)雜度小一些(盡管特征的維度比較大,但其協(xié)方差矩陣非常小,適合計算特征值特征向量)。PCA直接用的協(xié)方差矩陣作為它的變換矩陣,而LDA使用類內(nèi)協(xié)方差矩陣的轉(zhuǎn)置和類間協(xié)方差矩陣的乘積作為LDA變換的矩陣。
(c) 比較PCA和LDA
PCA和LDA都是用于降維,但是側(cè)重點不一樣。PCA是無監(jiān)督的方式,降維程度人為決定;而LDA是有監(jiān)督的方式,它能夠找到線性判別函數(shù)來對數(shù)據(jù)進行有效分類,它的降維程度是數(shù)據(jù)自身內(nèi)在結(jié)構(gòu)決定的。
(d) 為何利用頻率分布圖分析?時空分布圖和頻率分布圖有何區(qū)別?
因為頻率分布圖保留了另一形式的圖像信息,對提取特定的特征有一定作用。時空分布圖和頻率分布圖的最大區(qū)別是橫縱軸表示意義不一樣,前者橫軸為時間/空間,縱軸為數(shù)值(像素值);而后者橫軸為頻率,縱軸為波峰值(像素值)//在二維情況下,頻域是有傅立葉變換值及其頻率變量定義的空間。在一些情況下,頻域圖像相對簡化清晰有效,例如在處理正弦波圖像時,頻域就更加緊湊和有用。
(e) 理解兩種頻率變化
傅里葉變換和Gabor變換都是可逆的變換,將圖像轉(zhuǎn)移到另一度量上提取特征。前者關(guān)注圖像的灰度頻率分布這一整體情況,后者關(guān)注圖像的邊緣、紋理等。//傅立葉變換表明一切周期函數(shù)都能分解成三角級數(shù),在頻域圖中畫出相應(yīng)的振幅及(因為是二維,就有)振動的方向(與原圖像中的線段垂直)
-
比較三種模式識別方法
統(tǒng)計模式識別是在對象的特征明確這一情況下廣為采用,它的基礎(chǔ)是規(guī)定好的類或概率(密度)函數(shù),應(yīng)用如指紋識別、虹膜識別等,而句法模式識別是在對象的結(jié)構(gòu)關(guān)系比較明晰的情況下使用,基礎(chǔ)是定義好的模式層級結(jié)構(gòu),應(yīng)用如文本分析等。神經(jīng)網(wǎng)絡(luò)模式識別則是上述特征與結(jié)構(gòu)均不明確時,利用大量數(shù)據(jù)訓(xùn)練PR目標(biāo)函數(shù),應(yīng)用如自然語言處理、人臉識別。
-
**There are two spaces, Measurement Space and Decision Space. Pattern classification is defined to map measurement features to one of the classes. Could you design a simple classifier to implement the given function? **
?
-
**Try to analysis the character “H” by statistical PR approach and structural PR approach. **
StatPR approach - the feature set: (intersections, -, |, holes) and x=[2,1,4,0]; SyntPR approach - primitives and relations: ).
-
用頻率變換實現(xiàn)一個圖像處理和模式識別方面的應(yīng)用
銳化(提取邊界);模糊化(提取主顏色信息);
-
從二維傅里葉變換中我們可以得到什么結(jié)果
從2dFT可以獲知各個特定方向的頻率分布,低通模糊,高通銳化,提取線特征;
Tutorial - 6
-
(a) 理解指紋識別的注冊和驗證階段
注冊:將個人指紋信息錄入系統(tǒng)。錄入的過程包括傳感器采集、特征提取、儲存等;
驗證:采集指紋,提取特征并與系統(tǒng)內(nèi)樣本比對;
(b) 預(yù)處理階段需要做什么
預(yù)處理階段應(yīng)提高圖像質(zhì)量(降噪等),并處理成便于特征提取的形式(增強邊緣等),二值化,單像素化(變細);
(c)比較油墨指紋和在線指紋及各種在線掃描指紋方式
油墨指紋一般是用于犯罪偵破,簽訂合同等情形,為生物特征識別系統(tǒng)提供的是圖像信息(且一般質(zhì)量不好);而在線指紋是通過傳感器收集指紋信息而得的。傳感器有多種,如CCD傳感器(光學(xué)傳感器,通過打燈于指紋上并獲取反射光速而成像),VLSI傳感器(通過密集的傳感器收集手指凹凸紋路信息集合而得指紋信息)等。
在線掃描指紋技術(shù)也有多種——光學(xué)技術(shù):用黑白灰區(qū)分手指凸起和凹陷部分,圖像分辨率高,便宜,防靜電,玻璃面持久,但對占地面積大,易偽造;芯片技術(shù):以芯片作為按壓平面,分辨率挺高,尺寸小,成本低,但持久性不好,容易被損壞,暫時未知對惡劣情況的表現(xiàn);超聲波技術(shù):發(fā)出超聲波并偵測最短獲取回音時間從而計算手指的凹凸信息以及邊界信息,圖像質(zhì)量高,不怕手指臟,但機器體型大。
(d) 理解“特征”的含義
? 特征就是指在一個群體中具有普遍性但隨個體變化有所差異的量。比如指紋可視為人的特征,語言可作為一個族群的特征等。
? 模式區(qū)(Pattern Area)模式區(qū)是指指紋上包括了總體特征的區(qū)域,即從模式區(qū)就能夠分辨出指紋是屬于那一種類型的。有的指紋識別算法只使用模式區(qū)的數(shù)據(jù)。 Aetex 的指紋識別算法使用了所取得的完整指紋而不僅僅是模式區(qū)進行分析和識別。
? 核心點(Core Point)核心點位于指紋紋路的漸進中心,它用于讀取指紋和比對指紋時的參考點。
? 三角點(Delta)三角點位于從核心點開始的第一個分叉點或者斷點、或者兩條紋路會聚處、孤立點、折轉(zhuǎn)處,或者指向這些奇異點。三角點提供了指紋紋路的計數(shù)和跟蹤的開始之處。
? 式樣線(Type Lines)式樣線是在指包圍模式區(qū)的紋路線開始平行的地方所出現(xiàn)的交叉紋路,式樣線通常很短就中斷了,但它的外側(cè)線開始連續(xù)延伸。
? 紋數(shù)(Ridge Count)指模式區(qū)內(nèi)指紋紋路的數(shù)量。在計算指紋的紋數(shù)時,一般先在連接核心點和三角點,這條連線與指紋紋路相交的數(shù)量即可認(rèn)為是指紋的紋數(shù)。
? 弓形:無中心點和三角點(一般情況,有特例)
? 箕形:分成左箕和右箕,一個中心點和一個三角點
? 斗形:圓圈,一般是一個中心點和兩個三角點,有可能是兩個中心點(e) **How many strategies can be used for fingerprintmatching? Please compare their difference. ** P54 Lecture7
匹配方式 ① 細節(jié)點匹配 ② 直接匹配 /*① 基于圖像:最優(yōu)化圖像關(guān)系再匹配,將相關(guān)度系數(shù)作為給分標(biāo)準(zhǔn); ② 基于指紋脊:邊界部分匹配; ③ 基于特征點:位置匹配;*/
匹配策略 ① $S=\frac{100M_{PQ}M_{PQ}}{M_PM_Q}$ total
? ② $S_B=\frac{{100M_{PQ}}^2}{M_{PB}M_{QB}}$ bounding box
-
如何確定奇點?
奇點即方向圖臨近色塊變化最多的點。二者都是給方向編碼后提取得到的。需要注意的是,中心點和三角點的區(qū)別在于,前者周圍的方向有重復(fù),后者基本沒有重復(fù)。
辨別six major classes of overall fingerprint patterns
香港同學(xué)說是弓 凸弓 左箕 右箕 斗 雙斗........
-
分別指出指紋的整體特征和局部特征
整體特征:
? 模式區(qū)域,奇點(中心點與三角點),特征線,邊界數(shù)目,三個重要手指脊類型;pattern area,core point,type lines,delta,ridge count,basic ridge patterns(loop,arch,whirl) ;
局部特征:
? 終結(jié)點(Ending) -- 一條紋路在此終結(jié)。
? 分叉點(Bifurcation) -- 一條紋路在此分開成為兩條或更多的紋路。
? 分歧點(Ridge Divergence) -- 兩條平行的紋路在此分開。
? 孤立點(Dot or Island) -- 一條特別短的紋路,以至于成為一點 。
? 環(huán)點(Enclosure) -- 一條紋路分開成為兩條之后,立即有合并成為一條,這樣形成的一個小環(huán)稱為環(huán)點 。
? 短紋(Short Ridge) -- 一端較短但不至于成為一點的紋路。 -
略;
① $S=\frac{100M_{PQ}M_{PQ}}{M_PM_Q}$ total
② $S_B=\frac{{100M_{PQ}}^2}{M_{PB}M_{QB}}$ bounding box
Tutorial - 7
-
(a)理解臉部識別系統(tǒng)
面部識別系統(tǒng)分為兩個類型,一是驗證身份,二是身份匹配。基本流程都是先通過攝像技術(shù)獲取面部圖像信息,再調(diào)整圖像(偵測臉部并切割,格式正規(guī)化,接著對圖像進行進一步的特征提取(方法有PCA特征降維編碼,基于眼睛鼻子嘴的幾何特征提取,深度面部特征提取如眼寬度,下巴,頰骨等,抗扭曲模型,神經(jīng)網(wǎng)絡(luò)歸類,臉表面構(gòu)建)然后匹配身份,得到分?jǐn)?shù)作出判斷。
(b)指出臉部特征識別的問題
? ① 相機角度/姿勢——基于多圖像的方法/光照——利用光照錐/位置/移動等圖像信息的缺陷;
? ② 年齡/化妝/佩飾/遮蓋;
? ③ 表情——彈性圖匹配;
? ④ 尺寸要求/分辨率要求/高精度要求;
? 解決方案是建立匹配模型,考察可能發(fā)生的儀容變化;
(c) 臉部識別步驟
三步驟:臉部偵測,臉部正規(guī)化(調(diào)整各種因素如光照,角度等)和臉部匹配(特征提取和面部識別);
(d) 比較臉部偵測的方法
? 統(tǒng)計:子空間方法+神經(jīng)網(wǎng)絡(luò)方法;
? 基于知識:灰度分布圖分析+輪廓規(guī)劃+色彩信息+運動信息+對稱信息;
? 對比略;
- Subspace method:基于PCA(K-L變換)
- NN method:基于ANN,分成面部類和非面部類的分類問題。往往與其他方法相結(jié)合,缺點是many kinds of non-face images which are not collected. Slow -lots of specimens or input nodes
- Distribution ruler of gray-value-based: skin pattern recognition
- Contour ruler:通過臉部輪廓尋找臉,輪廓是臉的一個重要特征(snake technique)
- Color information: 臉部顏色往往與周圍環(huán)境顏色不同,且不同臉間的顏色是相似的(同種人)
- Movement information:人的移動和背景產(chǎn)生差別
- Symmetry information: 人的臉是基本對稱的
(e)臉部特征識別的優(yōu)缺點
? 優(yōu)點:硬件便宜,軟件簡便;不需要用戶配合;可執(zhí)行數(shù)據(jù)范圍廣;
? 缺點:防偽能力不高,唯一性也不高,長相相似的人(如雙胞胎)難以區(qū)分,采集環(huán)境和生理特征的變化會降低匹配度,在注冊和識別上有潛在的濫用。 -
對比特征臉?biāo)惴ê吞卣髂樧R別算法
特征臉?biāo)惴ㄊ侵冈诖罅磕槻繑?shù)據(jù)訓(xùn)練下得到特征矩陣實現(xiàn)臉部特征降維提取,而特征臉識別算法則是基于特征臉?biāo)惴▽D像進行處理評價相近程度,主要判斷是不是臉。
略;(查表知7;觀測圖像知9;)
-
定義幾何特征并回答具體問題
臉部特征通常利用眼睛、鼻子、嘴巴、下巴的形狀和大小,以及雙眼雙耳雙眉的距離等等。
Lecture - 8
-
(a) 比較視網(wǎng)膜特征識別和虹膜特征識別
視網(wǎng)膜特征識別技術(shù)是基于視網(wǎng)膜的血管信息(紋路,粗細)與視神經(jīng)盤相關(guān)信息以及病變信息來提取特征進行鑒別;而虹膜特征識別技術(shù)是基于人眼虹膜的。視網(wǎng)膜特征識別被認(rèn)為是當(dāng)今準(zhǔn)確性最高的生物特征識別技術(shù),然而其高昂的設(shè)備費用和用戶不友好的圖像獲取方式(強光照射人眼)以及難以處理的統(tǒng)計問題(定位難,眼睛小,光路扭曲)使其并沒有得到廣泛的應(yīng)用。虹膜特征識別也有非常高的準(zhǔn)確性與唯一性,但對深色虹膜的提取度不夠且用戶接受度不高。它的設(shè)備不方便,受光照影響,可能被偽造。
(b)理解視網(wǎng)膜生物特征識別系統(tǒng),并區(qū)分那倆
視網(wǎng)膜生物特征識別系統(tǒng):獲取圖像信息(強光照射獲得光學(xué)圖像)→預(yù)處理(定位視神經(jīng)盤→提取血管粗細和方向信息)→模式匹配;identify多中找一,authenticate驗證。
(c)給出一個Verification的例子
門禁系統(tǒng)需要刷卡加虹膜掃描——LG Iris Access:tm:2200;
(d) 理解虹膜識別系統(tǒng)
(1)用相機拍照進行圖像獲取。
(2)通過預(yù)處理提高圖像質(zhì)量。
(3)定位虹膜位置。
(4)將虹膜圖像標(biāo)準(zhǔn)化。
(5)gabor filter進行處理分析
(6)得到512-bytes iris code的虹膜的模式特征的描述。
(7)進行模式匹配
(e) 何謂紋理特征?為何我們能在虹膜特征識別中利用紋理特征?
紋理特征指虹膜小梁的形態(tài),它以輻射狀分布于瞳孔外側(cè),具有鮮明的特征。虹膜的紋理特征因人而異,且具有穩(wěn)定性,易于獲取。
紋理特征表示的是物體表面上表現(xiàn)出來的條紋圖案。因為虹膜上具有征包括條紋、收縮溝、凹陷、膠原纖維、細絲、隱窩等紋理特征,通過對虹膜紋理的分析可以在實踐中實現(xiàn)較精確的特征識別。
記住:Daugman的方式是把虹膜分為8個部分,生成512個byte。如果用兩個bit表示顏色信息,生成512個byte,因而總共有$512*(8\div2)=2048$個feature。
理解HD
$Hamming\ Distance=\frac{sum\ of\ bits\ different}{sum\ of\ bits}$
任意虹膜編碼的HD匹配程度符合二項分布,以0.38作為門值,因此對于0.5的HD是不匹配的,0.2是匹配的。
Lecture 9 shows the corresponding Fourier transforms of iris images with different quality. Please give the property of Fourier transform of good quality iris images. (Even distribution)
文字沒找到,圖像在9-25,特征是均勻分布。**In Daugman’s approach iris is regarded as a circular pattern. In fact we can also take the iris as other pattern. Please try to design the corresponding scheme. **
在課件中介紹的是矩形的標(biāo)準(zhǔn)化,即逆時針將環(huán)形虹膜展開為固定尺寸的矩形塊圖像,再用iriscode模板來進行匹配和鑒定。
?
Lecture - 9
- (a)區(qū)別聲音特征識別和語音識別,文本依賴鑒別和文本獨立鑒別
聲音特征識別是基于個體發(fā)音的特殊性來鑒別個體身份,而后者是將語音的聲波信息轉(zhuǎn)化為文本信息的過程;文本依賴是指利用某些語言發(fā)音的獨特性來鑒別,文本獨立是指發(fā)音無關(guān)乎內(nèi)容,只注重聲音的其他特性如波形等。
? (b)給出在線簽名比筆跡簽名準(zhǔn)確性高的原因
在線簽名還可以獲取許多個體信息,比如時間(蘊含速度,加速度)、壓力、筆和簽字面板的角度等。
? (c)聲音特征識別和簽名特征識別的優(yōu)缺點各為什么
聲音特征識別數(shù)據(jù)的收集不受限制,用戶友好,成本低廉且廣泛使用,依賴位置。但極易被外在環(huán)境干擾,聲音質(zhì)量不可靠,也會受到人自身的影響。
簽名特征識別用戶接受度高,防偽性好,且用戶可以更改自己的簽名。但不一致的簽名導(dǎo)致FRR增加,現(xiàn)有應(yīng)用程序少,有的人無法生成穩(wěn)定簽名,專業(yè)的偽造者也很有可能偽造簽名。
? (d)在線簽名的全局特征和局部特征各指什么
全局:簽名速度,簽名邊界;(易于提取和計算,缺乏可辨識能力)
局部:沿著簽名軌跡的一些特定采樣點,x y相對于簽名軌跡上第一個點的偏移量,兩個點之間的坐標(biāo)差,兩點之間的曲率差。
- **Features used by voice identification include cadence, frequency, pitch & tone of an individual’s voice. In Lecture 10, the models for two speakers saying the same vowel are given. Please try to define a minimum feature set to divide the two models. **
頻率,峰值;
-
**Directional frontier (DF) in Lecture 10 is a directional grouping of the contour pixels. There is an example of DF curve characterization. Please give the corresponding feature set. **
結(jié)束點,經(jīng)過點,中間點,spline point,最佳適配線,角度,點的數(shù)量。
-
**寫下簽名,并找到以下特征:Upper/lower envelop, vertical /horizontal projection, geometric and topological features. **
//上下包絡(luò)線;每一個垂直或者水平線上黑色像素點的個數(shù);幾何特征表示的就是在簽名里的塊或者說是環(huán);拓撲特征:結(jié)束點、拐點、交匯點等。
?
Tutorial - 10
-
(a)什么是multi-biometrics
對多種生物模式識別方式的綜合利用,依據(jù)對象的不同方面的特征來驗證其身份。
(b)我們可以采取什么樣子的融合方式?請解釋Lecture11的三種融合模式
傳感器融合(一般不可行),特征提取融合(一般不可行),匹配分融合(普遍方法),決策融合(最無用);
串行模式:output of one biometrics is narrowed down before using next biometric;
并行模式:速度比較快;
繼承模式:將分類器以樹形結(jié)構(gòu)聯(lián)合;
(c)區(qū)別biometric uni-modal和biometric multi-modal(單模態(tài)和多模態(tài))
單模態(tài)只利用生物某一方面的特征,而多模態(tài)則基于生物多方面的特征。
(d)預(yù)處理階段有兩種分割方式,一是tangent points of finge hole和circle based segmentation approach,請區(qū)分且理解。
① 切線法:二值圖,找到手指洞,計算兩個洞的切線,得到原點(中點);
② ?
(e)有多少種掌紋特征提取方式?掌紋特征識別方試有何優(yōu)缺點?
Gabor Filter,Adjusted Gabor Filter(復(fù)數(shù)),zeroDC(?),palmcode;
優(yōu)點:高準(zhǔn)確性,實時性,唯一性;
弱點:比較新,需要時間去發(fā)展;
-
給出每一種融合方式的結(jié)構(gòu)
略;好煩啊;
-
理解融合方程的數(shù)學(xué)定義
Feature Vectors from Palmprint/Face:$\frac{f_{palm}}{f_{face}}$
Normalized feature vectors: $[f_{face}’ f_{palm}’]$
Concatenated/Combined feature vector $x_q =[f_{palm}'f_{face}’] $
Similarity Score using $x_q$, $\eta_{match} =||x_q-x_c||$
Decision Threshold,$\eta_{match}>\eta_{threshold}$
Matching level
? Sum Rule
? Max Rule
? Product Rule
? Weight Sum Rule - (FAR+FRR)
-
解釋Directional Templates的作用原因
0和增強,權(quán)值大增強多;
略
略 (用兩個bit表示特征?)
略 HD問題;
Lecture - 11
-
(a) 為何使用3D生物特征識別?
為了獲得更多的信息;且3D信息比較穩(wěn)定(扭曲易恢復(fù)),安全性高,抗噪;
(b) 解釋四種3D圖像模型并給出各自最適合的應(yīng)用
-
Single view imaging with line structured light;
平面投射
-
Single view imaging with modulated structured light;
條紋投射
-
Single view imaging with by using time-of-lflight;
3D光學(xué)相機-基于反射時間獲取;
-
Multi-view imaging;
多攝像頭
-
-
說明耳側(cè)角度具有實用性的原因,please show deep infomation in a given 3D palmprint image.
數(shù)據(jù)顯示隨時間變化小,且因人而異,難以偽造;
?
-
Two different 3D features, Mean Curvature (H) and Guass Curvature (K), are extracted in 3D palmprint recognition (Lecture 12). Please explain the 9 different combinations of H and K as Surface Type (ST).
Lecture12-34 ?
用一種融合方式將3D掌紋識別系統(tǒng)的2D和3D特征結(jié)合。
-
Please understand 3D skeleton feature in 3D fingerprint and how to match each other.
?
Tutorial - 12
-
(a)為何要使用多光譜生物特征識別?
更多的信息——波長越大,能量越高,穿透力越強,可以得到更多的細節(jié);低質(zhì)量的圖像可以被覆蓋(修飾);
(b)超光譜和多光譜有何區(qū)別?
主要區(qū)別在于它們的光波范圍和采樣密集程度不同。超光譜范圍小但選取光波比較密集,而多光譜的范圍大,選取的是最有統(tǒng)計意義的光波,相應(yīng)的也就比較稀松。
(c)分別列舉可見光和紅外光下的生物圖像特征
看見光下的生物圖像正如人眼所見;而紅外光下的生物圖像能夠捕捉到肉眼不可見的圖像如黑夜里的發(fā)熱體情況,皮下血管分布信息等;
-
解釋應(yīng)用于血管識別的transmission, side transmittion, reflection;
透射:上面打光,下面接收;
邊緣透射:兩側(cè)打光,下面接收;
反射:下面打光,下面接收;
-
和掌紋識別相比,基于多光譜的掌背識別更側(cè)重哪一個特征?
血管信息(粗細,紋理);
-
解釋應(yīng)用多種光頻的生物特征識別系統(tǒng)表現(xiàn)尚佳的原因
大概就是信息比較多使得特征更為顯著?
-
在手指識別中,如何提取手指的指關(guān)節(jié)線信息?
橫著截取圖像$IM(i,j)\ (0\le i,j\le 511)$的一條線,得到PR圖,其中$PR(i)=\sum_{j=0}^{511}IM(i,j)$ ,圖像最低點對應(yīng)的坐標(biāo)即為關(guān)節(jié)線所在位置。