AR技術(shù)原理

AR從其技術(shù)手段和表現(xiàn)形式上,可以明確分為大約兩類:一是Vision based AR,即基于計算機視覺的AR,二是LBS based AR,即基于地理位置信息的AR,我們分門別類對其進行概念講解和原理解析。

Vision based AR

基于計算機視覺的AR是利用計算機視覺方法建立現(xiàn)實世界與屏幕之間的映射關(guān)系,使我們想要繪制的圖形或是3D模型可以如同依附在現(xiàn)實物體上一般展現(xiàn)在屏幕上,如何做到這一點呢?本質(zhì)上來講就是要找到現(xiàn)實場景中的一個依附平面,然后再將這個3維場景下的平面映射到我們2維屏幕上,然后再在這個平面上繪制你想要展現(xiàn)的圖形,從技術(shù)實現(xiàn)手段上可以分為2類:

1) Marker-Based AR

這種實現(xiàn)方法需要一個事先制作好的Marker(例如:繪制著一定規(guī)格形狀的模板卡片或者二維碼),然后把Marker放到現(xiàn)實中的一個位置上,相當于確定了一個現(xiàn)實場景中的平面,然后通過攝像頭對Marker進行識別和姿態(tài)評估(Pose Estimation),并確定其位置,然后將該Marker中心為原點的坐標系稱為Marker Coordinates即模板坐標系,我們要做的事情實際上是要得到一個變換從而使模板坐標系和屏幕坐標系建立映射關(guān)系,這樣我們根據(jù)這個變換在屏幕上畫出的圖形就可以達到該圖形依附在Marker上的效果,理解其原理需要一點3D射影幾何的知識,從模板坐標系變換到真實的屏幕坐標系需要先旋轉(zhuǎn)平移到攝像機坐標系(Camera Coordinates)然后再從攝像機坐標系映射到屏幕坐標系(其實由于硬件誤差這中間還需要理想屏幕坐標系到實際屏幕坐標系的轉(zhuǎn)換,這里不深究),見下圖。

圖片1.png

在實際的編碼中,所有這些變換都是一個矩陣,在線性代數(shù)中矩陣代表一個變換,對坐標進行矩陣左乘便是一個線性變換(對于平移這種非線性變換,可以采用齊次坐標來進行矩陣運算)。公式如下:

圖片2.png

矩陣C的學名叫攝像機內(nèi)參矩陣,矩陣Tm叫攝像機外參矩陣,其中內(nèi)參矩陣是需要事先進行攝像機標定得到的,而外參矩陣是未知的,需要我們根據(jù)屏幕坐標(xc ,yc)和事先定義好的Marker 坐標系以及內(nèi)參矩陣來估計Tm,然后繪制圖形的時候根據(jù)Tm來繪制(初始估計的Tm不夠精確,還需要使用非線性最小二乘進行迭代尋優(yōu)),比如使用OpenGL繪制的時候就要在GL_MODELVIEW的模式下加載Tm矩陣來進行圖形顯示。

2) Marker-Less AR

基本原理與Marker based AR相同,不過它可以用任何具有足夠特征點的物體(例如:書的封面)作為平面基準,而不需要事先制作特殊的模板,擺脫了模板對AR應(yīng)用的束縛。它的原理是通過一系列算法(如:SURF,ORB,F(xiàn)ERN等)對模板物體提取特征點,并記錄或者學習這些特征點。當攝像頭掃描周圍場景,會提取周圍場景的特征點并與記錄的模板物體的特征點進行比對,如果掃描到的特征點和模板特征點匹配數(shù)量超過閾值,則認為掃描到該模板,然后根據(jù)對應(yīng)的特征點坐標估計Tm矩陣,之后再根據(jù)Tm進行圖形繪制(方法與Marker-Based AR類似)。

LBS-Based AR

其基本原理是通過GPS獲取用戶的地理位置,然后從某些數(shù)據(jù)源(比如wiki,google)等處獲取該位置附近物體(如周圍的餐館,銀行,學校等)的POI信息,再通過移動設(shè)備的電子指南針和加速度傳感器獲取用戶手持設(shè)備的方向和傾斜角度,通過這些信息建立目標物體在現(xiàn)實場景中的平面基準(相當于marker),之后坐標變換顯示等的原理與Marker-Based AR類似。
這種AR技術(shù)利用設(shè)備的GPS功能及傳感器來實現(xiàn),擺脫了應(yīng)用對Marker的依賴,用戶體驗方面要比Marker-Based AR更好,而且由于不用實時識別Marker姿態(tài)和計算特征點,性能方面也好于Marker-Based AR和Marker-Less AR,因此對比Marker-Based AR和Marker-Less AR,LBS-Based AR可以更好的應(yīng)用到移動設(shè)備上。
LBS-Based AR導航類應(yīng)用,由于需要顯示的信息較多,會出現(xiàn)以下兩個問題。
物體相互覆蓋無法顯示的問題
采用實時聚類技術(shù),將互相覆蓋較嚴重的標簽進行實時合并,當用戶點 擊聚合標簽時,聚合標簽聚合的所有標簽都以列表的形式顯示出來,再供用戶二次選擇。
點選幾個物體相互覆蓋部分時的物體選擇問題。
采用射線相交技術(shù),當用戶點擊屏幕時,通過坐標變化,把2D的屏幕 坐標轉(zhuǎn)換為3D的射線,并判斷該射線是否與3D場景中的標簽相交, 如果相交,則把所有相交的標簽以列表的形式顯示出來,再供用戶 二 次選擇。

硬件方面

硬件技術(shù)難點:
交互技術(shù)
手勢操控:微軟HoloLens是利用手勢進行交互的、最有特點的AR硬件。戴上HoloLens眼鏡后,可通過手指在空中點選、拖動、拉伸來控制虛擬物體、功能菜單界面。比如利用Air tap 手勢打開全息圖,利用Bloom 手勢打開開始菜單。
語音操控:手勢操控固然解放了雙手,但是它有著致命的缺陷,那就是頻繁的抬手會造成手臂酸軟。筆者在利用Leap Motion體驗小游戲時,發(fā)現(xiàn)這種問題尤甚。而語音操控便是更好的人機交互方案。現(xiàn)在微軟Cortana、Google Now、蘋果Siri、亞馬遜Echo都是優(yōu)秀的語音識別助手,但是他們的識別率還是不高,只能作為輔助操作工具,智能程度也遠遠達不到AR交互需求。
體感操控:假設(shè)有一天全息通話成為了現(xiàn)實,那么除了語音、視覺交流之外,你是否可以和遠程的朋友進行體感交流(比如握手)?想要獲得更加完美的增強現(xiàn)實體驗,體感外設(shè)顯然是非常重要的一環(huán)。現(xiàn)在,已經(jīng)有不少廠商推出了體感手套、體感槍等外設(shè)。只是這些設(shè)備功能還很單薄,還有著極大的改進空間。

鏡片成像技術(shù)

無論是增強現(xiàn)實還是虛擬現(xiàn)實,F(xiàn)OV 都是影響使用體驗的最重要因素之一。現(xiàn)在的AR眼鏡的可視廣角普遍不高,HoloLens有30°,Meta One只有23°,而公眾最為熟悉的Google Glass視角僅有12°。這是由于鏡片成像技術(shù)和光學模組不成熟造成的,現(xiàn)在還沒有太好的解決方案,但太窄的視角顯然讓增強現(xiàn)實效果大打折扣。

圖片3.png

而除了FOV,AR在成像方面,還存在著以下的問題需要解決:
首先軟件方面,底層算法(輸入、輸出算法)還需要加強。這需要精確的圖像識別技術(shù)來判斷物體所處的位置以及3D坐標等信息。不同于其他3D定位,增強現(xiàn)實領(lǐng)域的物體位置,必須結(jié)合觀測者的相對位置、三維立體坐標等信息進行定位,難度要高很多。而如何利用疊加呈像算法,將相關(guān)信息疊加顯示在視網(wǎng)膜上也是個技術(shù)難點。
而在硬件方面,光學鏡片還是存在著色散和圖形畸變的問題。智能眼鏡成像時,視場周邊會出現(xiàn)紅綠藍色變,這就是棱鏡反射光線時常見的色散現(xiàn)象,可以通過軟件進行色彩補償或者通過多材料鏡片來消除。前者會增加硬件負擔并降低圖像幀率。后者的成品率低,這也是造成AR眼睛昂貴的原因之一。

SLAM技術(shù)

SLAM 即指同步定位與建圖技術(shù)。有人說,兩年前,掃地機是就是它的代言人。確實,能夠掃描室內(nèi)布局結(jié)構(gòu),并構(gòu)建、規(guī)劃掃地路線的掃地機器人是SLAM技術(shù)最好代表了。其實,這項技術(shù)也可以被運用在AR領(lǐng)域,現(xiàn)階段基于SLAM技術(shù)開發(fā)的代表性產(chǎn)品有微軟Hololens,谷歌Project Tango以及Magic Leap。
舉個例子,我們知道AR可以用來觀看視頻,但是如果我想把畫面準確的投射到墻上或者壁櫥上呢?這就需要SLAM技術(shù)。以HoloLens為例,它在啟動的時候,會對用戶所處空間進行掃描,從而建立房間內(nèi)物體擺設(shè)的立體模型。

圖片4.png

(轉(zhuǎn)自百度文庫,方便記憶)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,505評論 6 533
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,556評論 3 418
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,463評論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,009評論 1 312
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,778評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,218評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,281評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,436評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,969評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 40,795評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,993評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,537評論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,229評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,659評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,917評論 1 286
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,687評論 3 392
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,990評論 2 374

推薦閱讀更多精彩內(nèi)容