3D視覺新時代

隨著2017年蘋果iPhoneX手機的發布,移動端3D人臉識別技術一夜成名,它的登場開啟了智能交互的新時代。相比于觸控屏手指無法離開屏幕、語音識別應用場景存在的局限性,基于3D 視覺的手勢/人臉識別進一步解放雙手,給用戶帶來了全新的智能人機交互體驗。

圖片發自簡書App

3D識別被廣泛看好,前景廣闊。無論是消費級市場的游戲、娛樂、交互,還是商業領域的醫療、工業、安防、軍事等,都需要豐富的手部動作來參與,因此手勢識別具有非常廣泛的應用場景。而人臉識別在移動端身份認證、支付交易、權限登錄、識別用戶表情或精神狀態、自拍快速對焦、自拍美顏等方面具有無限潛力。

可以預見一旦3D視覺進入大規模普及,將對現有的消費電子產品產生顛覆性的影響。因此,包括蘋果、谷歌、微軟、英特爾、索尼、三星等科技巨頭,均在深度相機、體感交互、動作捕捉等領域展開了深度的布局,或并購,或專門成立研發團隊,快速獲得先進技術,實現技術和專利的儲備。面對這一風口,誰能搶占先機,誰就能分得一塊蛋糕。因此,國內產業鏈紛紛布局,安卓陣營緊跟iPhone X的步伐。


今年5月底,小米率先推出了首款3D結構光的安卓智能手機——小米8透明探索版,采用了以色列的3D編碼結構光技術廠商Mantis Vision的方案。緊接著在6月,OPPO也推出了支持3D人臉識別的新一代旗艦機——Find X,這款手機采用的是類似iPhone X的散斑結構光技術,由國內知名的3D感測技術廠商奧比中光提供技術,丘鈦提供模組。而華為發布的Mate 20 Pro前置的3D結構光模塊,更高精度地實現了對于人臉部五官細節的重繪,使得美顏效果更具有立體效果,而且很大可能手機會支持刷臉支付。同時Mate 20 Pro還可以利用手機掃描現實中的物體或人物,然后進行3D建模。預計明年上半年,更多搭載有3D人臉識別的安卓手機將陸續亮相。

我有幸參與到3D成像技術的研發,親眼見證一個團隊白手起家。一年之內,從人才招募、設備購買,到產線建立,從概念到生產,親眼見識了每一道工藝的真實面目。從長三角到珠三角,多地出差,當面交流,第一現場了解了相關公司的加工能力。

原來一顆小小的3D攝像頭,背后聚集了如此復雜的工藝技術,不僅讓我這個混跡職場八年的工程師大開眼界,就連我那些70后的資深工程師們,也都驚呼這一年的見識遠勝于之前多年的工作經驗。這是與君處一年,勝讀十年書啊。

這一路,從行業到產品,從產業鏈到工藝,從理論到實踐,我發現只要留心深挖,每一處都是寶藏。于是我提筆整理,從點到面,將理論剖析和實踐經驗所獲所感一一記錄下來,傾囊分享。

3D成像的三種主流設計方案

說到3D成像技術,有必要先了解它的幾種實現方案。根據原理和硬件實現方式的不同,行業內所采用的3D機器視覺主要有三種:結構光、TOF 時間光、雙目立體成像。


圖片發自簡書App


三種主流的方案中,比較成熟的是結構光和TOF時間光。其中結構光方案最為成熟,已經被成功應用于游戲體感交互、工業機器視覺檢測、智能手機等領域,但是極易受到外界光的干擾、響應速度較慢、識別精度較低;TOF 時間光方案被廣泛應用于醫療檢測、機器人視覺等領域,在消費電子方面,受到谷歌、意法半導體、德州儀器、英飛凌等公司的支持;雙目立體成像方案抗環境光干擾強,分辨率高,也是移動端可選方案之一,但是技術較新不夠成熟,目前在機器人、自動駕駛領域應用較多。

1、結構光(Structured Light):首先紅外激光發射器(IR LD)發射出近紅外光(IR Light)特定圖案(如激光散斑等),經過物體(如人手或人臉等)的反射之后,形變之后的圖案被紅外圖像傳感器(IR CIS)所接收,經過算法計算出人手/人臉所處的位置(Z 軸);同時,可見光圖像傳感器采集二維平面(X與 Y 軸)的人手/人臉信息(Vis Light);兩顆圖像傳感器的信息匯總至專用的圖像處理芯片,從而得到三維數據,實現空間定位。

圖片發自簡書App

2、TOF(Time Of Flight):通過持續的給被測物體發送光信號,然后傳感器端接收到回傳的光信號,經過計算發射和接收光信號的往返飛行時間來得到被測物體距離的技術。

圖片發自簡書App

3、雙目測距(Stereo System):利用雙攝像頭拍攝物體,再通過三角形原理計算物體距離。

TOF與結構光的區別在于對紅外光的使用方式不同,TOF通過計算紅外光發出光線與返回光線之間的向位移變化換算為位置信息,而結構光依靠向物體投射一系列光線圖案組合,然后通過檢測光線的邊緣來測量距離,二者的硬件結構是類似的。二者比較明顯的區別在于,在紅外光發射端,TOF基本不需要使用光學棱鏡,而結構光由于需要形成特定的光學圖案,所以需要添加DOE(衍射光柵)和Lens(光學棱鏡)。

3D成像不同方案優缺點對比

三種方案的優缺點,下面這張表格讓我們一目了然:

圖片發自簡書App

3D 視覺三種方案各有優缺點:

雙目立體成像方案軟件算法復雜,技術還不成熟。

結構光方案技術成熟,功耗低,平面信息分辨率高,但易受光照影響,識別距離近。

TOF方案抗干擾性好,識別距離遠,但是平面分辨率低,功耗較大。

3D成像硬件構成

無論是結構光方案、TOF方案還是雙目立體成像方案,主要的硬件包括四部分:紅外光發射器(IR LD)、紅外光攝像頭(IR CIS)、可見光攝像頭(Vis CIS)、圖像處理芯片,紅外攝像頭需要特制的窄帶濾色片,另外結構光方案還需要在發射端添加光學棱鏡與光柵,雙目立體像多一顆IR CIS。

圖片發自簡書App

每一部分由哪些構成?功能是啥?又涉及哪些工藝和相關供應商呢?問得好,我們下期聊聊。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 堅持和不強求 昨晚刷微博看到一段三毛寫的話:上天不給我的,無論我十指怎樣緊扣,仍然走漏;給我的,無論過去我怎么失手...
    ZQ鄭閱讀 433評論 0 2
  • 1.當你準備要睡覺的前一個小時,告訴自己只要踏入臥室,我就把手機給留在客廳。 2,晚上不要在手機上看小說,電視...
    玲子網絡科技閱讀 969評論 0 0
  • 又到了轟轟烈烈的十一了,大家積攢了大半年的能量瞬間爆發了,在各個景區,人頭竄動的,就像一場末日的狂歡,人人就像行走...
    一直在路上的精靈閱讀 222評論 0 1
  • 依稀記得 門前那一片翠綠的竹林 隨風便生出熙熙碎碎的聲響 兒時的那個村莊 如今只好像在夢中出現過 一片茫然 然后不...
    清晨六點半的詩閱讀 398評論 0 0
  • 文:十七 字數:956 01 荔水廣場人來人往熙熙攘攘。街頭燈火絢爛,似乎永遠為每一個人照亮。 雪莉走在這秋夜的街...
    十七Regina閱讀 412評論 0 1