蘋果將在新一代產(chǎn)品iPhone 8上使用前置3D深度攝像頭的消息,讓3D深度攝像頭的概念進(jìn)入了普通大眾的視野。實(shí)際上,未來(lái)眾多前沿領(lǐng)域的應(yīng)用將越來(lái)越依賴深度攝像頭,比如VR、機(jī)器人、安防、自動(dòng)駕駛等,這也是為什么國(guó)際巨頭都在布局于此的原因。前段時(shí)間本站報(bào)道了,華為在北京發(fā)布榮耀V9,是業(yè)內(nèi)首款3D建模手機(jī),用戶可以通過激光對(duì)焦獲得人臉數(shù)據(jù),通過算法構(gòu)建人像3D模型,進(jìn)而通過預(yù)裝的APP鏈接3D打印平臺(tái)的各類消費(fèi)需求。
目前,3D深度攝像頭已經(jīng)渡過技術(shù)基礎(chǔ)期,方向明確,將進(jìn)入3-5年的成長(zhǎng)期,未來(lái)將掀起3D傳感器的浪潮。在這項(xiàng)技術(shù)引發(fā)革命前,我們先來(lái)簡(jiǎn)要了解一下。
什么是3D深度攝像頭?
3D深度攝像頭與普通攝像頭的區(qū)別在于,除了能夠獲取平面圖像,還可以獲得拍攝對(duì)象的深度信息,也就是三維的位置和尺寸信息,于是整個(gè)計(jì)算系統(tǒng)就獲得了環(huán)境和對(duì)象的三維立體數(shù)據(jù),這些信息可以用在人體跟蹤、三維重建、人機(jī)交互、SLAM等領(lǐng)域。
深度攝像頭具備以下優(yōu)點(diǎn):
1)相對(duì)二維圖像,可通過距離信息獲取物體之間更加豐富的位置關(guān)系,即區(qū)分前景與后景;
2)深度信息依舊可以完成對(duì)目標(biāo)圖像的分割、標(biāo)記、識(shí)別、跟蹤等傳統(tǒng)應(yīng)用;
3)經(jīng)過進(jìn)一步深化處理,可以完成三維建模等應(yīng)用;
4)能夠快速完成對(duì)目標(biāo)的識(shí)別與追蹤;
5)主要配件成本相對(duì)低廉,包括CCD和普通 LED 等,對(duì)今后的普及化生產(chǎn)及使用有利;
6)借助 CMOS 的特性,可獲取大量數(shù)據(jù)及信息,對(duì)復(fù)雜物體的姿態(tài)判斷極為有效,無(wú)需掃描設(shè)備輔助工作。
3D深度攝像頭采用的主流視覺技術(shù)
根據(jù)硬件實(shí)現(xiàn)方式的不同,目前行業(yè)內(nèi)所采用的主流3D視覺技術(shù)有三種:結(jié)構(gòu)光技術(shù)、飛行時(shí)間法(ToF)、雙目多角立體成像。
1)結(jié)構(gòu)光(Structure Light)
通過激光的折射以及算法計(jì)算出物體的位置和深度信息,進(jìn)而復(fù)原整個(gè)三維空間。結(jié)構(gòu)光的代表產(chǎn)品有微軟的Kinect一代。通過發(fā)射特定圖形的散斑或者點(diǎn)陣的激光紅外圖案,當(dāng)被測(cè)物體反射這些圖案,通過攝像頭捕捉到這些反射回來(lái)的圖案,計(jì)算上面散斑或者點(diǎn)的大小,跟原始散斑或者點(diǎn)的尺寸做對(duì)比,從而測(cè)算出被測(cè)物體到攝像頭之間的距離。
目前是業(yè)界比較成熟的深度檢測(cè)方案,很多的激光雷達(dá)和3D掃描技術(shù)都是采用的結(jié)構(gòu)光方案。不過由于以折射光的落點(diǎn)位移來(lái)計(jì)算位置,這種技術(shù)不能計(jì)算出精確的深度信息,對(duì)識(shí)別的距離也有嚴(yán)格的要求。而且容易受到環(huán)境光線的干擾,強(qiáng)光下不適合,響應(yīng)也比較慢。
典型的結(jié)構(gòu)光方案包括:PrimeSense(微軟Kinect1代)、英特爾RealSense(前置方案)。
2)飛行時(shí)間法(TIme of Flight)
TOF系統(tǒng)是一種光雷達(dá) (LIDAR) 系統(tǒng),可從發(fā)射極向?qū)ο蟀l(fā)射光脈沖,接收器則可通過計(jì)算光脈沖從發(fā)射器到對(duì)象,再以像素格式返回到接收器的運(yùn)行時(shí)間來(lái)確定被測(cè)量對(duì)象的距離。TOF系統(tǒng)可同時(shí)獲得整個(gè)場(chǎng)景,確定3D范圍影像。利用測(cè)量得到的對(duì)象坐標(biāo)可創(chuàng)建3D影像,并可用于機(jī)器人、制造、醫(yī)療技術(shù)以及數(shù)碼攝影等領(lǐng)域的設(shè)備控制。
TOF方案的優(yōu)點(diǎn)在于響應(yīng)速度快,深度信息精度高,不容易受環(huán)境光線干擾,這些優(yōu)點(diǎn)使其成為移動(dòng)端手勢(shì)識(shí)別最被看好的方案。代表廠商有微軟(Kinect2代)、意法半導(dǎo)體、英飛凌、德州儀器等。
3)雙目多角立體成像(MulTI-camera)
現(xiàn)在手勢(shì)識(shí)別領(lǐng)域的佼佼者Leap MoTion使用的就是這種技術(shù)。它使用兩個(gè)或者兩個(gè)以上的攝像頭同時(shí)采集圖像,通過比對(duì)這些不同攝像頭在同一時(shí)刻獲得的圖像的差別,使用算法來(lái)計(jì)算深度信息,從而多角三維成像。
Leap MoTion方案使用2個(gè)攝像機(jī)獲得左右立體影像,該影像有些輕微偏移,與人眼同序。計(jì)算機(jī)通過比較這兩個(gè)影像,就可獲得對(duì)應(yīng)于影像中物體位移的不同影像。該不同影像或地圖可以是彩色的,也可以為灰階,具體取決于特定系統(tǒng)的需求。
雙目多角立體成像方案的優(yōu)點(diǎn)在于不容易受到環(huán)境光線的干擾,適合室外環(huán)境,滿足7*24小時(shí)的長(zhǎng)時(shí)間工作要求,不易損壞。缺點(diǎn)是昏暗環(huán)境、特征不明顯時(shí)不適合,目前應(yīng)用在智能安防監(jiān)控、機(jī)器人視覺、物流檢測(cè)等領(lǐng)域。
哪種技術(shù)最適合移動(dòng)端?
綜上,在主流的三種技術(shù)方案中,TOF方案響應(yīng)速度快,深度信息精度高,識(shí)別距離范圍大,不易受環(huán)境光線干擾,因此是移動(dòng)端3D視覺比較可行也最被看好的方案;結(jié)構(gòu)光方案由于技術(shù)較為成熟,工業(yè)化產(chǎn)品較多,也被部分廠商所采用;雙目立體成像是比較新的技術(shù),參與的廠商較少,更適合室外強(qiáng)光條件和高分辨率應(yīng)用,目前主要應(yīng)用在機(jī)器人視覺、自動(dòng)駕駛等方面。
如文章開頭所示,作為我們最為關(guān)注的移動(dòng)端硬件——手機(jī),尤其是蘋果的功能提升,總會(huì)引發(fā)一場(chǎng)行業(yè)革命。蘋果公司在iPhone7中使用了基于TOF原理的前置距離傳感器(proximity sensor)。而在此之前,蘋果的iPhone5和iPhone6s采用的都是LED+光探測(cè)器的方案。從LED+光探測(cè)器到TOF,表明移動(dòng)端TOF方案在技術(shù)方面已經(jīng)獲得了巨大的進(jìn)步。
相比其他兩種技術(shù),TOF時(shí)間光更加適合應(yīng)用到智能手機(jī)上,采用TOF原理來(lái)實(shí)現(xiàn)動(dòng)作追蹤和深度感知已經(jīng)出現(xiàn)在谷歌的Project Tango方案中,主要用于空間三維數(shù)據(jù)的采集,與應(yīng)用于手勢(shì)/臉部識(shí)別是非常接近的。
3D深度視覺技術(shù)已經(jīng)出現(xiàn)在微軟Kinect、英特爾RealSense等消費(fèi)級(jí)產(chǎn)品中,隨著硬件端技術(shù)的不斷進(jìn)步,算法與軟件層面的不斷優(yōu)化,3D深度視覺的精度和實(shí)用性還將得到大幅提升,尤其是TOF方案與VCSEL的快速成熟,使得“深度相機(jī)+手勢(shì)/人臉識(shí)別”具備了大規(guī)模進(jìn)入移動(dòng)智能終端的基礎(chǔ)。這必將進(jìn)一步解放雙手,打開新的智能人機(jī)交互空間。全文分析:http://3dprint.ofweek.com/2017-03/ART-132107-8420-30119492.html