- 相關(guān)推薦
小議計算機視覺(jué)的應用
Magic Leap年初獲阿里巴巴領(lǐng)投的7.9 億美元,一時(shí)風(fēng)光無(wú)二 。那么小編帶領(lǐng)大家從Magic Leap談?wù)動(dòng)嬎銠C視覺(jué)的應用。
刷屏的視頻
Magic Leap的演示視頻里,帶上Magic Leap眼鏡,就能看到躍起的鯨魚(yú)或者看見(jiàn)天花板上漂浮的水母。
神秘的Magic Leap似乎遭遇了危機,產(chǎn)品也至今沒(méi)有發(fā)布,但是背后的技術(shù)其實(shí)并不神秘。
Magic Leap管自己的產(chǎn)品不叫“增強現實(shí)”,而是叫“混合現實(shí)”(Mixed Reality,簡(jiǎn)稱(chēng)MR)。這一下子就讓人頭疼了,虛擬現實(shí)(VR)和增強現實(shí)(AR)就已經(jīng)夠亂的了,現在又搞出來(lái)了一個(gè)混合現實(shí)(MR)。這之間到底是什么關(guān)系?又有什么區別呢?
我們一個(gè)一個(gè)說(shuō)
虛擬現實(shí),雖然名字里有個(gè)“現實(shí)”,但跟現實(shí)沒(méi)啥關(guān)系。用戶(hù)帶上頭套,直接就進(jìn)入了另一個(gè)世界,連自己的手都看不見(jiàn)。谷歌的Cardboard就是典型的虛擬現實(shí)。戴上以后,你看到的是埃菲爾鐵塔腳下,別人看到的是你戴了個(gè)硬紙殼兒四處轉腦袋。
虛擬現實(shí)有個(gè)缺點(diǎn),就是用戶(hù)不能戴著(zhù)它四處晃悠。畢竟用戶(hù)看不見(jiàn)周?chē)恼鎸?shí)環(huán)境,四處走的話(huà),容易撞到墻。
增強現實(shí),就跟現實(shí)有點(diǎn)關(guān)系了。用戶(hù)帶上眼鏡,原來(lái)能看見(jiàn)的現在還都能看見(jiàn),只不過(guò)加了一層“平面投影”。比如你看見(jiàn)一個(gè)人,增強現實(shí)就能給這個(gè)人注上姓名、職位之類(lèi)的信息?匆(jiàn)一個(gè)商店,增強現實(shí)可以給你注上商店名字、地址、是否正在營(yíng)業(yè)。
最后就是這個(gè)Magic Leap提出的“混合現實(shí)”;旌犀F實(shí)直接把立體的虛擬物體投射到真實(shí)環(huán)境里。比如那個(gè)藏在桌子底下的機器人,它可以和真實(shí)的桌子互動(dòng)。如果“混合現實(shí)”做到極致,虛擬物體會(huì )和真實(shí)物體看起來(lái)一模一樣,完全可以以假亂真。
簡(jiǎn)單來(lái)說(shuō),虛擬現實(shí)就是“看不見(jiàn)現實(shí)”,增強現實(shí)就是“加了標注的現實(shí)”,混合現實(shí)就是“根本分不清是虛擬還是現實(shí)”。
虛擬現實(shí)、增強現實(shí)、混合現實(shí)的區別
其實(shí)不少人認為“混合現實(shí)”純屬概念炒作,和增強現實(shí)沒(méi)什么本質(zhì)的區別。盡管Magic Leap一再強調我們做的是“混合現實(shí)”,而大量媒體還是把它歸到了“增強現實(shí)”的范疇里。
Magic Leap目前并沒(méi)有透露任何技術(shù)細節,不過(guò)他們一直在招聘計算機視覺(jué)的相關(guān)人才。計算機視覺(jué)雖然近幾年才火起來(lái),但它卻是個(gè)古老的科技。它講起來(lái)并不艱深,只不過(guò)有些瑣碎。
什么是計算機視覺(jué)
所謂“計算機視覺(jué)”,就是教計算機“看懂”圖像或者影像。給一只貓的圖片,電腦能判斷出它是一只貓。給一個(gè)天安門(mén)廣場(chǎng)的照片,電腦能數出來(lái)廣場(chǎng)上一共有多少人。
任何一個(gè)圖像,都是三個(gè)二維數列(或者叫二維矩陣),比如下面這張圖,上邊是人看到的,下邊是計算機看到的。人很容易識別出來(lái)這是一只羊駝,但計算機看到的只有數字,根本沒(méi)什么規律。如何識別出它是不是羊駝,就需要計算機視覺(jué)來(lái)做了。
計算機視覺(jué)的一大困難,就是把平面圖像還原成立體物體。還是以上圖為例,人眼看起來(lái),羊駝的頭比屁股離屏幕更近,但計算機看來(lái),頭和屁股在同一層上。一個(gè)平面圖形,怎么區別遠近呢?
計算機視覺(jué)有幾種思路
第一種就是像人類(lèi)一樣,長(cháng)出兩只眼睛。人左眼和右眼看到的圖像是不一樣的,大腦根據左右眼的圖像,還原出一個(gè)立體的場(chǎng)景。計算機也一樣,它可以用多個(gè)攝像頭捕捉圖像,根據圖像差異計算出物體的遠近。Magic Leap就是用兩個(gè)裝有攝像頭的鏡片,通過(guò)數學(xué)方法還原3D環(huán)境。
不過(guò)體視的缺點(diǎn)是計算量太大,而且物體如果太遠,距離就量不準了。這就是為什么微軟的HoloLens干脆搞出了一個(gè)“距離傳感器”。攝像頭只管看圖像,距離傳感器負責探測每個(gè)像素點(diǎn)的距離。
第二種就是看陰影。計算機可以根據圖片的明暗分布,判斷光源位置,進(jìn)而判斷誰(shuí)在前誰(shuí)在后。還是看那張羊駝的圖片,計算機可以很迅速地判斷光源在羊駝的正上方。既然光源在正上面,羊的后背亮,肚子暗,那么后背的這些像素和肚子的這些像素就不在同一層。
第三種就是靠攝像頭自己動(dòng)。帶上AR眼鏡,人不可避免會(huì )亂動(dòng)。人一動(dòng),攝像機就可以對單一物體進(jìn)行“跟拍”。下圖中,一個(gè)攝像機在三個(gè)位置拍出三張照片,那么根據這三張照片就能還原出這個(gè)物體的立體形態(tài)。
這些東西,學(xué)名叫做“計算機視覺(jué)的三維重建”。三維重建的方法還有很多,這里就不一一贅述。為什么要講三維重建,因為這可能是Magic Leap最大的特長(cháng)。
增強現實(shí)只需要識別一下圖片,在眼鏡的平面上做一個(gè)標注就可以了。而Magic Leap所謂的“混合現實(shí)”,需要把虛擬物體直接放到真實(shí)環(huán)境中。要想和真實(shí)環(huán)境接觸,必須把真實(shí)環(huán)境用計算機重建出來(lái)。這個(gè)過(guò)程,就需要上面講的各種“三維重建”方法了。
目前Magic Leap還并沒(méi)有把整個(gè)計算機整合到眼鏡上,他們的展示視頻是用一個(gè)裝了攝像頭的眼鏡,連接著(zhù)電腦拍出來(lái)的。
Magic Leap的CEO羅尼·阿伯維茨(Rony Abovitz)并沒(méi)有透露具體何時(shí)把Magic Leap的眼鏡開(kāi)發(fā)出來(lái),不過(guò)阿伯維茨在接受WIRED采訪(fǎng)時(shí)說(shuō),發(fā)布之前,我們的產(chǎn)品必須做到完美無(wú)瑕。
這就不知道要等到哪天了。Facebook、谷歌、微軟等一系列公司都在A(yíng)R領(lǐng)域進(jìn)行“生死競速”,加班加點(diǎn)地研發(fā)新產(chǎn)品。
面對當前的這些不利因素,或許Magic Leap會(huì )像谷歌眼鏡一樣,經(jīng)歷了長(cháng)時(shí)間的開(kāi)發(fā),最后宣告失敗。也或許Magic Leap能像他們的名字一樣,一下子“神奇地躍過(guò)”了這些大公司,推出了一個(gè)“完美無(wú)瑕”的眼鏡,成為增強現實(shí)的霸主。
【小議計算機視覺(jué)的應用】相關(guān)文章:
視覺(jué)流程在平面設計中的應用03-19
網(wǎng)頁(yè)視覺(jué)平面中平面設計語(yǔ)言的應用03-05
計算機應用常識03-21
學(xué)好計算機應用01-10
計算機應用開(kāi)題報告03-18
計算機基礎應用試題02-26
計算機的應用小常識03-21