本文作者徐浩 , 中國科大理論物理專業在讀,對航空、計算機感興趣,愛玩無人機。本文首發知乎,已獲得作者轉載授權。
今日,微軟 Kinect 技術參與人 Alex Kipman 介紹了微軟新一代虛擬實境技術Holograms。Holograms 借助頭戴設備,讓用戶以實際環境作為載體,實時處理、獲取虛擬信息。比如,在牆上獲取消息、查找聯繫人,在地上、家具間玩遊戲、在客廳牆上直接進行 Skype 視頻通話、觀看球賽。事實上,用戶甚至不需要任何信息載體,所有數據都直接通過頭戴設備呈現在用戶眼前。
與此同時,微軟也發布了自有 Holograms 技術設備 HoloLens。從外觀上,看這款設備很可能使用了微軟此前購買的 ODG 智能眼鏡相關技術。據介紹,HoloLens 帶有透明鏡片,內置高端 CPU 和 GPU。
看過這段視頻,絕對是款拽酷炫屌咋天。沉寂了這麼多年的微軟,似乎終於要崛起了。那要如何評價 HoloLens 的黑科技呢?
以下為正文:
引用宣傳視頻裡面的一句話:
It was science fiction, Microsoft brings it into science fact.
HoloLens 所實現的效果並不是微軟一家的創新,他早已流傳在種種科幻電影中。HoloLens 是一個 Oculus+Kinect+Jetson TK1 集成起來的夾在鼻樑上的嵌入式怪物。腦補一下把 Kinect 帶到頭上的情景吧。微軟做到了!
首先給沒有看宣傳視頻的孩子介紹下 HoloLens 吧,HoloLens 是一個基於深度攝像頭,高性能處理器和雙屏幕顯示的進階版 Glass,長這個樣子,具體參見微軟官網。
根據我目前看到的信息,HoloLens 需要的技術支持包括三個部分:
- 實時的三維計算
這是遊戲屆玩爛的東西,可以說在阿凡達之後拉開了一個時代的幕布,經過 NVIDIA、Intel 等公司的苦心經營,實時的雙攝像頭渲染已經很成熟。微軟終於把這種技術推向了更廣的領域。下圖這種效果在也就是現在是遊戲級別的水平。
- 精準的姿態確定和位置確定
根據網上流傳的信息,可以肯定微軟採用了基於深度識別的 SLAM(實時定位與地圖構建)技術。這裡解釋一下什麼是 SLAM,就是通過傳感器獲取環境的有限信息,比如視覺信息、深度信息、自身的加速度和角速度等來確定自己的相對或者絕對位置,並完成對於地圖的構建。
SLAM 的準確度對於最後的顯示效果非常重要,姿態確定就不是事兒。幾十塊的電容式陀螺儀或者幾百塊的 MEMS 抄幾段代碼就好,但怎麼確定位置就是微軟的功力了。當然深度攝像頭這種事情微軟常年吊打整個行業,Kinect 快成行業標準了(幫助了多少論文發表)。想想我們用的激光雷達的價格。真是要哭了。
電影中,使用小型探測器掃描出來了隧道全景並且全息呈現了出來。對應到現實《普羅米修斯》裡面用的是這種玩意,相當於一輛低配的奧迪 A8 的價格,可以發射幾十束激光同時掃描。Google 無人車也用這種激光雷達來進行實時的路況分析。
微軟做到的可是實現了三年前科幻電影的效果啊!
注意這張圖,微軟暗示進入一個房間之前要先進行掃描,這裡明顯是在用 Deep Camera 生成 Point Cloud 然後三角面片進行 SLAM(我實驗室的某個師兄在微軟實習的時候,做的畢業設計也是這個,微軟在這個技術上的積累很強的)。如果確定是和 Kinect 類似的紅外攝像頭,那麼可以認為 kinect 有的毛病他都會有,比如對黑色物體、光滑表面的探測。
可以說,HoloLens 的核心難度是深度探測和相關的手勢識別。這可是微軟的專長了。所以 HoloLens 就是一個戴到了鼻樑上的 Kinect。
為什麼說 SLAM 對於 HoloLens 非常重要呢?因為只有實現了靠譜的 SLAM,才能知道眼鏡的空間坐標和相對於室內各種障礙物的位置,同時識別出各種室內擺件的形狀,這是宣傳片中人機交互的基礎。
在視頻中,主人公一直在走動,畫面的穩定性很好。
注意上圖這裡,可以看到對於各個表面的貼合度已經達到了 SLAM 的程度。
- 圖像識別技術
這裡註意到一個細節,展示在三維空間中的 UI 很像是 Autodesk Fusion 的 UI,難道自動桌已經先行一步?來自官網的一張圖片,可以看到使用的正是 Autodesk。
作為半個工程師,我當時買 Leap Motion 就是為了玩 Solidworks Fusion。現在有了 HoloLens,比 Fusion 體驗不知道酸爽多少倍。腦補一下去參觀 EAST 的時候眼睛裡顯示出 EAST 剖面的情景。不能再震撼了。
這三個技術在近些年成熟,促成了 HoloLens 產品化。之前 Google Glass 的設想與此類似,Hololens 把它推向了現實。
其實 Hololens 所實現的效果也不是新鮮貨。早在冷戰末期,武裝直升機飛行員就通過頭盔裡面的信息來操作機槍所瞄準的方向。這兩年我軍也有裝備。當年 Su35 的“回馬槍”向後發射的導彈就是用尾椎雷達和頭盔瞄準具實現的。
更進一步,上圖用到的也是類似的技術。
不過,根據技術分析,Hololens 可能會遇到如下一系列困難:
第一,耗電量。計算視覺、SLAM,以及反過向進行三維虛擬現實,都是常耗費計算量的任務。Hololens 是時勢造英雄的產品,這種計算量在二十年前可是阿拉莫斯實驗室用於核聚變模擬的計算量。現在只要耗電量跟的上,NVIDIA 的 Tegra K1 還有 Intel 家的協處理器在嵌入式上飆計算量沒問題。
第二,是在開放環境、欠光線環境的識別度問題。我對此持保守態度,得拿到產品再說。
第三,是定位精準度問題。這是老大難問題了。
事實上,上圖中這種配合將成為很長一段時間內的主流。
如果修的不是自來水管而是血管,看到的是通過 B 超技術實時掃描出來的人體內部,那麼未來的醫院會是怎麼樣的。
如果顯示的不是自來水管的 manual,而是實時匹配無人機的爆炸視圖,那麼以後的工廠和 DIY 是怎麼樣的。
讓人難以想像的是,這一切居然要成真了!
微軟研究院養了那麼多人真的不是白養的。目前來看,微軟在這些技術上解決的都非常好。
另外十分看好 HoloLens+ 無人機的交互。拿到貨以後我要做的第一件事情就是把我們的無人機系統移植上去。這畫面太美。我簡直不敢想。
還有多系統配合,這是像 iPhone 可以推動 21 世紀歷史進程的玩意。
買買買!
估計 Google 也會坐不住了,也會有大動作,相關技術大部分(包括廉價的深度攝像頭)都是開源的,估計很快會有公司扛包出現類似設備的開源硬件和軟件,市場一刺激華強北也不會安分,投資空間有多大。各位手裡有錢的主,都掂量掂量吧。由 iPhone 引發的歷史軌跡就是證明。
看起來,全息估計不會成為主流發展方向了。
不過,我最好奇的還是,這個東西進入中國以後,廣電會不會要求接入都要審批(顯然會搶電視機的飯碗)。
(本文載自合作媒體36 氪,未經許可不得轉載)