編者按:本文作者為王曦,《36 氪》特約撰稿人。王曦畢業於清華大學建築技術系,目前生活在美國。她非常喜歡科技網路,還熱衷分享她在美國採訪到的人和事,大家可以關注她的微信公眾帳號「王曦訪談」。

這次她專訪的是 Google Glass 技術負責人 Thad Starner 博士。

  • Google Glass 的起源,來自於上課抄筆記?

Thad 在 MIT 讀大學的時候遇到了一個難題:如果上課認真記筆記,他就無法很好地理解教授的意思,因為記錄占去了他所有的腦力;而如果不記筆記,只是認真聽課,他雖然能夠很好地跟上教授的思路,但是課後很容易就忘記了。

Thad 嘗試過使用電腦記筆記,但是眼睛從黑板和電腦螢幕之間的不停的轉換讓他很快選擇了放棄。也就是在那個時候,Thad 開始琢磨是否可以有這樣一個交互介面:既不影響面對面的交流,又可以隨時隨地記錄,那一年是 1989 年。

  • 想到就幹!Thad 1993 年就設計了一款智慧型眼鏡

1993 年,Thad 終於戴上了自己設計的第一代智慧眼鏡:左眼如常,但是右眼看到的卻是顯示器,左手握著單手鍵盤輸入,然後還要斜背一個用於裝主機的包。自那以後, Thad 每一天無論去哪裡,無論幹什麼,他都會戴著智慧眼鏡。

據 Thad 介紹,這個單手鍵盤輸入是他的一個好朋友發明的,並因此創立了一個叫 Hand Key 的公司。Thad 說單手鍵盤輸入比通常的電腦鍵盤輸入更容易學會,且熟練以後單手打字的速度與電腦鍵盤打字速度是一樣的。

當我問起這是否意味著今後人們的打字習慣需要改變時,Thad 說:「手機已經改變了我們打字的習慣。人們總是覺得改變一個習慣很難,事實上並非如此。我們現在使用的智慧手機是手勢控制加螢幕鍵盤。因此,只要可以得到方便,人們是願意改變的。目前的問題在於,真正使用移動智慧設備的人太少了。幾乎所有的智慧設備都是你需要停下來看著螢幕去使用(比如手機,你總是需要中斷談話,拿出手機來操作),而如果將來越來越多的人使用起真正的移動智慧設備,即你可以邊走路邊寫郵件,那麼這個單手鍵盤輸入很有可能會成為大家的選擇。」

在 1998 年舊金山的一個會議上,Thad 依舊戴著這套行頭,自然是享受著超高的回頭率。有兩個學生走過來和他打招呼:「Hey,我是 Larry Page,他是 Sergey Brin,我們是史丹佛大學的學生,你戴的是什麼東西?」

是的,你沒有聽錯,這兩位史丹佛大學的學生在不久之後創立了 Google,Sergey 目前擔任 Google CEO。在那次會議上,Sergey 給 Thad 留下了聯繫方式。

  • 2010 年時,Thad 同時為 Apple 和 Google 進行了智慧眼鏡的講座

時間一晃到了 2010 年,Google 正在大力推廣其 Android 系統,儘管 Thad 不知道 Sergey 當年的郵箱是否還在使用,他還是給 Sergey 寫了封郵件。

在郵件裡 Thad 說:「你們現在正在做 Android 系統和智慧手機,你真的應該看看我們在學術領域做的可穿戴式計算技術。你為什麼不來一趟亞特蘭大,我給你看看我的眼鏡。」

Sergey 回復說,「不,請你來加州,來 Google 做講座。」Thad 後來才知道,他發郵件前的兩個月,Google 剛剛開始籌備智慧眼鏡這個項目,因此這真是天賜的緣分。

我問 Thad 為什麼當時選擇了 Google 而不是蘋果,畢竟 2010 年應該是蘋果最牛的時候。Thad 說事實上,他在蘋果的朋友聽說 Thad 給 Google 做了一個講座,便也邀請他去蘋果做了講座,準確的說是做了兩次講座,一次是關於智慧手錶,一次是關於電腦手勢控制。

所以 Google 和蘋果在相同的時間是得到了相同的資訊的(賈伯斯是 2011 年去世的,至於為什麼蘋果沒有對智慧眼睛感興趣,請大家自行消化理解)。

  • 為 Google Glass 連結鍵盤,或許是未來改良的方式?

我又問起 Thad 為什麼當初不自己創業生產智慧眼鏡,Thad 說:「我有自己的公司啊,我現在就給你展示我們公司的產品。」這應該算是第二代智慧眼鏡吧,專為研究人員生產的,當時大概賣幾千美元,圖中的眼鏡是 Thad 在 ebay 上花 500 美元買回來的。

其實從這個智慧眼鏡上,我們應該已經可以看出 Google Glass 的一些原型,比如左眼鏡片前的成像玻璃螢幕。Thad 說這個智慧眼鏡的性能堪比一台電腦,當年他所有的筆記、會議記錄和郵件都是用這個眼鏡完成的。

目前的 Google Glass 是沒有鍵盤輸入的,所有的指令都是通過語音下達。Thad 為自己的 Google Glass 配備了藍牙連接的單手鍵盤,不知道這個會不會是今後 Google Glass 改良的一個方向。

Thad 介紹說智慧眼鏡的想法最早可以追溯到 60 年代。其實在 1945 年時,Vannevar Bush(二戰時期美國接觸的科學家,「曼哈頓計畫」的提出者和執行人)就已經有了一個想法:在你的頭上放一個小的相機,它可以拍下你做的事情,然後它會將所有關於你的資訊儲存起來供你將來使用。

「要知道,那是在 1945 年,甚至還沒有硬體呢,Vannevar Bush 只是大概知道電腦即將誕生了。而當我在 90 年代開始做這個事情的時候,我希望可以給它贏得一個更加令人尊敬的名字,所以我加入了增強現實技術(Augment Reality),我讓你可以看到更多的東西,而不是替代你的視覺。93 年到 99 年,我在 MIT 做這個,後來在喬治亞理工繼續做這個。我們實驗室裡的人每天會花上好幾個小時戴智慧眼鏡,所以我們可以非常瞭解這項技術。」

Thad 說他不是第一個產生智慧眼鏡想法的人,但卻是第一個每天都戴著,一整天都戴著的人,他是最堅持的那個人。這讓我想起訪談前,專門負責 Thad 的媒體邀約的 Jason 給我講的一個小故事:Thad 每天都戴著各種奇怪的眼鏡,所以大家都習以為常了,以至於沒有注意到其實他戴著第一代的 Google Glass 很久了,而那個時候,所有的媒體都在各種諜報 Google Glass 到底長啥樣。

  • 在 Thad 眼中的可穿戴式設備

王曦:對今年的 CES 大會上展示的可穿戴式設備有什麼評價嗎?

Thad:沒有什麼讓人感到特別驚喜的。其實我們最早就預測到第一個可穿戴式計算設備是電子音樂播放機。

我還記得那個時候我們向索尼音樂介紹說「我們可以將音樂壓縮到檔裡,這樣的可穿戴式設備會比 Sony Discman 小很多,卻和 Sony Discman 擁有一樣棒的音質。而且存儲量每 18 個月會翻一番,這樣用不了幾年,人們就可以擁有一個移動音樂館了,而且這個設備會越來越小。你們真的應該做這個東西。」

而當年的索尼回答道「我們剛剛買下哥倫比亞唱片,我們考慮過做一個快閃記憶體的(flash-based)音樂播放機,但是這會導致盜版,所以我們不打算這樣做。」(後來的 iPod 證明,索尼當年做了多麼錯誤的決定!)

電子音樂播放機是第一代可穿戴式計算設備,因為你不需要停下手頭的事情,所以它大大的增強了你的環境。接下來的就是藍牙測試集(Bluetooth Test Sets)。我們在 1997 年的第一屆可穿戴式計算大會上展示了導航地圖,如何做導航。這些東西現在都應用在了智慧手機上,事實上,智慧手機花了這麼長時間才出來,這真的是最讓人感到尷尬的。

(這個時候,Thad 的手機響了,他拿起手機看了半天,等重新回到我們的對話時,他忘記了剛剛說了什麼,於是他說「你看,如果在對話過程中拿出手機來看,這真的是一個非常大的干擾。而如果我使用智慧眼鏡的話,我就可以隨時處理資訊,同時又不會影響我們之間的交流。」)

王曦:你對可穿戴式設備的未來有什麼遠見?

Thad:事實上和是什麼設備無關,重要的是它能做什麼。如果它能夠很聰明,那將很吸引人。比如說,它知道你在哪裡,正在做什麼,它會在你需要的時候提供正確的資訊。像 Google Now,它現在就可以根據 GPS 的資訊知道你在哪裡,然後它會根據交通狀況提醒你下一個會議的時間,所以應該像一個聰明的助手一樣。

它將觀察你每天都做了什麼,並且把你經常去的地方進行分類,很快它將能夠識別出哪裡是家,哪裡是商店,哪裡是辦公室。它會發現你每天都是從家去工作、然後再去超市、然後回家,你從來不會從家去超市、再去辦公室、然後再回家。所以,它就會在你離開辦公室、上車之前提醒你去超市,以避免你開車上了高速錯過了超市。 

我覺得智慧手機最大的問題在於,你要把它放在口袋裡,所以它相當於聾的,半瞎的。而如果把設備放在你的頭頂上,它就可以觀察你,然後得到很多有上下文的對話資訊,這樣它才能説明你更多。像我這樣,在帽子上有一個相機。

我們發現,其實人類的很多行為活動都是和手有關。舉個例子,如果我想識別出什麼是一本書,如果僅僅靠書的封皮是很難的,因為這也可能是一幅畫,相機怎麼會知道呢?但是,如果相機能夠看到你翻開書,並且一頁一頁在流覽,那麼它就可以識別出這是一本書。

同理,它將識別出什麼是杯子,什麼是刀和叉子,慢慢的,它將識別出什麼是吃飯,因為你會在每天差不多的時間做一系列一樣的動作,因此逐漸的,它將學會人類社會是什麼樣。然後,它將會更好地為你服務,它會明白如何服務於你,什麼事情對你來說是重要的。我們做過一個非常酷的實驗,我們給這個帽子做同樣的手勢 500 次,它自動學會了這個手勢是什麼意思。所以,你不需要教它,它會自己理解的,這真的太酷了,這個趨勢非常有意思。

王曦:這是一個智慧帽子?

Thad:它現在有點破了,原來這有一個大大的鐳射。這個帽子更好看一些。瞧,這個更時尚些,我喜歡這個!這個手勢是黃色的意思。很酷的是,這個相機很高,所以它能夠看到我足夠多的手部活動,從而自行掌握每個手勢的意思。

王曦:所以,你認為將來每個人都會有一個助理嘍?

Thad:當然!舉個例子,日本公司的 CEO 的助理都是很高級別的人,他們通過當助理來學習如何成為一個 CEO,當然,這個助理薪水很高。所以,如果電腦成為我們的助理,這不是很棒嘛!

王曦:你覺得這個在未來 5 年或者 10 年會實現嗎?如果電腦可以做這麼多的事情,那我們人類還幹嘛呢?

Thad:這個很難估計,我認為可能會是很久以後。電腦的聰明和人類的聰明是不一樣的。電腦擅長回憶資訊,而人類擅長識別哪些資訊是好的。

舉個例子,我要做一個報告,於是我讓電腦幫我提供相關的資訊,它會搜索我所有的筆記、郵件和代碼,然後在我眼前的螢幕上提供所有相關的資訊,但卻無法很好地將這些資訊組織起來。但是,我只需要看一眼這些資訊,就可以馬上識別出哪些是有用的。

如果我問你,誰是你二年級的英文老師,你也許不記得了,但是你會記得你在二年級受過傷。所以,如果你問電腦這些資訊意味著什麼,它將不會回答。因此,人們需要的是智慧的助手,你通過符號與他們連接,然後它們就可以成為你延伸的一部分。

就像你戴著眼鏡一樣,你從來不會想著說我戴著眼鏡。或者,你騎自行車時,遇到紅燈會自然地刹車。我想要做的就是通過可穿戴式計算來延伸你的大腦。我們現在不需要背書,因為用穀歌就可以搜到書的內容。我們要讓智慧設備更加強大、更加獨立、更加聰明。

王曦:為了實現這些,目前最大的困難是什麼?

Thad:首先是電源,如何給設備裡的晶片充電。另外就是我們說的路徑識別(Pattern Discovery)。如何識別你是怎麼移動的,怎麼交流的。人類最基本的行為單元非常不同,現在沒有人花時間來好好研究我們每一天最基本的行為單元。到底吃飯或者握手最基本的行為單元是什麼,手勢實際上和語言同等重要。

我們正在做的就是建立發現人類基本行為組成單元的演算法,然後你又是每天如何將這些行為單元組合起來行動的。這是一個長遠的計畫,因為我們需要演算法明白什麼構成了你,它又是如何讓你和這個世界交流的。

王曦:這就是你說的 Symbolic Intelligence 對嗎?

Thad:是的。

  • 如何成為一名天才

我一直以來都對「你是如何發現自己喜歡做什麼的」和「是什麼成就了現在的你」這兩個問題感興趣,也是我在訪談中一定會問到的問題。當我問到 Thad 是如何這麼有創造力,如何成為天才時,他說了一個我從來沒有聽過的詞「filarious」。訪談後,我在 Google 上查了半天才知道這是一個俚語,即 fun(有趣)+ hilarious(歡鬧)的意思。

「你不怕別人認為你是一個傻子,很顯然,我不怕別人認為我是一個傻子(Thad 戴了 20 年形狀各異的眼鏡!)。有一句名言,我認為是 Linux Pauling(諾貝爾化學獎獲得者)的話,『有一個偉大的想法的最好的辦法,就是有很多想法。』你所需要做的就是不停的有想法,迅速地弄清楚它是否會失敗。真正的本事並非是想法,而是能夠評估想法,想出驗證它的方式,執行想法,這是最難的事情。這個東西,我弄了 20 年(Thad 指著自己戴的 Google Glass)。」

「把東西弄亂沒有關係,破壞了什麼東西也沒有關係,因為你會從中學到東西。探索這個世界沒有關係,變得 filarious 也沒有關係。有玩的意識非常重要。很多時候,你都是在幾十年之後才知道有些事情是非常重要的。讓你周圍充滿聰明的人,充滿同樣愛搞惡作劇的夥伴。真的,愛搞惡作劇就是你所需要的。我們很多的科研專案都是為了好玩,因為它聽起來酷極了。」

「12 歲的時候,我對電腦產生了興趣。14 歲的時候,我決定要成為 MIT 的教授。29 歲的時候,我拿到了 MIT 職位,但是我決定留在喬治亞理工大學,因為這裡更好玩。」

  • 延伸閱讀

把妹神器!男生一定要學會的 Google Glass 用法

最初的夢想和全新的冒險:Android 之父 Andy Rubin 要打造「真的機器人」!

(本文轉載自合作夥伴《36 kr》;圖片來源:《36 kr》。)

年後想換工作了嗎?

AppWorks Ventures 之初創投正在舉行「2014 冬季 AppWorks 聯合大徵才」,共有 27 家新創公司提出 64 個工作機會。

無論你是新手還是高手,也許未來最成功的舞台就在這:http://goo.gl/NvjFqf