Screen Shot 2016-06-06 at 12.29.05 AM

對亞馬遜員工來說, 要對行政總裁貝佐斯 (Jeff Bezos) 說他錯了, 永遠是 個令人畏懼的提議。

然而在 2014 年秋天, 幾位在亞馬 遜開發新款語音控制音箱的員工覺得, 他們有必要勇敢地面對這位行政總裁。 這款音箱的發佈時間日益臨近, 基本上 一切進展順利。產品外觀看起來不錯, 內置語音辨識軟件進步迅速, 就連發貨的包裝箱也都設計生產出來了。可是還有個棘手的問題, 那就是印在包裝箱上的產品名字:Amazon Flash。

據兩位前僱員說, 許多在亞馬遜硬件部門 Lab126 工作的人都討厭這個名字, 貝佐斯卻很喜歡。還有另一件令人擔心的事情。這款產品的核心功能是「喚醒詞」, 用戶說出這個詞, 就會喚醒音箱, 接收語音指令。當時有兩個喚醒詞在考慮之中, 其中一個是「Alexa」, 而貝佐斯認為「 Amazon」是最好的選擇, 這帶來了難題, 因為人們 總是說到這個詞。

Lab126 內部普遍認為, 這即將迎來潛在的災難: 這些音箱會被電視上的亞馬遜廣告「叫醒」, 然後開始隨機網購。通常來說,Lab126 的工程師和產品經理在找到貝佐斯前就會平息內部異議, 而不是堅持告訴老闆, 員工認為他需要知道的事情。但這次例外。貝佐斯最終聽從了員工的建議: 這款產品將命名為 Echo, 喚醒詞為「Alexa」。使用者現在可以根據自己的喜好, 選擇把喚醒詞改為「Amazon」或「Echo」。印有「Amazon Flash」的包裝箱被銷毀, 第一批音箱在 2014 年 11 月正式出貨。

在長方形觸屏設備主導的高科技工具領域,Echo 具有與眾不同的特質。這款音箱呈圓柱形, 沒有配備顯示幕, 高度超過 9 英吋 (22.86 釐米), 直徑 3.25 英吋 (8.25 釐米), 可以播放音樂, 也能回答普通的家常問題, 比如杯子裡放有多少把茶匙。使用者可以通過語音與 Echo 互動, 它可以隨時傾聽喚醒詞。

這款產品推出後, 批評者紛紛對亞馬遜冷嘲熱諷。有人說這是沒用的噱 頭, 也有人把這款音箱視為亞馬遜專制傾向的證據。接下來發生的事情卻很奇怪: 人們喜歡上了這款產品。亞馬遜從來不公佈產品銷售數據, 但消費者情報研究合作夥伴 (Consumer Intelligence Research Partners) 最近發佈的報告顯示, 亞馬遜已經售出了 300 多萬部音箱, 其中 100 萬部是在 2015 年聖誕購 物季期間銷售的。約 3.5 萬用戶在亞馬 遜網站上點評了這款音箱, 平均得分 4 . 5 分 (滿分 5 分 )。

也許對亞馬遜來說, 幾十位獨立開發人員為這款音箱語音控制功能編寫程式的過程更加重要。你可以使喚 Alexa 關燈, 詢問你的汽車裡還有多少油, 或是訂購薄餅。考慮到亞馬遜最初在語音控制領域遠遠落後於蘋果和 Google, 這款產品讓人大為驚歎。剛面世時, Echo 也許像是不必要的玩具, 不過現在看來像是亞馬遜的策略, 通過人們與電腦和互聯網的交流互動, 成為全新時代的默認選擇。

貝佐斯 4 月在給投資者的信中寫道,「我們希望既是一家大公司, 也同時是一個發明機器。」亞馬遜實現這個目標後, 世界會是什麼樣子? Echo 展現了這樣一個世界。貝佐斯拒絕了採訪要求, 不願討論這款音箱的開發過程,

不過有 10 位亞馬遜現任和前任員工同意接受採訪, 大多數人沒有透露姓名, 因為他們沒有得到公司的許可。下面就是他們打造這款產品的真實故事。

2004 年, 亞馬遜創立了 Lab126, 負責開發 Kindle 電子閱讀器。實驗室的名字意指英文字母表,1 代表字母「A」,26 代表「Z」。實驗室的員工有時會把 Kindle 稱為 A 項目, 把 Fire Phone 手機稱為 B 項目。而 D 專案, 也 就是 Echo 的開發工作始於 2011 年。在 這個項目的高峰期, 有幾百名員工在西雅圖、三藩市灣區和麻塞諸塞州劍橋為 D 專案工作。

Echo 的創意可以追溯到 C 項目, Echo 的許多早期員工都是來自 C 項 目。亞馬遜依然不想讓外界知道這個專案, 儘管該項目的開發工作已經終止。不過, 我們可以從 Lab126 工程師提交的專利申請中揣測這個創意當初 的開發重點和範圍: 第一次專利活動出現在 2010 年 12 月 21 日 和 23 日, 當時 Lab126 的員工申請了 5 項專利, 所有專利的名稱都包括「擴增實境」(Augmented Reality, 簡 稱 AR) 這個詞。不過後來, 擴增實境項目停止, Echo 成長為獨立項目, 旨在打造一款不太大眾化的商業產品。

按照最初的設想,Echo 要比目前這款音箱功能更簡單、價格更便宜。 一位參與過 Echo 項目研發的員工回憶說, 亞馬遜原本預計能夠以 17 美元左右的成本生產這款設備, 售價定為 50 美元。現在, 這款音箱的售價為 180 美元, 考慮到包裝、運輸和行銷成本 等因素, 外界認為亞馬遜在虧本出售。 該公司拒絕對此發表評論。

當時, 外界還不清楚這款音箱的主 要用途是什麼。當然,Echo 可以播放音樂, 可是使用者為什麼需要一款可以與人對話的音箱? 貝佐斯有很多創意。

「關於這款音箱的功能有著幾乎非理性的預期,」當時在 Lab126 工作的一位員 工說,「貝佐斯的願景是把音箱完全整 合到購物體驗的各個環節中。」

亞馬遜聘請了幾位曾在語音辨識 公司 Nuance 工作過的員工, 收購了兩家從事語音應答行業的初創企業 Yap 和 Evi。劍橋的工程師致力於打造可與 Google 或蘋果產品相媲美的語音識別系統。考量到 Google 和蘋果透過為其智能手機軟件構建服務取得的領先優勢, 這是個艱巨的任務。

在亞馬遜工程師開始研發這款音箱 後, 他們意識到, 這款產品需要比他們的預期更強大的處理能力。他們把微控制器 (用於控制遙控器等設備的簡單電腦) 換成了可以處理更複雜任務的微處理器。就在進行這些根本性變革的同時, 實驗室的主管們還相信, 這 款音箱的上市幾乎萬事俱備。連續 3 年 的時間, 這款產品都預計在 6 個月內出貨, 而 50 美元的目標售價則越來越不切實際。

Echo 在最後的研發階段經歷了幾次關鍵性轉變。這款音箱必須在播放音樂的同時傾聽指令, 這是工程師在開發過程中始終面臨的挑戰。如果音樂聲太響, 聽不到人的聲音指令怎麼辦? 在早期研發過程中, 工程師打造的原型音箱體積更小, 外形酷似冰球。人們要是離主音箱太遠, 這款小音箱可以放在家裡的各個角落傾聽指令。實驗室的主管擱置了這個想法, 專注於主音箱的開發, 但是最近這款設備再次出現, 成為亞馬 遜 3 月份推出的新產品 Echo Dot, 目 前僅限量發售。

2014 年秋天, 對 Echo 音箱本身的聽力是否足夠出色, 開發人員依然存在爭議。貝佐斯及其副手堅決反對其他任何輸入形式, 認為只能使用音箱內置的語音控制功能。他們覺得其他形式都是在作弊。有些工程師不這麼看, 他們主張配備一個遙感裝置, 讓人們在家中任何角落都可以發出指令。幸運的 是, 這家公司剛剛為 Fire TV 打造了類似的遙控器。於是雙方都做出了讓步, 同意為首批音箱附贈遙控器。遙控器可以收集使用者使用頻率的資訊, 從而對產品做出相應調整。這種擔心顯然有點 過了頭。在自然環境下使用 Echo 的用 戶從來沒有用過遙控器, 在此後發貨的包裝箱裡, 遙控器不動聲色地消失了。

到 2014 年年底, 把 Echo 與其他公 司生產的網絡照明設備和恒溫控制器連接起來, 才成為 Lab126 內部關注的重點。有位工程師突發奇想, 將這款音箱用作串流媒體電視的語音控制器。 一位直接與貝佐斯共事過的員工稱, 這對貝佐斯來說是個靈光一現的時刻,「這是他會積極採納的想法。」如今亞馬遜主要想把 Echo 音箱打造成所謂的智能家居樞紐。

亞馬遜設備高級副總裁林普 (Dave Limp) 開玩笑說, 早晚有一天, 某個腦洞大開的研發人員會編出程式用 Echo 語音控制功能來沖馬桶。

借助 Echo 音箱, 亞馬遜已經找到了參與消費者與其他設備和服務互動的方式。這是個絕妙的時機。科技行業一直在尋找繼手機後的下一個大計算平 台。外界對投資結合語音控制和人工智 能的產品仍很謹慎, 尤其是考慮到其他公司也還沒搞定這個領域。蘋果、Google 和微軟都有自己的虛擬助理, 但是他們都把虛擬助理作為提高智能手機使用效率的手段。Echo 音箱與這種做法大為不同。

Alexa 擁有 500 多項「技能」, 亞馬遜用這個詞代表打造語音控制功能的軟件程式, 這些控制功能可以讓音箱幫你查詢銀行存款餘額, 開始播放 Pandora 網絡電台的音樂, 或是發出你孩子最喜歡的動物叫聲。亞馬遜有一份內部清單, 上面列出了客戶對新控制功能提出的建議, 根據受歡迎程度對每個控制功能進行排名, 以確定該公司實現控制功能的順序。

研究公司 Forrester Research 的分析師阿斯克 (Julie Ask) 認為, 亞馬遜的下一個重要任務是開始用全新方式捆綁各種服務。她說, 現在通過 Echo 叫輛 Uber 很有趣, 但是功能會日漸強大。「5 年後, 我的 Echo 會說, 嘿, 去 機場的時間到了, 我要為你叫車嗎? 我只要回答好就行,」她說,「這是未來 Echo 努力的方向。」

— Joshua Brustein、Spencer Soper; 譯 孟潔冰