【我們為什麼挑選這篇文章】大家一定很常在免費圖庫下載圖片、申請成為會員時,看到「我不是機器人」(I’m not a robot)的勾選方框,那你知道它是怎麼演變來的嗎?這種用來區分用戶是機器還是人類的程式,是由一位電腦科學家 Luis 所開發,而他同時也是線上語言學習平台 Duolingo 的創辦人,如此多方發展 Luis,他的思維是什麼呢?(責任編輯:賴佩萱)

Luis Von Ahn 是一位才華橫溢的數學教授,我們登錄新網站或 APP 時經常用到的驗證碼(CAPTCHA),還有一款語言學習軟體「多鄰國(Duolingo)」,都是他創建的。

就連比爾.蓋茲都花了 45 分鐘才說服當時年僅 20 多歲的瓜地馬拉數學教授 Luis 去微軟工作。

日積月累,小事成就大事

顯然,Luis 和微軟是一個爆炸性的組合,驗證碼正是 Luis 的創意。而這個創意誕生一周後由雅虎實施,幾年後被谷歌收購。Luis 的第二個孩子「多鄰國(Duolingo)」則在推出兩年後估值達到 2000 萬美元,現今已達到 15 億美元。

對我們這些普通人來說,只是花幾秒時間填寫一下驗證碼(單詞類),卻不曾想到我們每年竟然能在無形當中完成 230 萬本圖書的數位化。對我們來說,Duolingo 也是一個學習語言的平台,沒想到原來用戶在學習過程中就幫助 Duolingo 賺了錢,因為憑藉大家的力量,幾週內就可以將 CNN 和紐約時報多年以來的全部內容翻譯成其他語言,然後向這些新聞機構要翻譯費。

看,這些都是 Luis 想出來的。

為 Yahoo 解決問題,CAPTCHA 就此誕生

有一天,一位雅虎的頂尖研究人員兼人才偵察員來到 Luis Von Ahn 的學校,做了一場題為「雅虎最難解決的十個問題」的演講。他們的問題之一,是垃圾郵件發送者會使用自動軟體創建數以百萬計的假電子郵件地址,然後將廣告一堆堆地發送出去。雅虎相當於是本世紀初的谷歌,以技術為導向的年輕 Luis 立刻開始著手解決這項工作。

其實解決方案很簡單。Luis 的一位博士同學告訴他,電腦很難看懂手寫或者打印出的文本。一個人或多或少能讀懂一張模糊圖片裡潦草的手寫筆跡,但軟體永遠無法與之匹敵。因此,只有非常專注的人,才可以通過驗證碼的考驗。

CAPTCHA

雅虎一周內就實現了這項功能,Luis 完全可以憑此接受一聲「謝謝」。

但 Luis 是一個對自己要求極高的人,他無法接受讓人類每天浪費 50 萬小時來填寫驗證碼。畢竟每天 50 萬小時是一大筆時間,應當好好利用。

填填驗證碼竟完成 230 萬本書的數位化

很快,一個契機出現了。archive.orgs 和谷歌圖書花了大量時間將舊書、文章和文檔掃描轉換成數位化的電子版本。書籍是由單詞組成的,單詞又是由字母組成的,驗證碼也是如此。

簡單來說,之前的驗證碼版本是模糊的數字和字母組合,新版本則是讓用戶辨別兩個單詞,這兩個詞都出自那些已經掃描過的文檔或書籍。

reCAPTCHA

第一個單詞出自公司通過掃描已經確定下來的那部分詞彙,它是用來測試用戶是否是人類的。而第二個單詞是從他們還不確定的那部分詞彙裡選出,一旦有 10 個用戶輸入了某個相同的單詞,他們就知道這是正確答案。

通過這種方式,reCAPTCHAs 每年可以將 230 萬本舊書數位化成可編輯、可搜索的網路文檔。後來,谷歌買下了這家公司,這筆收購的錢足以讓 Luis 這輩子都不用工作了,而他唯一要做的就是在谷歌待上 3 年。但是他沒有。

Luis 拒絕 Google 高薪,成立線上免費語言學習平台

對於一個出生在平均月薪只有 200 美元的國家的人來說,教育是一個令人痛苦的話題。雖然學習平臺本來應該為公民提供平等的機會,但往往反而會讓貧富差距變得更大。因為學習平台把人分成了兩類,一類是有 500 美元可以花在英語課程上的人,另一類是根本沒有 500 美元的人

Luis 說,人們在學習了英語之後,收入往往會翻倍。僅在中國就有 4 億人學習英語——這幾乎是美國和英國人數的總和。除了那些顯而易見的工作原因,還有更多潛在的力量在起作用。

互聯網上的大部分內容都是英文的,這意味著只有懂英語的人才能接受教育。YouTube 上的耶魯課程、解說型視頻、亞馬遜圖書、新聞網站、博客——我們可以停下來想想,真正被翻譯成我們自己語言的東西是多麼的少。比如,世界上有 4.37 億人說西班牙語,但維基百科中的西班牙語只有英文版的 20% 左右。

所以當 Luis 決定用他的智慧為此做些事情時,他與一個叫 Severin Hacker 的人合作了。他們旨在為世界上大多數人創造一個免費學習語言的途徑,為所有可以上網的人提供一個大眾化的學習平台

免費服務要怎麼營利:集結用戶的「翻譯練習」

Luis 已經成為一位經驗豐富的企業家,他知道這個免費的應用程序需要有一個賺錢的方式,畢竟他的資金不能永遠為新公司提供支撐。這個軟體必須從一開始就自給自足。Luis 僱傭了那些熟練使用驗證碼的技術人員。他一邊讓用戶上課,一邊讓用戶為他賺錢

在 Duolingo 學習任何一種語言時都不會隨機分配單詞。有時候,是隨機分配一個句子來翻譯;還有些時候,句子不是隨機的,而是節選自 Duolingo 眾多客戶的某篇文章——比如 CNN 和紐約時報。

學習外語的同時也在翻譯新聞

顯然,一個語言學習者絕對不是合格的翻譯。為了確保翻譯結果是正確的,Duolingo 會用類似驗證碼的幕後技術來「點石成金」,將 10 個業餘翻譯變成一個專業翻譯,最終的結果甚至可以和一個訓練有素的翻譯翻出的結果沒有區別

除了最初的技術成本,Duolingo 可以說是「免費」的翻譯。如果《紐約時報》為每個字的翻譯支付 0.10 美元,同時還必須花費人力資源來管理翻譯過程,那麼 Luis 就能以每字 0.05 美元的價格提供翻譯。只要有足夠多的用戶訂閱 Duolingo,它甚至可以在幾天內翻譯出一年的作品 ——這將為 Luis 和他的合作夥伴帶來 42000 美元的收入。

Duolingo 持續更新,走訂閱制就是要提升用戶黏著度

Luis 表示,翻譯是一個棘手的行業,世界上總會有一個翻譯願意以半價接手你的工作。此外,Duolingo 本身也開始變得更像一家翻譯公司,而不是教育公司。基於這些原因,Duolingo 現在正在走傳統的訂閱路線。

雖然 Luis 並不喜歡談論他是如何在市場營銷方面發展 Duolingo 的,但是,就像其他偉大的創始人一樣,他在獨特的核心機制上確實花了很多心思。

課堂上,學生更像是必須認真聽課的「人質」。而 App 卻還要與 Instagram 或 Facebook 這些終極對手爭奪學生的注意力。為此,Luis 和他的合作夥伴花了 10 年時間來完善每一個彈出窗口、每一個通知、每一種字體和每一種聲音,只是為了捕捉用戶的專注力。

Duolingo 使命:打破學習的限制,在家學習一樣有效率

作者表示,他第一次用 Duolingo 練習中文時,正坐在一家他從來沒有去過的咖啡館,但他一杯咖啡都沒有喝。即使有時間可以消磨,他仍然專注於 Duolingo 的學習。

一周後,他發現自己在同樣的時間路過了這家咖啡館。Duolingo 讓他開始主動地去學幾個新單詞。後來他才意識到這正是他第一次用 Duolingo 進行學習的地方。

Duolingo 的決策者們對更加廣泛的教育領域也充滿了雄心壯志。對於發展中國家的聰明學生來說,雅思或託福這樣的認證考試是一個特別痛苦的障礙。不僅學習和考試要花錢,還常常要花好幾個小時才能趕到考試場所。為此,Duolingo 正在悄悄地制定他們自己的標準化考試,並被一個又一個的學習機構所接受。

Duolingo 主要宣傳的點是:他們比教室更好。雖然我們對這些數字半信半疑,但 Luis 說,一個學生在 Duolingo 上用 32 小時就能學會普通學生在校一個學期的語言。他用 A/B 測試來解釋這一現象:老師們經常為了讓學生掌握副詞而不斷練習,Duolingo 則積極測試不同的學習方法,看看哪一種效果最好——比如應該先學習複數還是代詞。

但 Luis 關注的不只是語言。對他來說,每一個能夠大規模移植到數位世界的學習過程都是值得追求的,而任何方式——包括通過電影字幕學習——都是可行的選擇

(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為〈數學家的億萬商業王國:先後創建“驗證碼”和“多鄰國”,20 歲就被蓋茨親自挖去微軟〉。)

你可能會有興趣