深度學習巨頭楊立昆沒讀名校、研究非主流,他如何從非常規的道路通往成功?
圖片來源:Twitter

【為什麼我們要挑選這篇文章】深度學習三巨頭之一的楊立昆,出生於 1960 年,不像其他兩位巨頭進入名校就讀,又選擇在深度學習剛被提出的階段投入研究,甚至被人笑是「頑固的蠢貨」,他如何從非常規的路走向成功?

內容摘自《科學之路:人,機器與未來》,這是一本由楊立昆著作,從法文翻成簡體中文的新書,當中不僅記錄楊立昆的研究歷程,更分享許多他在人工智慧與深度學習領域的想法。 (責任編輯:何泰霖)

幾年前,人們還在讀《賈伯斯傳》,彼此間傳閱著賈伯斯 19 歲退學創辦蘋果公司的故事,討論著「成功的方法不止一種」。然而不到 10  年的時間裡,「成功學」的風向又回到考取名校、挑未來最有「錢途」的大學主修,到出社會找高薪工作,「成功」的道路似乎越來越狹窄,總結下來就是要人們不斷進修、不斷精進自己!

在他人瘋狂進修的時候,偶爾耍廢的你也是不是也開始擔憂自己:我是不是不夠努力?我會不會被社會淘汰?我這樣的選擇對嗎?

不考名校、不在乎精英光環,卻透過自己的堅持獲得電腦科學界的「諾貝爾獎」——圖靈獎,現任 Facebook 首席人工智慧科學家楊立昆(Yann LeCun),在他簡體中文版的新書《科學之路:人,機器與未來》中總結了他的勵志人生。他用親身經歷證明,從激烈的考試競爭進入名校、追逐當下被認可的潮流、做所謂的「社會精英」…這些從來都不是成功的唯一途徑。

非名校出身的楊立昆,如何在人工智慧領域成名?

深度學習三巨頭。圖片擷取自:Youtube

楊立昆與傑佛瑞·辛頓(Geoffrey Hinton)、約書亞·班吉歐(Yoshua Bengio) 並列「深度學習三巨頭」,他們共同獲得了2018 年的圖靈獎。圖靈獎是電腦科學領域的「諾貝爾獎」,獲獎者都在電腦科學領域做出了重大、先進的技術貢獻。

然而,與從劍橋、麻省理工畢業的辛頓和班吉歐不同,楊立昆並沒有名校的加持,但也正因如此,他的求學經歷和對教育的理解,對於重視名校光環的東方家長們非常具有啟發意義。

楊立昆是法國人。在法國,如果要想成為任何一個領域的精英,通常都要進入招生人數非常少的高等專科學校,而為了考入這些錄取率極低的學校,法國學生又要先花兩年時間學習大學先修課程。但楊立昆卻選擇了一條與眾不同的求學道路,他高中畢業後就直接進入了一所名氣不大的大學——巴黎電子工程學院(ESIEE)學習。

楊立昆做出這樣的決定有兩個原因:其一,這所大學不需要參加先修課程的學習和考試就能直接申請;其二,在這所學校他可以獲得更多的學習自主權。他用自己的經歷證明:與其選擇社會標準下的精英道路,不如選擇與自己的實際情況和長期想追求的目標相符的道路。

楊立昆在人工智慧領域的研究生涯,可以追溯到他在大學時的廣泛閱讀。在他讀書的年代,人工智慧是一個新興的、發展並不成熟的研究領域,他對此有非常大的興趣,並且閱讀了很多科學家的論文著作,特別是俄羅斯偉大的數學家、機率論的奠基人安德雷·柯洛莫高夫等人的著作,也因此為他打下了堅實的數學基礎和電腦科學理論基礎。

也是從大學開始,楊立昆就沉溺於人工神經網路的研究,並且敏銳地注意到該研究領域一個新的技術方向——神經網路的反向訓練。後來他進入到當時的巴黎第六大學(現今的索邦大學)攻讀博士學位,並且在反向訓練上取得了卓越的成績。他的成果很快就有了法國一家公司買單,而且讓他得以進入當時學術氛圍非常自由的貝爾實驗室工作。

楊立昆用自己的經歷告訴我們,接受教育重要的是獲得知識本身,而不是獲得名校的光環。在以後的學術生涯中,楊立昆一直保持這種特立獨行的做法,特別是在全世界都不看好人工神經網路這個研究領域的時候,他依舊堅持自己的理想與信念,持之以恆地投身到這項研究當中。

堅持感興趣的事情,儘管被人笑「頑固的蠢貨」也不放棄

Yann LeCun

圖片擷取自:Youtube

深度學習的探索之旅並不容易,對於完全基於邏輯和手寫程式的人工智慧擁護者說他們會失敗,傳統機器學習的捍衛者更是公開指責他們。可是事實上,楊立昆研究的深度學習僅僅是機器學習這個廣闊領域中的一套特殊技術而已,這背後的思想,可以追溯到上個世紀 40 年代。當時,學者們開始嘗試建構一套新的計算系統,希望以近似於人類大腦的方式儲存和處理訊息。

深度神經網路在 1980 年代就已經被提出,但在最初的成功過後,因為它本身訓練的複雜性、結構的不確定性、對數據量的依賴性、理論的不清晰性等,在 2000 年初的一段時間逐漸被更加有理論依據的 Probabilistic Graphical Models 等取代。當時仍專注於深度神經網路的學者,被認為是人工智慧學界的少數派,而日後被稱為「深度學習三巨頭」的楊立昆、辛頓和班吉歐就在其中。

楊立昆和辛頓、班吉歐回憶起自己在這段時間的堅持,笑稱這是「deep learning conspiracy」(深度學習的陰謀期),而自己是 Canadian Mafia(加拿大黑手黨)。楊立昆在當時堅設計出了一個簡單的人臉識別系統,但他的成果並沒有引起太多科學家的重視。

從 2003 到 2013 大約十年的時間裡,以楊立昆為代表的這一小群「頑固分子」仍在默默堅持著研究各種人工神經網路的算法,特別是卷積網路算法(CNN)的研究,不怕被視作「蠢貨」和「少數派」。正是這些研究成果,奠定了今天深度學習算法的基礎。

但是從 ImageNet 的成功開始,神經網路,或者說「深度學習」, 開始以飛快的速度在各個領域展示出它的優勢。感知領域是最先被征服的:讓電腦能理解只有人才看得懂的圖片,聽懂人才聽得懂的聲音,讀懂人才讀得懂的文字。從此基礎延伸,人工智慧算法迅速在其他領域嶄露頭角,例如棋藝 AlphaGo、遊戲、自動駕駛、人工智慧醫療、公共服務等領域。可以說,今天人工智慧已經成為一門「顯學」,成為任何技術領域都該了解的一個熱門工具。

楊立昆等人的工作也因此被全世界矚目,2019 年3 月,他和辛頓,班吉歐一同獲得了電腦科學領域的最高獎——圖靈獎。

如果要總結楊立昆的成功經驗,可以用這樣四句話來概括:

1. 求學的根本是為了知識本身,而不是文憑
2. 廣泛地閱讀專業著作,培養自身的科學品味
3. 特立獨行,做自己感興趣的事情,即便那件事在短時間裡不被人看好
4. 長期的堅持。

追隨聰明人,不只發展新機會也提升自我能力

楊立昆的工作方式與許多科學家完全相反。他經常憑直覺工作,其次便是受到數學的啟發而工作。他會在腦中設想一些極端情況,也就是愛因斯坦所說的「思想實驗」,即設計一個場景,然後嘗試設想其後果,以便更好地理解問題。

但在現實生活中,他與許多人工智慧科學家都是同路人。他們有時合作無間, 有時又各自獨立研究,但互相之間從未停止交流,這也使得他能夠在一群富有研究熱忱的群體當中佔有一席之地。

楊立昆曾說自己喜歡鑽到一群比自己聰明的人群裡,因為他自認在很多方面根本沒什麼天賦。

楊立昆職業生涯的轉折點也出現在一場聰明人的聚會上。1985 年 2 月,在阿爾卑斯山萊蘇什舉辦的研討會上,他遇到了當時世界上對神經網路感興趣的頂級專家,他們有物理學家、工程師、數學家、神經生物學家和心理學家,尤其還有貝爾實驗室新成立的研究神經網路小組成員。

在當時,貝爾實驗室在科學界是宛如神話一般的存在。得益於這場研討會的相識,在三年後,楊立昆被該小組聘用。

此後,在楊立昆還只是個學生的時候,另一位聰明人——也是「深度學習三巨頭」之一的辛頓邀請他做了一場報告,並介紹說楊立昆發現了反向傳播算法。楊立昆在書中回憶:在一次晚餐時,辛頓跟我說,他將在一年後離開卡內基·梅隆大學, 加入多倫多大學。他問我願不願意成為他的客座研究員。我回答:「當然了!這一年時間正好能讓我完成博士論文。」

2013 年,楊立昆又加入了一個聚集大量優秀學者的團體——Facebook 的研究部門FAIR 。楊立昆在 Facebook 工作期間,一方面建構 Facebook AI 的工程基礎,一方面也參與和見證了 Facebook AI 給社群帶來的各種成果,例如 ResNeXT、Detectron、 FAISS 等算法,以及 ONNX 業界模型標準等。

「沒有天賦」的楊立昆在追隨一群聰明人的旅程中,孜孜不倦地追尋著人工智慧的本質,最終自己變成了人工智慧的先驅——這也不失為另一種「天賦」。

工作、研究上也遇到 AI 、深度學習技術難題嗎?來 2021 AWS 台灣雲端高峰會看產業專家實例分享,也有一對一專家即時諮詢!

楊立昆眼中的人工智慧與深度學習

楊立昆 8 歲的時候看過一部電影——《2001 太空漫遊》。影片裡出現了他所熱愛的一切:太空旅行、人類的未來以及超級電腦 HAL 的出現。此後,他對人工智慧的興趣越來越強烈。大學期間,楊立昆慢慢發展了自己的 AI 研究理念:以邏輯的方式無法建構真正的智慧機器,必須賦予機器學習的能力,讓它們能以經驗為基礎進行自我建構。

透過大量的文獻閱讀,楊立昆發現科學界不止他有這種想法,他注意到了福島邦彥等同道學者的研究成果,並開始思考提高新認知中心神經網路效率的方法。

1989 年,在電腦科學還處於開啟步的年代,楊立昆開發的神經網路 LeNet 就已經被用在全美國的郵政系統中,來讀取每一封信件上面的郵政代碼。

但在上世紀八零年代,對於那些仍執著於神經網路研究的學者,科學界把他們視為狂熱的瘋子。

如今,在大量可用的數據庫和工具的推動下,以深度學習為代表的人工智慧技術反而是最有發展前景的。楊立昆的名字也與深度學習技術——卷積網路密不可分。卷積網路源自於哺乳動物視覺皮層結構和功能的啟發,能有效處理圖像、影片、聲音、語音、文本和其他類型的訊號。

楊立昆在新書《科學之路:人,機器與未來》中,放棄了艱深華麗的專業術語,而是選擇更為直接有效的方式,透過真實的案例與自身體會,用簡樸又不失雅趣的語言講明了今天人工智慧的本質:數學公式+計算能力+大量的數據。

想弄清楚人工智慧的本質,首先,我們要將圖形辨識等問題轉化成數學公式。從實現的方式過程來看,電腦的智能完全不同於人類的智能。但從結果上來看,是與人的智慧等價的。

也可以稱這是兩者是「殊途同歸」。楊立昆用了一些典型的圖形辨識例子告訴我們,人工智慧是如何實現的,讀者朋友即便對裡面的公式細節不感興趣,也能體會到人工智慧和人的智能之間有何不同之處。

不過,電腦在獲得智能的方法上,有一點和人是相同的,那就是從觀察到的現像中總結出規律,然後用規律來預測現象。楊立昆在書中舉了伽利略研究速度的例子,伽利略透過觀察,找到了物體運動的規律並且將其變成了數學公式,然後再把這個公式應用於計算各種運動物體的速度。機器學習也是如此,只不過機器學習的公式不那麼直觀。

接下來,就需要獲取數據,供電腦進行學習。在任何人工智慧的應用領域,原始的數據,比如圖像本身是無法直接提供給機器學習的,這中間要進行一個轉化。這個轉化的過程被稱為特徵提取,簡單來說,就是將真實世界的目標對象轉化成電腦能夠讀懂的數據。

楊立昆博士用圖形辨識的例子說明了特徵提取是如何進行的。當然,如果讀者朋友不想關心具體的步驟,至少需要明白一點,那就是電腦學習需要大量的數據。

當數據量大了之後,就需要足夠複雜的數學模型才能反映出大量數據之中所包含的各個細節。雖然奧卡姆剃刀原理通常很有效,但是在機器學習領域並非如此。事實上,過去以人工神經網路為基礎,發展出來的機器智能標準之所以不高,就是因為那個網路過於簡單。

因此,楊立昆等人提出了更為龐大而複雜的深度學習人工神經網路。於是這就有了第三個問題——計算能力的問題。楊立昆博士對這部分內容沒有做太多的論述,畢竟這部分工作主要是由 Google、Facebook 和亞馬遜等公司的工程師完成的,而非是科學家關注的重點。

《科學之路》中最有價值的部分,還是楊立昆博士作為深度學習算法的發明人之一,講述他自己是如何思考機器智能的問題,又是如何將這種現實世界裡的具體問題轉化為電腦能夠處理的問題。從這個角度上來看,《科學之路》又是一本教科書,教大家如何思考科學問題。

本文摘編自中信出版集團《科學之路:人,機器與未來

延伸閱讀

【科技巨頭後宮爭鬥史】Google 為實現 AI 夢,當年曾花 12 億與百度爭奪「深度學習之父」
神人工程師不只用 C 語言建 SQLite 資料庫,現在還用一個檔案寫出網路伺服器
「我可能 35 歲就做不下去了!」工程師這工作可以幹一輩子嗎?

(本文經 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈追求知識而非光環——圖靈獎得主的反內捲人生〉;首圖來源:Twitter。)