Coursera 一年收集的教育數據,就超過了過去 5000 年所有的教育數據的總和

一個月前,Coursera 搬進了位於矽谷山景城的新辦公室,這裡的牆上大大地塗鴉著「先進的教育學(Advance Pedagogy)」字樣。

除了融資達到了 8500 萬美元的規模,Coursera 直指創收的 Signature Track 項目也處於健康的增長曲線中。 Signature Track 讓用戶可以選擇一套課程,完成後通過支付費用獲得證書。在 2013 年 7 月末開始這個產品後,達到第一個 100 萬美金收益花了 9 個月,隨後的 3 個月,這個收入就得到了翻倍,又三個月之後,這個收入數字變成了 400 萬,增長呈加速度。

就在自己的公司處於良好上升態勢之時,創始人 Andrew Ng(吳恩達)則宣布加入百度的深度學習研究院。 最近幾天,他正在密集地為百度面試人才,奔走於 Coursera 的新辦公樓和百度的新辦公樓之間。 他說,能和他多年的好朋友、著名機器學習專家余凱一起工作,他感到相當興奮。

在這個時間點上,從他對 Coursera 過去的設計、未來的構想,到如何運用網站收集的數據,到他未來更主要的職責 —— 百度首席科學家,PingWest 與 Andrew Ng 進行了一次獨家訪談。

以下 PingWest = PW 、Andrew Ng = Ng。

 PW:Coursera 最初的學習和教育模式是如何被設計出來的?

Ng:我做了很多事情,也經歷了很多迭代。2011 年的時候,我就開始思考 MOOC 運動,我在 2011 年建了 6 個網站,但只有 1 個最後呈現了病毒式增長,吸引了注意力。但其中的每一個都有後來的 Coursera 中的一些元素。

我和斯坦福的朋友花了很多時間嘗試哪些是可行的、哪些不行。 讓我來告訴你一些沒成功的,其中的一個網站是我們和高中合作,兩個人在那兒學習,我輸入我的名字和郵箱,你也輸入你的,我們可以同步一起看教學視頻、一起做測試。 這是個無比糟糕的點子,沒有人用這個網站。 因為人們更傾向於自個學習,例如你錯過了一些內容時,你想要停下來,而我想要繼續看視頻,這顯然是衝突的,人們都想要掌握視頻的控制權。

對我而言,MOOC 最重要的一點在於規模化。 在 Coursera 之前我就做了些關於眾包評分的研究,第一版 Coursera 的設計裡其實沒有同學互改作業這一功能,在那一版裡我教的機器學習,我朋友教的是數據庫分析課程,因為我們當時沒想清楚到底怎麼做才是最好的,一直到第二版的設計中才加入了它。

PW:你對 Coursera 的願景是什麼?未來的計劃又是什麼呢?尤其是邀請了耶魯的校長 Rick Levin 加入,Coursera 是否越來越像一所在線的大學?

Ng:今後,我的主要職責會是在百度,但我仍然會在 Coursera 全方位地幫助這個公司。我希望 Coursera 給每個人獲得良好教育的機會。 我認為教育給予你超級力量(Super powers)。 Coursera 未來不會變成一所大學,我們的大學合作夥伴在提供學位上做的已經非常好了。我們更願意成為一個平台,他們可以把內容放在上面。

Coursera 不會提供學位,我們做別的事情。擁有一個學位在你的簡歷上非常有用,但有一個 Coursera 課程的證書也能一樣有用 這種證書是一種專長的象徵。 我認為,教育變得更加得模塊化,學位是一整塊長達 4 年的項目,但我認為大多數成年人不需要一個 4 年全日制的教育,他們需要一門或者幾門課程。 所以教育會打散成模塊,我們在一個絕佳的位置去滿足這種需求。

 PW:在你看來,Coursera 是否在和大學競爭?

Ng:我如果讓你想一下你最喜歡的老師,你和她愉快的對話交流,我們可以用電腦代替她嗎?答案顯然是否定的,甚至去做這種嘗試都是很愚蠢的。

你最愛的老師畢生花了很多時間一年又一年地教授同一門課程、批改試卷。 我認為機遇是在於, 我們應該用技術來替代這些常規、重複的教學流程,這位你最愛的教授在未來就可以花更多的時間和學生交流對話, 就像她和你之間產生的火花一樣。 我不喜歡 MOOC 和教授們爭奪學生,MOOC 該做的是解放教職員工的時間,讓他們花費他們寶貴有限的時間來創造更多的價值。 75% 我們的用戶,是已經有本科學位的。這種帶有證書形式的學習,是對大學教育的補充。 你在大學學位上花了 4 年,那接下去 4 年呢?

如果一個 18 歲的孩子被北大錄取了,有人爭論到底是去上北大還是在家學習免費的北大課程的話,我肯定會說,去北大唸書去。 你可以獲得更多更美好的經歷和體驗。

 PW:你曾經說過,在線教育是均衡器,讓每個人都能享受到教育。但你又提到,Coursera 的用戶 75% 都有了本科學位。已經受到良好教育的人通過 Coursera 學習更多的知識,而那些更需要知識來改變命運的人,比如高中輟學生,卻並不是 Coursera 的使用者,這樣線上教育如何發揮「均衡器」的功能呢?

Ng:當我們說 75% 的人有大學學歷的時候,沒有說的那部分是,另外 25% 的人並沒有大學學位。我們覺得我們可以為這些人提供服務,真是太棒了! 就算 Coursera 只服務了 100 萬沒有大學學歷的人群,都在一定程度增加了社會公平。Coursera 服務了 565 萬大學及以上畢業生,這不影響我們也服務了那 195 萬沒有大學學位的人這個事實。

Coursera 使用者中,三分之一來自於發展中的經濟體。

我們即為來自發達國家的人群服務,也服務到了發展中經濟體的這些人群。 我在科技中看到的是,科技總是 「涓滴」的, 比如汽車、網絡,一定是有財富的人先使用上這些的。 但科技總是縮小差距的, 當智能手機剛出現的時候,有錢人先有使用機會,幾年之後的現在,有那麼多人都有智能手機了。

我們在做一些事情加速這個過程, 比如開發 Android 應用,我們發現,在貧困地區的人通常會花費很多時間在交通出行上,因此我們的行動端允許下載影片,讓他們在出行路上看。

PW:Coursera 在一些地區設立「學習中心(Learning hub)」,讓沒有網絡、甚至是沒有電腦的人群可以聚集在一起學習的項目,進行得如何了?

Ng:我們對這個項目取得的成績滿意。比如說在肯尼亞這個,是在孤兒院裡。 我們也和各地的美國政府部門, 比如領事館合作 他們會開放空間,來為當地沒有網絡的服務的人們提供 Coursera 的課程內容(總共和 30 個國家的領館合作,每個領館的教室數量在 10 – 70 個不等)。

這個項目最大的挑戰在於,每個學習中心的人數還相對有限。 在 Coursera,我們思考很多和規模化有關的問題。 現在我們有 770 萬學習者,50 萬在中國,每天都有 12000 新用戶加入。 我們試著讓自己的每個努力都可以規模化,這樣每個舉動都可以影響到更多更廣的人群。

PW:你們在中國找到了很好的伙伴,他們貼近年輕人、用戶是有受教育的群體。Coursera 在進入中國市場前做了一些什麼準備?

Ng:當時我們要開始全球化的擴展,我們用很多方式做了分析,哪些有著龐大用戶量的國家是否有很好的因特網接入?是否用戶的英語足夠流利? 是否有足夠穩定的寬頻服務? 我們從不同緯度做了調查,不管是哪一方面的調查,中國都在很顯眼的位置。 審視我們在中國的用戶呈現出來的規律,我們發現網絡是最大的問題,這是我們和網易合作的開始,把我們的一些影片放在中國。 我們的工程師團隊特地去中國驗證我們網站的運行速度,影片速度仍然相當得緩慢。

我們很幸運,果殼有一個討論社區,那上面已經有很多關於 MOOC 和我們的課程的討論。 事實上,我們不記得到底是誰主導了這個合作,好像是我們的一個員工認識他們的員工​​,然後開始對話的。 但我們確實發現他們和我們的價值觀一致,都相當地重視知識。

PW:怎樣看待中國這個市場?對於 Coursera 而言,有什麼獨特之處呢?

Ng:我們在探索中國用戶規律上仍處於非常初級的階段。比如,中國用戶在使用社交媒體上和美國人使用社交媒體非常不同。 我覺得我們還沒怎麼弄清楚呢。 關於課程認證,我們發現越來越多的美國雇主把 MOOC 認證當回事了,如果你有一個在線課程的認證,雇主會因此給你一個工作的。 在中國,這點仍然在推進之中,我們也仍然在研究如何向中國傳達這個信息。

最大的不同是語言,中文課程在中國和台灣更受歡迎。 不過,有趣的是,也有一些美國人在上中文的課程。 有件事是不斷地重複的:這個世界正在變得更加得接近。 另外一個中國和任何別的地方都不同的是,在中國,很大一部分 Coursera 用戶來自於大學。 在其他地方,大學生的比例比較低,在中國這個數字接近 50%。

PW:Coursera 收集的數據如何被用於理解人們的學習曲線?怎樣有效地促進有效的教育呢?

Ng:課程被電子化了,因此所有在 Coursera 上的活動都是電子化的。

你的每個動作都是可被追踪的到 —— 我們記錄每次點擊、作業、每個任務是否被正確批改修訂,我們知道你是不是在觀看影片的中途暫停,我們不僅知道你在討論組裡寫了些什麼,也知道你獲得的反饋。 正因為有大量的學生,每個學生產生的數據,讓我們收集到的學習數據數量達到了史無前例的程度。 就在過去的一年裡,Coursera 收集的教育數據,超過了過去 5000 年所有的教育數據總和 有了那麼多數據,我們就此和大學院校的研究院合作,來理解人類學習這件事。

比如說,如何去發現課程作業中是有錯誤的? 你有一個包含 100 道題目的測試,如果這些試題中有些本身題目有錯,你如何發現它? 你可能想,學生可能會答錯,確實。 但僅僅是很多學生答錯了,這不代表一個測試本身含錯,也許只是問題很難。

在 Coursera 的數據裡,因為學生做了很多的測試,我們可以知道哪些學生厲害,哪些有點弱,所以僅僅是因為問題比較難的話,厲害的學生答對的概率會更高。 對於檢測本身含錯的測試題,我們的標準是,強的學生並沒有比起弱的學生表現得更好。 這是更可靠來識別本身含錯試題的信號。 這是因為上千的學生做了測試,我們可以從數據的角度來測試。

PW:Coursera 的數據得出的結論是否對改進傳統課堂體驗會有幫助?

Ng:這有點像「翻轉課堂」的理念。如果你在史丹佛教 100 個學生,你沒有足夠的數據來得出結論。 線上課程,你一下教 50000 個學生,數據就可以用來幫助提升教學內容,來更好地教史丹佛那 100 個學生 用我舉例子,有成千上百個學生讓我可以很容易發現一些常見的謬誤。

有很多合作大學事實上從在線課程本身發展出創新來。 比如喬治亞理工物理學的 Micheal Schatz 教授,他想找出方案來改進實驗室課程。 他讓學生丟東西然後用手機影片記錄物體軌跡,學生可以逐個畫面地做分析來預測籃球落地位置,以此來學習牛頓運動定律。 每個學生的體驗都得到了提升。

(注:翻轉課堂(Flip Classroom)指調整課堂內外的時間,將學習的決定權從教師轉移給學生。學生主動基於項目進行學習,共同研究解決本地化或全球化的挑戰以及其他現實世界面臨的問題,從而獲得更深層次的理解。)

PW:是否大型開放式網絡課程(MOOC)由於參與人數眾多,也可以幫助一些教授完成他們的研究?

Ng:這不是線上公開課的主要用途,但是一兩個課程確實用到了這個概念。

線上公開課最珍貴的時形成了一個相互分享訊息的社區。 比如,有老師在教食品標籤的課時,讓每個學生都​​跑到超市裡去拍食品標籤然後放到討論論壇上,這個東西全世界都不一樣,很有趣。 你想想除了這裡,還有哪裡你能看到全世界各地的食品標籤呢? 對學生而言,他們看到了全世界各種不同的食品標籤,因為參與​​了課程,每個學生的體驗都得到了提升。 如果你只是在舊金山或者北京教課,你沒有辦法獲得如何豐富的有趣體驗。

 PW:Coursera 和你的本業,機器人、機器學習以及人工智能有什麼聯繫嗎?

Ng:有那麼一點,但是不多。MOOC 收集了那麼多數據,我們一直使用人工智慧和機器學習來分析這些數據,我剛剛說的這些故事都是使用機器學習的工具實現的,這是前所謂的教育數據,不過我不太可能把這些數據用在深度學習領域。

Coursera 有的數據非常獨特,我們有那麼多教育數據,在此之前沒有人收集過這些,我們發現即使是很簡單的分析都能發現相當有意思的結果。

 PW:加入百度之後,你對構建這個實驗室有什麼規劃?

Ng:人工智慧是非常資本化和集約化的,我們想造下一代的深度學習系統,需要許多相當昂貴的計算機、要具有性能良好的計算力,僱傭一大批人工智能領域的專家和電腦系統的專家。

教育和人工智慧都是非常讓人興奮的問題,但是有很多人都願意留在人工智慧領域。 很幸運,矽谷有很多人願意在人工智慧領域工作,余凱和張潼彼此是好朋友已經很多年了,他們在百度做的很多工作都非常讓人振奮,余凱做的很多深度學習的研究工作,比我見過的很多東西都要先進許多許多。 我和他也是好多年的朋友,將要和他一起工作讓我非常興奮。

對於中國公司拷貝美國公司的傳統固見已經過時了,你看許多中國的創新對中國是獨特的,美國的創新對美國是獨特的。 我們有兩個不同的生態系統。 美國的公司,平均而言,有著更成熟的技術,但我看到了很多在中國的創新,比如說余凱的深度學習項目。 我相信, 以後我們不再會說「中國製造」,而會說「中國創造」

延伸閱讀:

花 90 億台幣、找 Coursera 創辦人入夥,百度要在矽谷打造最前端的人工智慧實驗室

靠「大數據」顛覆傳統教育,線上教育讓壞學生想不愛上課都不行

兩大「軟革命」,讓線上 Coding 課程推動了美國教育的大巨變

(轉載自合作媒體《PingWest》)

當 Big Data 應用影響擴及至各領域,學習如何管理分析 Big Data 已成刻不容缓之勢,6/3(二)Computex 將舉辦一場免費的「Big Data 論壇」,讓你快速掌握全球 Big Data 趨勢動態!

馬上報名參加:http://goo.gl/cG1iz8

點關鍵字看更多相關文章: