機器學習學語言太笨?研究提議用爸媽教孩子「學說話」模式,取代填鴨式訓練

 

【為什麼我們要挑選這篇文章】在訓練機器學習的「語感」時,通常都是一次丟出大量的語言資料,讓機器能在眾多的單詞中掌握語義。

然而我們卻可以應用教孩子說話簡化出的語言、詞彙來加速機器學習的「語感」訓練!(責任編輯:何泰霖)

本文經 新智元(公眾號 ID:AI_era)授權轉載,轉載請連繫出處
作者:新智元

芝加哥大學與卡內基·梅隆大學的研究人員設計了一個遊戲,了解爸媽是如何根據孩子學習語言的方式,準確地調整與孩子溝通時使用的語言,而該研究結果也有助於機器學習的發展。

還記得自己牙牙學語的時候,爸媽是怎麼教我們說話的嗎?「叫媽媽,媽——媽——」「吃飯飯」

這種拖長發音,重複單詞的方式,是每個小孩學會說一個單詞的最基本方式,除了這種拖長發音、重複單詞的方式,爸媽還會根據我們已經學會的詞語,繼續教我們新的內容。

研究人員為此就發現了一種新方法,用以評估爸媽在與孩子談話時,孩子所掌握的語言、改變語言的方式,而他們也發現原來這種大人教孩子說話的方式也適用於機器學習。

TO 延伸閱讀:做機器學習,數據和模型哪個重要?吳恩達的「二八定律」告訴你真相

機器學習語言訓練反思,能用爸媽教孩子說話的模式訓練嗎?

「一直以來我們都知道,爸媽和孩子說話的方式與其他成年人說話的方式有很多不同的地方,比方說,簡化語言、重複單詞,或者拖長發音,這種方法會讓孩子更好地掌握語言。 」

研究人員發現,成年人會放慢語速,用更高的音調和孩子說話。他們還會用誇張的發音,重複或者簡化自己的語言。除此之外,成年人還會問孩子問題,以確認孩子的理解能力。整個交流模型會隨著孩子語言流利程度的提高而不斷變化。

Yurovsky 教授說,「人們和孩子溝通時會不假思索地使用相同的語言結構,透過了解孩子的語言程度,修改自己的說話方式,讓孩子能夠更好地理解他們。」

TO 延伸閱讀:AI 工程師最佳入門資源!史丹佛公布「自然語言理解」免費課程,新手們趕快存起來

實驗設計:找出爸媽在孩子語言發展不同階段所做的「溝通轉變」

為了更清楚了解這一過程,研究團隊設計了一款遊戲,讓爸媽協助孩子每次在三隻動物中選出一隻正確動物。而這些動物的選項,有一半是孩子在 2 歲前就已經認識的,而剩下的則是 2 歲後才認識的動物。

有 41 對親子受邀參與該研究,研究人員則測量爸媽認為孩子應該認識某些動物時的溝通方式。

研究結果發現,爸媽們因為一直見證著孩子的成長和學習,所以非常了解孩子們的語言發展。這也表明,爸媽利用他們對孩子語言發展的了解來調整自己的語言

研究還發現,爸媽在向孩子表達「未知」的動物時用了各種方法,比如在描述動物的時候,使用孩子熟悉的其它詞語來形容動物。

圖 b 中,孩子作出正確選擇後,爸媽會繼續用更長的描述方式來形容他們認為孩子不認識的動物。然而,如果家長認為孩子認識那個動物,但孩子選擇了錯誤選項,就會在下一次出現同一動物時使用更長的描述。

該實驗驗證了團隊之前的想法,同時還發現,爸媽不僅使用了孩子已經掌握的語言知識,還能在意識到孩子不認識某種動物時,改變他們的表達方式。

改掉「填鴨式」教學,用爸媽教養法培養機器學習語言訓練

自然語言處理(NLP)是一種專業分析人類語言的人工智慧。現代 NLP 是一門融合了語言學、電腦科學和機器學習的混合學科。

語音助理便是日常常見的 NLP 應用,但想讓各種語音助理上線,前面必須要經過訓練。而訓練的第一步就是文本預處理。簡單地說,就是輸入文本,以便於後續分析

目前我們是這樣訓練機器學習學語言:提供我們全部的語言資料,從大規模的單語語詞中學習到豐富的語義知識。

Yurovsky 教授認為,研究結果能夠幫助人們更理解機器學習的語言系統。

也就是說,如果人們不再是一次性將所有語言資料以「填鴨式」的方式進行訓練,而是在適當的時候向機器輸入適當的語言資料,就能讓機器有階段性的學習語言

機器之於研究人員,如同孩子之於爸媽,如果研究人員能夠像爸媽一樣,調節機器學習語言的進度和方式,或許能更好地幫助機器學習學語言。

TO 延伸閱讀:【老師越來越難當!】美國天才高中生展開機器學習專題研究,老師招架不住上網求解

參考資料:Unite.Ai

(本文經 新智元 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈機器學習學語言「太笨」?跟爸爸媽媽們多學學!〉。首圖來源:freepik)