【為什麼我們要挑選這篇文章】過去在訓練機器學習的「語感」時都是如何操作的呢?通常都是一次丟出大量的語言資料,讓機器學習能在眾多的單詞中掌握語義。

然而,在教孩子學說話、了解新詞彙時又是怎麼做的呢?我們可能會簡化語言、重複單詞,甚至用更長的描述來教學,透過這個長期以來被人類拿來教語言的方式,有機會加速機器學習的「語感」訓練嗎?(責任編輯:何泰霖)

本文經 新智元(公眾號 ID:AI_era)授權轉載,轉載請連繫出處
作者:新智元

芝加哥大學與卡內基·梅隆大學的研究人員設計了一個遊戲,了解爸媽是如何根據孩子學習語言的方式,準確地調整與孩子溝通時使用的語言。該研究結果也有助於機器學習的發展。

還記得自己牙牙學語的時候,爸媽是怎麼教我們說話的嗎?

「叫媽媽,媽——媽——」「吃飯飯」

這種拖長發音,重複單詞的方式,是每個小孩學會說一個單詞的最基本方式。

而這種爸媽與孩童之間的溝通方式與成年人之間的溝通方式,在很多方面都不一樣。除了上面這種拖長發音、重複單詞的方式,爸媽還會根據我們已經學會的詞語,繼續教我們新的內容。

那麼,機器又是如何學習語言呢?

來自芝加哥大學與卡內基·梅隆大學的研究人員發現了一種新方法,用實驗評估爸媽在與孩子談話時,根據孩子已經掌握的語言,改變自己語言的方式。而這種教孩子說話的方式也適用於機器學習。

這是首個該類型的語言模式研究,相關論文已經發佈在 Psychological Science 上。

機器學習語言訓練反思,能用爸媽教孩子說話的模式訓練嗎?

圖片來源:freepik

「一直以來我們都知道,爸媽和孩子說話的方式與其他成年人說話的方式有很多不同的地方,比方說,簡化語言、重複單詞,或者拖長發音,這能讓孩子更好地掌握語言。 」

「但是,我們並不知道爸媽是否在孩子學習語言的過程中,改變自己的說話方式,從而讓孩子能夠「恰到好處地」學習新的內容。」卡內基·梅隆大學心理學副教授 Daniel Yurovsky 說道。

研究人員發現,成年人會放慢語速,用更高的音調和孩子說話。他們還會用誇張的發音,重複或者簡化自己的語言。除此之外,成年人還會問孩子問題,以確認孩子的理解能力。整個交流模型會隨著孩子語言流利程度的提高而不斷變化。

Yurovsky 教授表示,這就像學生在學校學數學的方式。

學生先從代數開始學習,然後是平面幾何,之後是微積分。 Yurovsky 教授說,「人們和孩子溝通時會不假思索地使用相同的語言結構,透過了解孩子的語言程度,修改自己的說話方式,讓孩子能夠更好地理解他們。」

實驗設計:找出爸媽在孩子語言發展不同階段所做的「溝通轉變」

隨著孩子慢慢長大,爸媽也會改變與他們的溝通方式。為了更清楚了解這一過程,研究團隊設計了一款遊戲,讓爸媽協助孩子每次在三隻動物中選出一隻正確動物。而這些動物的選項,有一半是孩子在 2 歲前就已經認識的,而剩下的則是 2 歲後才認識的動物。

有 41 對親子受邀參與該研究,研究人員則測量爸媽認為孩子應該認識某些動物時的溝通方式。

研究結果發現,爸媽們因為一直見證著孩子的成長和學習,所以非常了解孩子們的語言發展。這也表明,爸媽利用他們對孩子語言發展的了解來調整自己的語言。

研究還發現,爸媽在向孩子表達「未知」的動物時用了各種方法,比如在描述動物的時候,使用孩子熟悉的其它詞語來形容動物。

圖 b 中,孩子作出正確選擇後,爸媽會繼續用更長的描述方式來形容他們認為孩子不認識的動物。然而,如果家長認為孩子認識那個動物,但孩子選擇了錯誤選項,就會在下一次出現同一動物時使用更長的描述。

該實驗驗證了團隊之前的想法,同時還發現,爸媽不僅使用了孩子已經掌握的語言知識,還能在意識到孩子不認識某種動物時,改變他們的表達方式。

改掉「填鴨式」教學,用爸媽教養法培養機器學習語言訓練

自然語言處理(NLP)是一種專業分析人類語言的人工智慧。現代 NLP 是一門融合了語言學、電腦科學和機器學習的混合學科。

語音助理便是日常常見的 NLP 應用,但想讓各種語音助理上線,前面必須要經過訓練。而訓練的第一步就是文本預處理。簡單地說,就是輸入文本,以便於後續分析。

目前我們是這樣訓練機器學習學語言:提供我們全部的語言資料,從大規模的單語語詞中學習到豐富的語義知識。

Yurovsky 教授認為,他們的研究結果能夠幫助人們更理解機器學習的語言系統。

也就是說,如果人們不再是一次性將所有語言資料以「填鴨式」的方式進行訓練,而是在適當的時候向機器輸入適當的語言資料,就能讓機器有階段性的學習語言。

機器之於研究人員,如同孩子之於爸媽,如果研究人員能夠像爸媽一樣,調節機器學習語言的進度和方式,或許能更好地幫助機器學習學語言。

參考資料:Unite.Ai

(本文經 新智元 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈機器學習學語言「太笨」?跟爸爸媽媽們多學學!〉。首圖來源:freepik)

更多關於機器學習

做機器學習,數據和模型哪個重要?吳恩達的「二八定律」告訴你真相
AI 工程師最佳入門資源!史丹佛公布「自然語言理解」免費課程,新手們趕快存起來【老師越來越難當!】美國天才高中生展開機器學習專題研究,老師招架不住上網求解