
綜觀當前的人工智慧( AI) 發展,技術重點大致可分為「影像辨識」與「自然語言處理」。而像是近年很夯的智慧語音助理、機器人都離不開後者。
「複雜問題」成自然語言處理的困境
自然語言處理(Natural Language Processing; NLP)是人工智慧和語言學領域的分支學科。
理論上,NLP 是一種很吸引人的人機互動方式。早期的語言處理系統如SHRDLU,當它們處於一個有限世界,運用有限的詞彙對談時,表現得相當好。這使得研究員們對此系統相當樂觀。然而,當把這個系統拓展到充滿了充滿不確定性的現實世界時,他們很快喪失了信心。
由於理解(understanding)自然語言,需要關於外在世界的廣泛知識以及運用操作這些知識的能力,該技術同時也被視為一個人工智慧完備(AI-complete)的問題。
比 Google 還快,Nvidia 53 分鐘就訓練完自然對話 AI
在 NLP 的領域中,最有名的莫過於 Google 的 XLNet 和 Facebook 的RoBERTa。為了提高 BERT (通用語言理解模型)的訓練速度,Google 用上 1024 塊 TPU,只要 76 分鐘就訓練出模型。Facebook 則使用 1024 個Nvidia V100 GPU。
而 Nvidia 今(14 日)則對外宣布,團隊用 1472 個 V100 GPU 在一個小時之內訓練完 BERT 模型。
在技術層面上官方強調,過往對話式人工智慧系統曠日費時。但現在透過這部超級電腦的運算,時間可以幅縮減至 53 分鐘,反應時間僅在 2.2毫秒內。
值得一提的是,其中可對應以 83 億組複雜參數內容構成的語言模型,藉此讓人工智慧能產生更自然的對話。亦可幫助開發人員將最先進的 NLP 模型大規模部署在各類應用中。

Nvidia 表示,此系統的應用範圍廣,包含智慧語音助理、自駕車、智慧城市、金融服務和醫療照護等,藉此優化產品與服務體驗、讓人力分配可以更有效率。

參考資料來源:
1. 《TechCrunch》:〈Nvidia breaks records in training and inference for real-time conversational AI〉
2. 《ZD Net》:〈Nvidia claims world records in conversational AI training〉
3. 《Medium》:〈A Simple Introduction to Natural Language Processing〉
(本文提供合作夥伴轉載。首圖來源:Nvidia。)
延伸閱讀
用 AI 突破農災困境,MIT 團隊「Open Ag」有望成為下一隻獨角獸
以色列獨角獸 OrCam 來台:推智慧語音眼鏡,讓 AI 成為視障者的眼睛