【NLP 工程師殺手級工具】Google 開源 LIT 分析軟體,快速測出「AI 精準度下降主因」

全球產業正在數位化,無論是走在商場可見的語音查詢介面、每月查帳能透過銀行設立的 Chatbot 查詢,甚至是無人不曉的 Siri 都是科技逐漸走入普通人生活的寫照。要機器讀懂人的語言十分艱難,更遑論依照問題做出精準的回覆;工程師為了 AI 演算法忙得頭昏眼花,而 Google 日前開放的 LIT 工具或許能幫一把。

Google AI 研究人員於 GitHub 上 開源能協助第三方開發者理解與檢核自然語言處理(natural language processing,NLP)的工具,又稱 Language Interpretability Tool,簡稱 LIT。

為什麼 Google 要推 LIT?

自然語言處理(以下簡稱 NLP)主要幫助機器人能正確理解並與人溝通。且過去工程師在執行相關作業時,AI 模型往往會因為資料庫中的偏見等人為因素,而出現超呼預期的行為。若要提前測試與排除人為障礙,工程師得耗費大量時間成本,但資源緊縮的狀況下,這種狀況是不容許的。而這也是 LIT 的優勢所在。

LIT 能解決的三個 NLP 挑戰

LIT 工具能回答工程師在自然語言處理上的三大問題。一、AI 模型在什麼狀況下答覆精準度會下降?二、AI 模型為什麼會做出特定預測?而三、若調整 AI 模型中字體、動詞時態或是代名詞的代表性別,例如英文裡的 he、she、it,AI 模型是否會受影響、會不會穩定運行?

LIT 可以讓工程師提前測試對模組的假設,在無需龐大時間成本的情況下,可視化資料與得到執行假設後的分析。過程中,工程師可以隨意在資料庫中新增數據,並且即刻獲得 AI 模組的未來變化。更好用的是,LIT 能夠讓工程師左右同時比對因資料不同而改變的兩種 AI 模組,讓 NLP 相關作業變得更容易且有效率。

只要 Python 能跑,LIT 就能支援!

據 GitHub 說明頁面 指出 ,只要 Python、TensorFlow、PyTorch 可以跑的模型,就能使用 LIT 工具做預期分析。除此之外,LIT 工具也支援多種 NLP 作業過程,例如 Classification、Regression、Span labeling、Seq2seq 以及 Language modeling。

GitHub 傳送門:點我

參考資料

VentureBeat

(本文提供合作夥伴轉載,首圖來源:Unsplash, CC Licensed。)


科技報橘 LinkedIn 上線!

最新科技產業動態、技術新突破、專業職能技巧提升 ....... 鎖定 TO  LinkedIn 專業品牌,提升職能與產業 Know-how,躋身產業菁英之列 https://www.linkedin.com/showcase/techorange

點關鍵字看更多相關文章: