五十音看嚨嘸,四個工程師照樣開發出準度 98.66% 的日文識別軟體

4289002444_1994aebba8_z

雖然 Alphago 在圍棋領域的實力讓人印象深刻,但是機器智慧也進化到可供更多人使用。這也是為什麼四個幾乎完全不懂日語的工程師能在短短幾個月的時間開發出可識別手寫日語的軟體。

這些程式師來自成立僅 18 個月的創業公司 Reactive,他們開發的手寫日語識別程式準確度高達 98.66%。這家位於東京的公司是一個由工程師和投資者組成的社區中的一員,該社區致力於利用神經網路將人工智慧用於更加實際的用途,而不是回答一些雞毛蒜皮的小事,或者在棋盤類遊戲中獲勝。

「僅僅在幾年前,只有天才才能開發出這類軟體,」David Malkin 說,他有著機器學習領域的博士學位,但不會說一句完整的日語。「而現在,利用這些工具你就能成為非常聰明的人。往後,就是關於如何運用想像力將這些工具應用在現實世界。」

曾經,人工智慧是 Google、Facebook 等其他科技巨頭獨有的技術、現在,任何一家深度學習相關的創業公司都可以利用基於雲端的平臺開發產品,微軟、英偉達和亞馬遜把人工智慧當做工具一樣銷售。

Reactive 公司的技術表明,再小的團隊,在一點點專業知識的輔助下,也可以開發出複雜的應用。也許,產品不是問題,如果實現盈利才是需要認真思考的。Reactive 計畫利用該軟體説明日本學校閱卷。

Malkin 和他的同事 Joe Bullard, Philippe Remy 和 Philip Irri——其中有兩個碩士,一個博士——的進展很快。年初,Bullard 就在 Google 日本總部的一次社交活動上向人工智慧愛好者展示了公司的項目,表現堪稱完美。

在很多人看來,筆跡識別對深度學習而言小菜一碟,但日語是截然不同的。這是因為日語中包含象形中文字元,由可獨立讀取的部分組成,所以很難判斷字詞的開始和結束。日語中還有超過 2000 個象形文字,每個文字又有多個筆劃。Reactive 的演算法利用神經網路進行多次匹配,得出最準確的結果。該公司使用了大約 180 萬字元訓練該模型。

jp

「就識別速度和可塑性而言,該技術在商業領域的應用於該領域的專家相比有著較大的優勢,」Fujitsu Laboratories Ltd 專案主管 Seishi Okamoto 說,他正在開發可識別漢語的軟體。「深度學習識別漢字書寫的準確率與人類相當,也許還會超越。」

傳統的程式設計是建立在固定的規則上的,寫 C 程式就必須按照 C 程式的語法結構來。但是深度學習人工智慧是建立在人類處理資訊的模式上。給定足夠的輸入資訊,以及期望的結果,神經網路負責中間流程。這就能解決傳統方式頭疼的問題,如語音指令和圖片標記。

這些都有可能推動人工智慧技術的發展。市場研究機構 CB Insights 資料表明:2015 年,人工智慧領域創業公司投資,從教育到零售業,再到農業,達到了 3.1 億美元,在五年內增長了 7 倍之多。

(本文獲《TECH2IPO》授權刊登轉載,原標題為〈準確率 98.66%,四個完全不懂日語的碼農開發出了日語識別軟體〉,圖片來源:mkhail CC Licensed,未經授權請勿轉載。)

AD