Search
Close this search box.

門神下凡!Google 街景辨識你家門牌只看一眼就好

按照街道門牌號碼找地址是一件苦差事,尤其是當你身處於日本和韓國時。日本和韓國的門牌號碼很少按照次序排列,因此哪怕是當地人也難以根據門牌號碼找到地址。

身兼地圖服務商的 Google 提供了一套解決方案——將街景小車拍攝到的門牌號碼與相應的地理位置進行匹配。這意味著 Google 在進行街景圖像採集的同時,也將每幢建築的門牌號碼訊息錄入了數據庫。

這項工作的難點在於,確認和識別門牌號碼是一項耗時巨大的工作Google 的街景相機拍攝的全景照片高達數億張,通過人工搜索圖像確認門牌號碼的效率非常低。

Google 當然不會那麼做,他們找到了一套自動化的解決方案。這個項目的負責人 Ian Goodfellow 向 MIT Technology Review 解釋了自動化識別街景圖像中門牌號碼的「工具」:訓練神經元識別圖像中的數字,並將經訓練的 11 級神經元構建成一張單層神經網絡。

首先,他們假設門牌號碼已被識別,然後對圖像進行切割,使得門牌號碼至少至少佔據結果幀 1/3 的寬度。在做數字識別的過程中,Google 並不會對門牌號碼切分進行單位數字的識別,而是通過神經網絡一次性識別整串數字。

Google 使用的是公開的街景門牌號碼數據集來對神經元數字識別進行訓練,這個數據集涵蓋了 20 萬個由 Google 街景攝影鏡頭拍攝的門牌號訊息。不過,這項訓練需要花費 6 天才能完成。

目前 Google 在全球自動偵測和轉錄的門牌號碼數據已經達到將近 1 億,準確度達到了人眼識別的水平。而且,這套門牌號碼自動識別系統的運行效率非常高,轉錄整個法國的門牌號碼數據僅僅花費了不到一個小時。

通過單層神經網絡識別和轉錄數字是字符抽取和識別技術的一項重大飛躍,這項技術甚至可以作為一套端對端系統套用到文本翻譯和語音識別等其他領域中去。

延伸閱讀:

Google Maps 不斷優化卻全部免費,Google 到底在盤算些什麼?

(轉載自合作媒體《PingWest》; 圖片來源:Craig Baerwaldtasmythie, CC Licensed)