電影會不會賣?用維基百科就能輕鬆算出來

其實,「預測」的概念就像未來事件交易所一樣,科學家們開始在網路社群上蒐集並建立不同的數學模型,來預測真實世界的各種可能情況。

最近有一則新的消息,根據一位來自布達佩斯大學的物理學家 Taha Yasseri(Budapest University of Technology and Economics),和他的團隊所創造的一種數學模型,對於即將上檔的電影,可以統計該片維基百科頁面上,閱讀人數與編輯人數等所有相關數據,並在電影上檔的一個月前,預測出這些影片的開幕票房數字以及收入。而那些超大卡司的強片,準確率竟然還高達九成!

這些統計數字的背後,來自於該團隊逐一追蹤美國 2010 年所上映的 535 部電影,挑選當中有專屬維基百科頁面的 312 部影片而來。而這個數學模型的準確率,其實和一部電影本身熱不熱門的程度有很大的關聯。

好比說,在 2010 的幾部大片像是《鋼鐵人》(Iron Man 2)、《愛麗絲夢遊仙境》(Alice in Wonderland)、《玩具總動員 3》(Toy Story 3),以及蝙蝠俠導演克里斯多夫諾蘭的《全面啟動》(Inception)等強檔電影,推估準確率可以高達九成。

但反過來說,那些原先不被看好的冷門電影,像是改編自布克獎得主作家石黑一雄的作品《別讓我走》(Never Let Me Go)、橫掃澳洲年度各大電影獎項的《生存法則》(Animal Kingdom),以及美國經典犯罪小說所改編的《魔由心生》(The Killer Inside M)等電影,預測出來的結果竟和實際情況天差地遠。但總的來說,這個數學模型的平均準確率還是可以達到 77% 的水準。

然而,Taha Yasseri 表示,這些統計數據,除了讓我們了解到那些熱門電影與維基百科間的高度關聯,以及使用這些預測模型去幫助電影界的人士預測票房走勢外;更重要的意義在於,藉由這些從社群網站,像 Facebook、Twitter、Wikipedia 等蒐集而來的大量數據,能幫助我們在面對一些有針對性的社會問題上,歸納出線索來。

在加州帕洛奧圖的 HP 實驗室也早已證實,一部電影在 Twitter 上被推文的次數與最終票房的收益,的確有高度的關聯性存在;而歐巴馬總統,在選前一夜擁抱妻子的推文,擊敗小賈斯汀成為推特王一事,是否可視為對選舉結果的最終預言?不得而知。

但社群網站龐大的數據,的確逐漸成為未來事件的水晶球,這趨勢無庸置疑!

(資料來源:The Hindu;圖片來源:Lynn Kelley Author, CC Licensed)