【我們為什麼挑選這篇文章】

一直以來 AI 在媒體產業大多都主打「替代記者寫文章」為主,由 PTT 創世神 AI Lab 研發出來的「記者快抄」如是,不過 AI 所撰寫的文章可讀性仍還有待議空間。而本篇文章介紹 GiveMeSport 的 AI 應用,卻更貼近現況,短訊息由 AI 負責,並不斷掃描 Twitter 將重要訊息提供給記者,最後則在讀者端進行分析工作。

流程完整,而且可行性看上去還不錯,不過國內有哪家媒體會嘗試導入呢?(責任編輯:陳君毅)

英國著名體育媒體 GiveMeSport 算是新興技術的應用先行者。其創立於 2011 年,主要基於 Facebook 專業發布與體育相關的新聞、專欄文章等。目前,其成功借助專有技術在 Facebook 上吸引了 2500 萬以上的訂閱用戶。2016 年 10 月,GiveMeSport 被 Breaking Data Corp.(另一家人工智能技術提供商)收購,利用該公司的 AI 技術,其成功立於一眾競爭者之前列。

雷鋒網了解到,GiveMeSport 已在新聞頻道的兩個終端,讀者與記者端,應用了 AI 技術,包括分析和反應片段以及重大新聞的報導。在此之前,該新聞機構每個月產出的 2000 篇文章,絕大多數來自 14 位全職以及 50 位自由撰稿人的工作成果。

而新的 AI 技術大大釋放了作者們的時間,使其有更多的精力專注於 1500 字以上的文章的撰寫當中,同時這類文章也能爭取到更多的廣告投放空間

「全球有很多有潛力的 AI 團隊」,Breaking Data 的 CEO Nick Thain 如此表示,其在 2016 年底收購了 GiveMeSport,「現在 Breaking Data 正在嘗試從理解社交媒體語言,本土語言及其縮寫,以及語言在適應過程中是如何改變的等等來分離公司重點」。

以下就是該新聞機構利用 AI 在新聞報導中的具體應用。

新聞採集和事件識別

通過自然語言處理(NLP),Breaking Data 的 AI 技術能夠實現對 Twitter 的秒級掃描,並通過預定關鍵詞,如足球隊、球員名字、球隊名稱、俱樂部、聯賽、比賽場地等等,來篩選相關內容。

這些內容在經過過濾和驗證之後,會被分類為「重大事件」、「相關新聞」或者「誇張新聞」,然後在 BreakingSports Slack 頻道裡會被作為警報發送給記者,再由通知裡的編輯團隊首要處理。

在這個過程中,GiveMeSport 使用了 Breaking Data 的 AI 技術,可將各個公開的數據源,如 Facebook、Reddit、維基百科等等,匯集在一起。

(圖片來源:Digiday,AI 傳送即時訊息到編輯團隊的通訊平台中)

儘管已有大量可用的社交工具, 但是 Thain 解釋到,該平台還能通過識別可靠、可信的信源來識別出有可能不太準確和真實的推文。

舉個例子,假如有消息稱,足球隊員 Neymar 將以 2.22 億歐元(約合 2.61 億美元)的高價加盟巴黎聖日爾曼隊,GiveMeSport 的 AI 平台會即時追踪該新聞首次出現在 Twitter 上的時間,並將該帳戶標記為可信權限。

隨著該 AI 平台對語言的了解逐漸深入,它還能識別出特定領域的規範偏差。Thain 表示,該平台可以捕捉範圍在一英里的所有推文。假如跟蹤一位發推頻次非常規律的物理治療師(其很有可能是為運動員提供診療服務的),在經過一天繁重的工作之後,該診療師可能會連續發出幾條抱怨工作負載的推文。發推頻次和內容主題的變化,將被機器捕捉並予以標記,從而將其作為警報發送給該新聞機構 Slack 頻道的記者。記者們即可聯繫相關俱樂部,調查是否有運動員受傷等事宜

管理 Facebook 平台的內容分發

Facebook 是 GiveMeSport 最大的推送平台。該新聞發行商的記者也會在 Facebook 上發布帖子,並為其文章取標題等。GiveMeSport 還將該 AI 技術嵌入到內容管理系統中,並根據文章帖子對點擊率和參與度的貢獻來為每位作者打分。

此外,該技術還分析了文章的詞語組合、句子結構和形象,從而和受眾產生共鳴。

「(事實上)它和識別標題裡的大寫字母一樣簡單,可識別出 Facebook 用戶可能會厭倦的內容。例如,它還能確定曼聯球迷不喜歡被稱作『MU』或者『紅魔』」Thain 表示。

「內容分發應該是科學的,我們不想錯過這個機會。AI 給了我們超越其他競爭對手的優勢」Thain 補充道。

為內容賦予感情

現階段 GiveMeSport 的作者在處理每個故事的「感情」標籤時,仍依賴於手動操作。

這些情緒會有一個預定的數據庫,如快樂、悲傷等 30 種以上的情感,作者們根據自身滿足的情感獎勵組織內容,標記每個故事。後續借助 AI 技術,該平台可對歷史數據集進行類似分析。這一過程運行的理論為,通過理解更深層次的情感,從而可以預測內容的表現,來連結用戶。

「體育一定是關乎情感的,」Thain 說,「它歸結於你對某件事的感覺,或者歸結於你想告訴其他人你剛讀過的文章的感覺。吸引用戶想讀的內容,無非就是不可錯過的,或者就是和你相關經歷有關的」。

(本文經 雷鋒網 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為〈除了新聞識別,這家媒體還利用 AI 管理內容分發,2500 萬人已關注〉。圖片來源:Wiki, CC Licensed。)

延伸閱讀

IBM、Google、Amazon 人工智慧技術遭質疑!AI 和機器學習、數據分析差別究竟在哪?
李開復:未來 50% 工作將被 AI 取代,「人工智慧時代」到底應該學些什麼?
中國 AI 教父吳恩達開課啦!史上「最完整」人工智慧課程,帶你一步步成為頂尖人才