【直播也不能亂播】Facebook 訓練人工智慧打擊色情暴力,遏止直播內容歪風

113348

【我們為什麼挑選這篇文章】直播是現在社交平台中的必備功能,然而有個大問題是:如何過濾直播中的暴力、色情等不當內容?

之前美國曾有少女被朋友 直播性侵過程 ,作為許多影音內容的平台,這些社群巨頭們有責任避免這些內容出現,這些平台目前都在研究如何用 AI 來過濾這些不當內容。這篇文章就介紹了臉書、Twitter 等社群網站的做法。(責任編輯:黃筱雯)

不管你喜歡玩遊戲,還是看比賽,如今,移動端的影片直播都能滿足你。

但伴隨用戶規模驟增、直播數量上漲,諸如暴力、色情等不當內容也開始泛濫。解決這個問題,「積極地使用更好的演算法,比採取法律手段有用得多」。據路透社報道,Facebook 作為影片直播巨頭,將使用 AI 對網民的影片直播進行實時的監控識別,避免違規內容的傳播。

Facebook 負責「應用機器學習技術」的總監康德拉(Joaquin Candela)向媒體披露,Facebook 正在開發一個能夠對影片直播中不當內容進行監控和識別的工具 ,並已經開始在 Facebook 的直播產品「Facebook Live」中進行測試。Facebook 希望,人工智慧技術能夠幫助其主動監控影片直播中的違規違法情況。

Facebook_AI_12.5-1
(圖片來自:Reuters)

人工智慧技術對實時影像的鑒黃分析主要是從三個方向進行: 是否有人物、人形輪廓的膚色比例、姿態分析 。直播影片可以通過解碼抽幀, 識別固定時間段中抽取的圖像來鑒定是否是色情視頻

當圖片或視頻幀達到十萬的量級,深度學習就能跑起來。鑒黃的難點就在於, 機器容易將正常圖片(例如肉色褲子)誤判為色情圖片 ,這需要後期大量的數據不斷訓練和糾正,投入不小。

那麼為什麼不用人工識別呢?人工確實可以處理影片直播中違規違法情況,但由於內容數量多,用戶規模大,人工處理不僅投入大,成本高,而且不穩定,速度慢,易漏判誤判。

目前,僅國內影片直播應用用戶規模已達 2 億台,增速還在提高,2016 年第一季度同比就增長了近一倍。因此運用 AI 監控視頻直播確實是一種理想而必然的選擇。

live_video_growth
(圖片截自 Talkingdata)

目前, 圖像識別 已經廣泛應用於互聯網圖片鑒黃、明星臉識別、暴力恐怖等信息的篩選和過濾。今年 6 月,Facebook 已經開發出能夠 自動識別標註極端組織的技術 ;而在 9 月,雅虎開源了自己構建的一套深度學習神經網路,專門用於自動監測圖片是否含有色情內容。

該識別系統會通過通用 Caffe 深度神經網路模型以圖像作為輸入並輸出一個概率,給圖片評估一個 NSFW(Not Suitable/Safe For Work)值,最無害的是 0,最極端是 1。

Free-Converter.com-yahoo_nsfw-18702422
(圖片來自:Yahoo! Engineering)

影片監控方面,今年 4 月,Twitter 的人工智慧團隊 Cortex 開發出了一款即刻識別直播視頻內容的演算法,該技術利用深度學習的方法來識別影片中的活動。其通過學習大量樣例來訓練大型模擬神經網路,以識別輸入的內容。樣例影片由雇員觀看,並添加標籤,為視頻提供足夠復雜的語義理解框架。

當下,眾多公司都在爭奪影片直播的陣地,亞馬遜 (Amazon) 2014 年斥資 10 億美元,收購了遊戲直播網站 Twitch。Twitter 2015 年花費 5000 萬美元收購還未正式發布的視頻直播應用 Periscope。Yahoo 旗下 Tumblr 今年 6 月也宣布推出直播服務。Facebook 則因為手握巨大用戶量,Facebook Live 日觀看量可達 40 億人次。

facebook_live_AI_2-1

中國市場中,也已經有近 200 家在線直播平台,不乏在遊戲、彈幕、影片、秀場、手機等 5 大類垂直直播平台。用戶總數已達 2 億,數字也十分可觀。但潛藏在這片紅海下的違規違法行為,如何通過人工智慧技術手段處理,是影片直播公司一直需要面對的問題。

(本文經合作夥伴愛範兒授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈不用鑒黃師,還要給視頻直播一片淨土,Facebook 會怎麼做?〉。)

點關鍵字看更多相關文章: