【我們為什麼挑選這篇文章】今年的騎士在「眾人皆醉,皇獨醒」的情況下,還是打進了東區決賽,關鍵當然 LeBron James 這位 33 歲老將,持續打出不符合年齡的超強表現。

隨著 AI 應用擴展到運動領域,LBJ 當然也成為研究者的目標,文章中的論文就是專門教你,如何守住詹皇和他的快樂夥伴。有人要轉給賽爾提克教頭 Brad Stevens 看嗎?(責任編輯:康陳剛)

今天 NBA 官方公布了今年度的年度前三隊,LeBron James 再度入選年度第一隊,生涯目前累積 12 次入選,超越「郵差」Karl Malone 和「小飛俠」Kobe Bryant,成為史上入選年度第一隊最多次的球員。

這是詹皇的第 15 個賽季了,沒人能想到,33 歲的老詹在這一賽季依舊強勢打​​出眾多巔峰數據。

不僅拿下了該賽季最高得分 2251 分,傲視全聯盟。還發揮出了近 8 賽季以來最高場均得分 27.5,打破了 Kobe Bryant 創下職業生涯 30000 分的年齡記錄。逆生長的他體能也爆表,場均上場時間 36.9 分鐘均雄踞全聯盟榜首。

現在正在和騎士隊爭奪東區冠軍的賽爾提客教練 Stevens,也在東冠系列賽第一戰後坦言:「詹姆斯的進攻能力越來越強了。我覺得怎麼提高我們的防守水平,是一個需要我們好好思考的問題。」

如何提高?那夾守策略的研究可以指望 AI 嗎?

可以。

或許強化學習可以

近期 MIT 斯隆體育分析大會上,密歇根大學的研究團隊研究了一下如何用強化學習建個模型來尋找最佳包夾戰略。

於是就有了這篇論文。作者聲稱,這是史上第一篇利用強化學習,研究 NBA 防守策略的論文

論文裡採用的訓練集是近三季以來的 NBA 影片,用到了 64 萬多個持球片段。按道理說,只要反覆分析那些包夾表現完美的片段,理論上可以總結一套最佳的包夾戰略。

嗯對,理論上。看看具體怎麼操作吧!

告訴機器什麼是包夾

首先,把 NBA 的影片分割成可分析的持球片段:從所有的球員都過了半場那一刻開始,到進攻時限重新開始計算截止。

再把這些持球片段按秒切開,每一秒防守方都要考慮什麼時候包夾、留哪個空位風險最低,以及根據場上局勢迅速預判包夾的效益有多大。

然後用一個簡單的分類系統,判斷上述切分好的片段中是否存在包夾行為。若持球人的附近,即一定距離的半徑範圍內有兩個人防守(圖左 a部分),且這個狀態持續至少兩秒以上,那麼初步判定為包夾。

圖2:研究人員如何判斷包夾。

研究人員如何判斷包夾。

不過,要是有一個防守的人同時出現在兩個進攻隊員有效的防守半徑內,那這種情況就不算是包夾(圖左 b部分)。

從圖右的 c 表格可以看出,這個自動判斷包夾的分類模型還算可行,效果比人類標註員的誤判要少得多。經過統計,64 萬個持球錄像片段中,只有 4.8% 被判定為包夾,所以研究人員把這 4.8% 挑出來,再按結果分類。

按得失分類

包夾最好的結果是能遏制對方進球,搶到籃板後得分,但不是每次都能表現如此完美。根據包夾後的得分(或失分)情況,可分成6類:得/失 2 分,得/失 3 分,犯規,失誤。

包夾後通常只有六種情況。

包夾後通常只有六種情況。

分析之後發現,進攻力很強的球員被包夾之後,進球難度加大,2分/3分的得分率都降低了一點點,這說明包夾可以起到一定的壓制效果。

但 2 分失分率、犯規率明顯升高,都是防守方選擇包夾是要面臨的風險。不僅會更容易犯規,也給了對方空檔投籃的機會。

預處理數據,給包夾效果打分

機器篩出表現不錯的包夾片段後,進一步數據按秒切好。然後轉成直觀的運動軌跡(Court Image)。除了運動軌跡信息,判斷要不要包夾某個球員的必要資訊還有對方的身高、體重等,所以輸入的數據還需要其他非空間的特徵值(flat features)。

可視化的球員運動軌跡交給卷積網絡(ConvNet)去提取視覺上的特徵,至於非空間特徵值則交給全連接網絡(FC Net)處理,最後輸出 Q 值,相當於是給包夾效果打個分。

Q 值僅為每種實際狀態下對可能的行為打分。

而這整個強化學習的網絡,叫 Nothing But Net,簡稱 NBNet。

 

 

 

 

 

 

 

 

控制變量訓練 RL 模型

為了盡可能客觀地還原不同防守策略的效果,要控制進攻方這個變量。

因此,進攻方的數據選了進攻力接近 Max 的老詹所在的球隊,騎士。從中翻出那些對手防得還不錯的瞬間,總結一下。

騎士的 2 萬多個持球片段,總共分三部分:70% 訓練用,10% 做驗證,最後留 20% 待評估。經訓練後的 RL 模型會對待測片段作出是否應該進行包夾的預測。

等到 NBNet 模型訓練得差不多了——預測包夾的結果(29.29%)比較接近真實情況(33.92%)時,研究團隊就讓模型進入實戰,分析之前篩好的包夾片段。

結果發現,模型輸出的 Q 值越大,被包夾的一方得分越低,這說明該輪防守效果越好。

那麼問題來了:在所有對戰騎士的球隊裡,哪個球隊的 Q 值最大?

防騎士,公牛No.1

NBNet 按各球隊以往數據打分,發現 Q 值最大的是公牛隊。今年常規賽上公牛防騎士的表現也可圈可點。

包夾,還是不包夾?

除了最強防守隊,NBNet 分析完一圈騎士的數據後,還給了個的夾防建議:

最不該包夾的人就是 Lebron James! 

上圖裡的藍柱,指的是實際比賽中某球員被包夾的比例,而橙柱是模型建議的比例。紅框的數據顯示,詹皇持球時,對手包夾的比例接近 25%,由此可見防守方內心的焦灼。不過模型建議,夾防的比例得降至 15%,否則得不償失。

除了詹皇,像進攻力很強的明星球員Irving、Thompson 也最好少夾,漏防反而給對方空位投球的機會(哎,模型寶寶都不知道 Irving 不在騎士了,sad)。

此外,NBNet 還給了最違反直覺的建議:夾防時,最好不要漏防弱側底線。不然到時空位一旦拿球補防完全來不及。

相反的,可以優先考慮留空上圖右邊那兩坨墨藍區的人,這樣協防起來相對沒那麼費力。

閒聊:詹皇能走多遠?

雖然現在騎士隊現在在東冠系列賽以 2:3 落後賽爾提克,但數據顯示詹皇在季後賽是越戰越強,他們能否拿下東冠,甚至衝擊總冠軍,都還在未定之天。

當然如果有人把這篇論文給 Stevens 看的話,那可能又另當別論了。(笑)

——

相關資源:
原論文:https://arxiv.org/abs/1803.02940
代碼:github.com/igfox/Advant

(本文經 量子位 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈詹皇比肩喬丹!如何防住他?這是AI給出的回答〉。首圖來源:wikipedia,CC Licensed)

延伸閱讀

賭海明燈來了!Google 用 AI 即時預測 NCAA 決賽,投進幾個三分球都要猜
數據科學看世大運:漠視運動科學,讓運動員只能靠天吃飯,迷信「氣勢」
球場和商業戰場,他都要當 MVP!NBA 之外的杜蘭特,以及他劍指矽谷的投資野心