【ZiDongHua 之創(chuàng)新自科文收錄關(guān)鍵詞:人工智能 智能博弈 中國(guó)科學(xué)院自動(dòng)化研究所 智慧足球分析系統(tǒng) 】
 
 
  向綠茵場(chǎng)進(jìn)發(fā)!自動(dòng)化所團(tuán)隊(duì)在足球比賽智能博弈研究方面取得系列進(jìn)展
 
 
  近年來(lái),人工智能技術(shù)在足球訓(xùn)練領(lǐng)域的應(yīng)用產(chǎn)生了重要的影響,尤其是博弈對(duì)抗技術(shù)使球隊(duì)和球員的行為策略有了理論技術(shù)基礎(chǔ),而愈加受到體育專業(yè)領(lǐng)域的重視。同時(shí),由于足球推演面臨大時(shí)空跨度、多個(gè)體合作與對(duì)抗、強(qiáng)不確定、稀疏獎(jiǎng)勵(lì)等挑戰(zhàn),任務(wù)復(fù)雜度高于圍棋、一般即時(shí)策略類游戲等基礎(chǔ)問(wèn)題,也被看作決策智能研究的典型場(chǎng)景和測(cè)試平臺(tái)。
 
  中國(guó)科學(xué)院自動(dòng)化研究所蒲志強(qiáng)研究員團(tuán)隊(duì)牽頭承擔(dān)了科技創(chuàng)新2030—“新一代人工智能”重大項(xiàng)目之課題“基于博弈對(duì)抗的足球推演系統(tǒng)”。課題組以人工智能博弈決策技術(shù)為基礎(chǔ),致力于改變足球賽事分析相對(duì)滯后的、靜態(tài)的、以個(gè)體分析為主的傳統(tǒng)統(tǒng)計(jì)描述模式,構(gòu)建實(shí)時(shí)的、動(dòng)態(tài)的、以全局戰(zhàn)術(shù)分析為主的智慧推演評(píng)估方法、工具和系統(tǒng)。課題面向足球領(lǐng)域大規(guī)模知識(shí)庫(kù)構(gòu)建、動(dòng)態(tài)復(fù)雜不確定狀態(tài)感知與局勢(shì)理解、多時(shí)空尺度典型場(chǎng)景博弈對(duì)抗決策等方面開(kāi)展系統(tǒng)研究,構(gòu)建智慧足球分析系統(tǒng),服務(wù)于專業(yè)及青少年代表隊(duì),為人工智能技術(shù)在足球領(lǐng)域的深度應(yīng)用打開(kāi)了新空間。
 
  自主構(gòu)建大規(guī)模足球領(lǐng)域數(shù)據(jù)庫(kù)
 
  人工智能研究離不開(kāi)數(shù)據(jù)支撐,但國(guó)內(nèi)足球賽事及訓(xùn)練缺乏可控?cái)?shù)據(jù)與數(shù)據(jù)采集體系的問(wèn)題一直存在。
 
  為此,研發(fā)團(tuán)隊(duì)搭建了完整的足球數(shù)據(jù)采集系統(tǒng),開(kāi)展了一系列足球比賽數(shù)據(jù)自主采集工作。同時(shí),系統(tǒng)研究了國(guó)內(nèi)外開(kāi)源足球數(shù)據(jù)集,并面向英超聯(lián)賽開(kāi)展了上千場(chǎng)賽事數(shù)據(jù)智能分析,構(gòu)建了融合事件數(shù)據(jù)、追蹤數(shù)據(jù)等多種數(shù)據(jù)形式的數(shù)據(jù)集,形成了國(guó)內(nèi)首個(gè)千萬(wàn)級(jí)節(jié)點(diǎn)足球?qū)I(yè)領(lǐng)域知識(shí)庫(kù),覆蓋球員近萬(wàn)名、賽事5000余場(chǎng),并提出了近200項(xiàng)運(yùn)動(dòng)表現(xiàn)分析指標(biāo),為開(kāi)展更加深入的賽事智能分析提供了堅(jiān)實(shí)的數(shù)據(jù)支撐,為構(gòu)建我國(guó)足球領(lǐng)域數(shù)據(jù)資產(chǎn)提供了有效的資源和工具。
 
  賽中實(shí)時(shí)研判,賽后反推復(fù)盤(pán)
 
  研發(fā)團(tuán)隊(duì)綜合運(yùn)用足球領(lǐng)域?qū)<抑R(shí)及大數(shù)據(jù)分析、深度學(xué)習(xí)等工具方法,面向宏觀戰(zhàn)術(shù)、全局視角開(kāi)展賽事?tīng)顟B(tài)感知與局勢(shì)理解研究,可以出色完成多項(xiàng)賽事研判任務(wù)。例如,通過(guò)構(gòu)建多維度全局優(yōu)勢(shì)區(qū)域模型,將比賽畫(huà)面轉(zhuǎn)變?yōu)閼B(tài)勢(shì)地圖,實(shí)時(shí)動(dòng)態(tài)捕捉球隊(duì)雙方全場(chǎng)優(yōu)勢(shì)分布與變化情況,輔助教練員“打開(kāi)第三只眼”,為其提供更全面深入的態(tài)勢(shì)洞察和決策輔助,改變了相對(duì)滯后的賽后經(jīng)驗(yàn)性戰(zhàn)術(shù)分析模式。如下圖所示,態(tài)勢(shì)地圖可針對(duì)場(chǎng)上球員每一次無(wú)球跑動(dòng)或每一個(gè)有球動(dòng)作做出價(jià)值評(píng)估。
 
  
 
  圖1. 對(duì)真實(shí)比賽的全局性優(yōu)勢(shì)區(qū)域評(píng)估
 
  又如,在賽后復(fù)盤(pán)階段,針對(duì)比賽重要片段構(gòu)建反事實(shí)推演模型,可開(kāi)展“如果當(dāng)時(shí)xx做,比賽會(huì)xx不一樣”的模擬分析,并通過(guò)引入多輪策略博弈,實(shí)現(xiàn)“預(yù)判對(duì)手的預(yù)判”。
 
  
 
  圖2. 反事實(shí)推演:黃色為真實(shí)對(duì)手軌跡,藍(lán)色為真實(shí)阿森納軌跡,紫色為替換阿森納的AI模型軌跡
 
  虛實(shí)融合的綠茵場(chǎng),足球博弈決策推演
 
  人工智能,特別是深度強(qiáng)化學(xué)習(xí)方法的興起,為智能體在虛擬空間不斷學(xué)習(xí)實(shí)現(xiàn)策略自主進(jìn)化提供了重要手段?;谧闱蛱摂M推演平臺(tái)Google Research Football,團(tuán)隊(duì)采用知識(shí)與數(shù)據(jù)協(xié)同、對(duì)手建模、種群博弈、認(rèn)知驅(qū)動(dòng)、知識(shí)遷移等AI算法手段,提出了一系列高效的足球博弈決策方法,支持在虛擬空間中訓(xùn)練模型、演化更新戰(zhàn)術(shù)戰(zhàn)法。
 
  同時(shí),相關(guān)研究將千萬(wàn)級(jí)場(chǎng)次虛擬比賽數(shù)據(jù)與真實(shí)比賽數(shù)據(jù)結(jié)合,以虛實(shí)融合的方式打通了從現(xiàn)實(shí)到虛擬再反饋現(xiàn)實(shí)的分析路徑,構(gòu)建足球智能決策輔助模型,可進(jìn)行任意球員無(wú)球跑動(dòng)的價(jià)值衡量、傳球序列分解與行為價(jià)值分配,從而輔助球員與教練員進(jìn)行多維度的決策評(píng)估與模擬。
 
  
 
  圖3. 基于不同角色知識(shí)遷移的多智能體訓(xùn)練框架
 
  
 
  圖4. 虛擬空間內(nèi)的策略進(jìn)化
 
  基于虛擬數(shù)據(jù)訓(xùn)練的模型可支持真實(shí)比賽分析。以英超2021-2022賽季阿森納對(duì)戰(zhàn)托特納姆熱刺的一場(chǎng)比賽為例,如圖5,第6分02秒的畫(huà)面中,阿森納此時(shí)處于進(jìn)攻關(guān)鍵時(shí)刻,邊后衛(wèi)3號(hào)蒂爾尼可將球傳給10號(hào)史密斯羅或14號(hào)奧巴梅揚(yáng),他該如何選擇呢?我們可對(duì)10號(hào)和14號(hào)球員無(wú)球跑動(dòng)價(jià)值進(jìn)行分析,來(lái)幫助3號(hào)球員進(jìn)行決策。兩名球員的無(wú)球跑動(dòng)價(jià)值如圖6所示,顏色越亮的區(qū)域價(jià)值越高,即若球員向明亮區(qū)域移動(dòng),其可占據(jù)更多的優(yōu)勢(shì)區(qū)域,并為所在球隊(duì)創(chuàng)造得分機(jī)會(huì)。最終,AI分析結(jié)果與真實(shí)比賽中球員的決策一致。
 
  圖5. 第6分02秒的轉(zhuǎn)播畫(huà)面與全景畫(huà)面
 
  基于以上成果,課題組自主研發(fā)了足球比賽智能分析系統(tǒng),將多個(gè)算法成果集成應(yīng)用。通過(guò)該系統(tǒng),教練員在上傳比賽片段后,即可獲得球員的技戰(zhàn)術(shù)與全局性策略表現(xiàn)評(píng)估,且能夠?qū)η騿T跑動(dòng)能力、速度等個(gè)性化信息進(jìn)行修改,實(shí)現(xiàn)反事實(shí)戰(zhàn)術(shù)推演。
 
  推動(dòng)成果落地,釋放體育新活力
 
  研究成果已服務(wù)于部分職業(yè)聯(lián)賽和青訓(xùn)代表隊(duì)的比賽分析、推演、復(fù)盤(pán)等實(shí)際應(yīng)用,幫助“2023首屆京津冀大學(xué)生校際足球聯(lián)賽”多支參賽隊(duì)伍、浙江省青少年足球錦標(biāo)賽臺(tái)州市女子參賽隊(duì)及北京靈動(dòng)星空等球隊(duì)以更科學(xué)、可量化的方式提升球員技戰(zhàn)術(shù)水平,輔助教練完善比賽戰(zhàn)術(shù)布防。同時(shí),與業(yè)內(nèi)頂尖上下游企業(yè)開(kāi)展技術(shù)合作,形成數(shù)據(jù)采集-智能分析整體解決方案,已服務(wù)于一批青少年足球課堂教學(xué)及賽事人才選拔。下一步,團(tuán)隊(duì)將持續(xù)推動(dòng)人工智能技術(shù)在足球領(lǐng)域的技術(shù)突破與深度應(yīng)用,為以足球?yàn)榇淼捏w育事業(yè)提供科技助力,注入智慧動(dòng)能。
 
  部分代表性論文:
 
  [1] Pu Z, Wang H, Liu B, et al., Cognition-Driven Multi-Agent Policy Learning work for Promoting Cooperation. IEEE Transactions on Games, 2022.
 
  [2] Liu B, Pu Z, Zhang T, et al., Learning to Play Football from Sports Domain Perspective: A Knowledge- ded Deep Reinforcement Learning work. IEEE Transactions on Games, 2022.
 
  [3] Liu B, Pu Z, Pan Y, et al., Lazy Agents: A New Perspective on Solving Sparse Reward Problem in Multi-agent Reinforcement Learning. ICML 2023.
 
  [4] Wang S, Pan Y, Pu Z, et al., Deconfounded Opponent Intention Inference for Football Multi-P Policy Learning. IROS 2023.
 
  [5] Chen M, Pu Z, Pan Y, et al., Knowledge Transfer from Situation Evaluation to Multi-Agent Reinforcement Learning, ICONIP 2022.
 
  [6] Chen M, Pu Z, Pan Y, et al., All for Goals: A Stylized Automated Analysis work in Football Matches, IJCNN 2023.
 
  [7] Wang S, Pan Y, Pu Z, et al., Heterogeneous-Graph Attention Reinforcement Learning for Football Matches, IJCNN 2023.
 
  [8] Pu Z, Pan Y, Wang S, et al., Orientation and Decision-Making for Soccer d on Sports Analytics and AI: A Systematic Review, IEEE/CAA Journal of Automatica Sinica, to be published.