AI看了10萬次世界杯后,預測巴西將捧起隊史第六座冠軍獎杯,奪冠率高達25%!
大數據文摘出品
作者:Caleb
世界杯賽程來到第11天。
相信昨晚阿根廷的球迷都捏了把小汗,雖然整場下來阿根廷全場圍攻,共計23腳射門,但錯失了太多機會,包括梅西的點球,但好在下半場攻勢迅猛在開場拿下1球后乘勝追擊,最終2-0擊敗波蘭隊。
本場比賽也使得梅西超越馬拉多納,成為阿根廷歷史世界杯出場最多的球員。
小組賽繼續爆冷。在D組最后一輪比賽中,突尼斯隊以1:0戰勝開場派出非主力陣容的法國隊,但位列小組第三無緣小組出線,法國隊以小組頭名身份晉級16強。
雖然本屆世界杯進行到此尚未過半,但關于本屆世界杯冠軍的預測卻早早拉開了序幕。
會是傳統強隊巴西法國?還是有黑馬殺出?
章魚保羅光榮退休后12年,可能章魚哥自己也沒想到,自己的衣缽竟然被AI繼承了。
讓我們來看看AI對于本屆世界杯冠軍的預測是怎樣的吧~
對模型和數據庫進行優化
艾倫圖靈研究所(The Alan Turing Institute)的三位研究員Nick Barlow、Jack Roberts和Ryan Chan開發了一種統計模型。
該統計模型基于2018年一個衍生于《英超范特西》的模型AIrsenal,而AIrsenal又借鑒了Dixon和Coles于1997年推出的足球預測經典模型。
經典模型主要從球隊攻擊強度、防守強度和主場優勢出發,使用貝葉斯統計計算比賽中最有可能得分獲勝的球隊。
為了讓AIrsenal在預測國際比賽結果上更有參考價值,研究人員引入了不同洲的相對實力參數。
除此之外,研究人員在訓練模型時也采用了更為全面的數據庫。
由GitHub用戶martj42編制的數據庫記錄了自1872年以來每場足球比賽的詳細結果。數據把比賽的權重也做了一些區分和排序,比如世界杯正賽(2002年之后)和近期比賽要依次大于洲際錦標賽、預選賽和友誼賽。
GitHub鏈接:https://github.com/martj42/international_results
研究員還將FIFA官方排名輸入到模型中,以提供對球隊表現的最新估計。
今年冠軍究竟會花落誰家?
在100,000次模擬之后,AI也給出了自己的預測。
毫不意外,巴西隊一如既往成為第一大熱門,在25,000次預測中都登頂了本屆世界杯,奪冠率高達25%。
緊隨其后的是傳統強隊比利時和阿根廷,奪冠率達到了18%和13.5%。
如果你覺得現在談決賽和冠軍還有點太遙遠,我們來看看近期的比賽結果預測。
就11月29日英格蘭對陣威爾士的比賽來說,AI給出的結果是,英格蘭有大約80%的概率會從小組賽中出線,進入1/4決賽或決賽的概率則為60%,而最終奪冠的概率只有7%。
反觀威爾士,威爾士隊有50%的概率會出線小組賽,但進入決賽的概率只有2%,奪冠概率則只有0.5%。
就本屆世界杯目前表現來看,英格蘭隊1勝1平積4分,暫列小組第一。首輪6-2輕松擊敗伊朗后,卻在次輪對陣美國時表現平平。總的來看兩輪比賽下來,英格蘭還是比較順,體能消耗也不是很大,但問題是球隊的陣容還沒有面臨真正的挑戰。在淘汰賽前的最后一場小組賽,英格蘭肯定需要更多的精力去面對比賽。而威爾士整體實力雖有貝爾和拉姆塞鎮場子,但其他人因為年齡和傷病,實力明顯不如從前。
同時從兩隊交手103次的歷史成績來看,英格蘭68勝21平14負占據了絕對優勢。
而最終結果來看,英格蘭以3:0的大勝為小組賽收官,同時他們也以2勝1平的戰績排名B組第一,攜手1勝2平的美國隊出線。
巴西隊深受AI歡迎
除了艾倫圖靈研究所的模型之外,還有很多預測模型都對本屆世界杯給出了自己的預測。
比如博主@JackCuiAI在統計了1872年-2022年間的國際足球比賽數據和1922年到2022年間的國際足聯世界排名數據,并對這些數據進行了分析,提取了影響比賽的包括排名、主客場、射門次數、撲救次數、最終比分等關鍵特征之后,使用集成學習梯度提升決策樹Gradient Boosting Classifier給出了自己的預測。
在前四場卡塔爾-厄瓜多爾、英格蘭-伊朗、荷蘭-塞內加爾和威爾士-美國比賽中,AI給出了與實際結果完全一致的預測,甚至包括小組賽比分和各隊積分。
根據AI預測,本屆世界杯8強將會是荷蘭、阿根廷、西班牙、巴西、英格蘭、法國、比利時、葡萄牙,最終決賽會在巴西和葡萄牙之間展開,而最終巴西將捧起隊史第六座世界杯冠軍獎杯。
看來,巴西隊果然是深受AI歡迎。
來自多特蒙德工業大學、慕尼黑工業大學、盧森堡大學等高校的聯合研究團隊也結合多個表示球隊實力的統計模型與球隊結構(市場價值或歐冠球員數量)和原籍國社會經濟因素(人口或國內生產總值)等信息,給出了世界杯預測。
巴西隊以15%的奪冠率高居榜首,進入決賽的概率也有23.5%;阿根廷緊隨其后奪冠概11.2%;奪冠熱門第三為荷蘭隊,奪冠率為9.7%;德國、法國位列第四和第五。
研究團隊此前的預測的準確率都相當高,比如2008年和2012年的歐洲杯冠軍、2010年的世界杯冠軍等。
但是多特蒙德工業大學統計學教授格羅爾也表示,預測可能存在錯誤,否則足球比賽將變得非常無聊。
“我們提供的只是概率,而不是確定性,15%的奪冠概率也意味著85%的失敗概率。”
是啊,球場上的不確定性才是最吸引人的,你說對吧梅西。
相關報道:https://www.turing.ac.uk/blog/can-our-algorithm-predict-winner-2022-football-world-cup