當前位置:
首頁 > 科技 > 德國AI算個球:西班牙是冠軍,只要別讓德國進八強

德國AI算個球:西班牙是冠軍,只要別讓德國進八強

關鍵時刻,第一時間送達

來源 / 量子位(ID:QbitAI)

文 / 栗子&李根

歡迎下載騰訊新聞客戶端,關注科技頁卡,查看更多科技熱點新聞

可能是由於人類(包括球王)預測不靠譜,前幾屆世界盃預測戰況和冠軍的任務,常常交給動物完成。

比如,章魚哥保羅。

如果保羅活到現在,應該驚喜的發現,它的工作,現在有人工智慧系統可以代替了。

這不,在2018俄羅斯世界盃馬上開打之際,德國4位科學家聯手打造了一個世界盃AI預測模型。

綜合各種應有盡有的因素:國際足聯排名、平均年齡、頂級聯賽球員數量、國家人口比率、GDP、教練國籍等等,真真AI建模、大數據應用,雲計算加持。輕輕鬆鬆,當前準確率不知比博彩公司高到哪裡去。

最後他們鄭重其事地推出結論:西班牙勝率最大。

只是萬萬沒想到,比賽尚未開始,人類就給了AI意想不到的一擊。正所謂人算不如雲計算,雲計算難料人使絆。就在世界盃開戰前24小時,西班牙炒掉了帶隊2年的不敗戰績主教練。

AI看了都傻眼。

不過這個AI模型就這樣了嗎?拿衣服。

這4位嚴謹德國科學家自然考慮到了可能存在的變數,在10萬次比賽模擬後,他們認為:如果德國人打入四分之一決賽,那西班牙就呵呵了。

好一個神奇的AI。

講科學

一般而言,大數據預測為導向的AI,最常使用的方法有泊松回歸、排序演算法以及隨機森林,都old school,都比較經典。

而這次在綜合比較了幾種方法後,4位德國科學家決定主採用隨機森林建模,該方法誕生於2001年,比起傳統的回歸和排序,思路新得一比,預測效果也更勝一籌。

更重要的是,隨機森林附上排序演算法里的一個協變數,再經過合體進化,就能變成更加強大的演算法,甚至比博彩公司預測的還要准。

具體如何實現?

數據準備

要搞出這個AI,首先要來到數據篇,往屆世界盃對戰數據自然是題中之義,但光有比賽維度的數據又怎麼夠?

所以這個AI還把經濟因素、球隊實力、主場優勢、球隊結構,教練因素等納入其中。

經濟因素參考人口和人均GDP 。前者參考各國人口數據,並與全球總人口對比 ,看球隊所屬國對全球人口增長的貢獻。人均GDP則重在增長,用球隊所屬國的人均GDP,以及全球平均的人均GDP,來看2002至2014年的經濟增長情況。

球隊實力也從兩方面考量。一是歷史進程,使用國際足聯排名,可管窺球隊過去4年的核心表現;二是博彩賠率,把博彩公司ODDSET提供的賠率,轉換為球隊勝率納入模型。

主場優勢則有玄學意味。一看是否東道主(比如在韓國舉辦),二看是否與東道主來自同一大陸,三看屬於國際足聯六大足球協會 (CAF,AFC,UEFA,CONCACAF,OFC,CONMEBOL) 中的哪一個。

球隊結構重點針對默契度。共4項:1)最大隊友數:每支國家隊,在同一個俱樂部效力的隊員最多和第二多的人數;2)平均年齡:每支國家隊里,所有隊員的平均年齡;3)歐冠隊員數:每支國家隊,進入歐冠或歐洲聯盟杯半決賽的人數;4)海外隊員數:每支國家隊,在國外俱樂部效力的人數。

最後是教練因素。比如教練的年齡,以及在本隊職教時間的長短,都被計算在內。另外,教練的國籍是否與職教的國家隊歸屬一致,也是接近玄學的考量——但肯定沒想過會有臨陣換帥的情況。

綜上,差不多每隻參賽球隊都會有16個維度的變數。

然後就可以進入競技演化篇了。

演算法模型

就像開頭所言,這個預測AI核心主打演算法模型是隨機森林。

這種方法是Breiman在2001年提出的,如今已成了統計學模型和機器學習之間的橋樑。

法如其名,隨機森林需要建起許多的決策樹 (Decision Trees) ,讓它們來預測每場比賽雙方的進球數。

當然,系統要服用上文提到的所有變數。

然後,先讓每一棵樹都獨立生長。

再把所有樹的判斷集合到一起,進而隨機森林再做出的預測,這樣就不容易有太多偏見。

其間關鍵所在,是把樹與樹之間的相關性降到最低——

第一,樹並不是種在原始樣本上,而是在有放回抽樣 (BootStrap Sample) 的基礎上生長的。

第二,在每一個節點,所有變數中,一個隨機子集被提取出來,用於分出最完美的樹杈。

有了這兩步,每棵樹之間的相關性就變得很弱,隨機森林的不變性 (invariance)就比一棵樹更強了。

另外,除了進球數,隨機森林也可以給出勝、平、負這樣的結果。

緊接著進入演算法融合階段。

雖然一開始所說的泊松回歸模型,以及排序演算法,德國科學家認為沒有隨機森林的預測效果那麼好。

但他們覺得,這些演算法身上依然有隨機森林可以汲取的營養。畢竟預測勝負和預測進球數,是兩項不同的任務。

於是,數據篇說到的新變數,在這裡登場——

ri,rj,來自排序演算法

之前排序演算法里用到的、謎一般的球隊實力參數,就在合體過程中以新變數的身份出現了。

如此融合進化完成後,再拿幾種方法出來測一下,新演算法顯得更優秀——預測的準確度,已超過了博彩公司。

如果更早一點推出,這個AI估計能賺不少錢。

不過現在也為時未晚,2018世界盃已開盤等你。

實戰預測

拿2018世界盃演練,這個AI結果如何?

這是AI給出的結果,前三名的球隊 (拋開順序) 和許多其他演算法的預測也是一致的。

它覺得,西班牙和德國的奪冠概率相差不大,不過還是更偏愛西班牙一點點。

此外,這裡不光有每支球隊的奪冠概率,還有每一輪的晉級可能性。

有趣的是,西班牙和德意志,小組賽晉級概率非常接近,但八分之一決賽的勝率就有點拉開了。

德國科學家們說,這是因為從分組來看,德國隊更有可能在八分之一決賽遭遇勁旅,比如巴西,但西班牙更輕鬆一些。

另外,論文還給出了小組出線可能性最大的組合——

還需要指出的是,如果用每場比賽的勝負概率排列出結果,最後贏得金杯的將是德國人。

在這個維度里,之前奪冠概率最大的西班牙,不幸止步於半決賽。

也就是說,這個AI給出的終極結果是:西班牙勝率最大,但只要德國進8強,呵呵。

所以你聽懂德國科學家們的潛台詞了嗎?

無獨有偶,足球世界也一直流傳著這樣一句話:足球是22個人90分鐘的比賽,但最後贏得勝利的always是德國人。

其他預測

當然,也有其他同樣使用機器學習方案預測世界盃的例子。

數據科學家Gerald Muriuki就利用2個來自Kaggle的數據集,使用1930年第一屆世界盃以來的所有參賽隊的歷史賽事結果,打造了一個AI模型,同樣預測了所有小組賽結果,還模擬了四分之一決賽、半決賽和決賽。

直接說這個AI模型的最後預測結果:巴西將奪冠。

另外,高盛今年也繼續打造了一個機器模型預測大力神杯歸屬,在進行了100萬次比賽模擬後,最終結果也是巴西奪冠。

高盛的AI模型顯示:法國、巴西、葡萄牙和德國將打入半決賽,巴西最終將在決賽中擊敗德國。

但擅長分析和報告的高盛,在世界盃預測方面有歷史包袱,上一屆世界盃——2014年,他們也是高調預測巴西本土奪冠,然而誰料等到了一個半決賽1:7慘敗德國的結果。

需要說明的是,巴西奪冠的結果與知名博彩公司(也是一個b站)目前賠率指向一致,他們奪冠預測是:巴西>德國>西班牙>法國>阿根廷。

該前5名結果也得到另一家知名歐洲博彩組織支持,但他們的奪冠預測是:德國>巴西>法國>西班牙>阿根廷。

最後,2014年準確預測德國奪冠的EA公司,今年選擇押注法蘭西。

不過,足球場上的事兒,玄學一件,可能也會人定勝AI。

量子位的懂球帝小陳就支持巴西奪冠,他的原因很明確:一方面,巴西是唯一一支在世界盃擊敗過中國隊的冠軍球隊;另一方面,巴西和中國隊都在隊徽上綉了五顆星。

嗯,好有道理(圍笑)。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 騰訊科技 的精彩文章:

vivo「轉」基因:NEX會在新一輪手機競爭中領先嗎?
軟銀向加州數據存儲公司Cohesity投資2.5億美元

TAG:騰訊科技 |