请选择 进入手机版 | 继续访问电脑版
搜索
查看: 114|回复: 2

世界杯还没踢,AI已经把冠军预测出来了。

[复制链接]

该用户从未签到

16

主题

31

帖子

82

积分

注册会员

Rank: 2

积分
82
发表于 2018-6-13 14:18:22 | 显示全部楼层 |阅读模式
2018年世界杯开幕在即,谁会赢得最后的冠军?

上届2014年巴西世界杯,东道主巴西队意外爆冷,只获得第四名,无缘决赛。
今年的世界杯,各种预测和民意调查显示,冠军将在巴西、德国和阿根廷之间展开。
而不少机构/研究人员更是锁定,德国将和巴西争夺冠军。   

俄AI预测:德国
据中新网6月9日消息,俄罗斯卫星网报道,俄罗斯彼尔姆国立研究大学消息,该校学生制造出的人工智能(AI)预测德国队将在2018年世界杯中夺冠。

报道称,彼尔姆国立研究大学物理系大四学生维克多•扎科派洛建立了一个能预测2018年世界杯冠军的神经网络。

此前,扎科派进行了大量的研究,得出了对比赛结果产生最重要影响的几条标准,然后将数据输入网络。消息称:“神经网络综合各项参数进行分析计算后得出结论称,世界杯前三名将是德国队、巴西队和阿根廷队。”

神经网络还预测,俄罗斯队将在32支队伍中排名27。也就是说,人工智能甚至不认为俄罗斯队能在小组赛中出线。

彼尔姆国立研究大学称,这项预测的准确度超过80%。

神经网络的制造者扎科派洛强调,预测足球赛冠军是一项艰巨任务,特别是有两支力量相当的队伍的时候。扎科派洛认为,天气、裁判、球员心情、球场状态、球员身体状况、伤势和在比赛中的碰撞都会影响比赛结果。因此,他在研究中使用了2006年、2010年和2014年世界杯的数据资料。

而肯尼亚一家投资银行分析师Gerald Muriuki公布说,他使用机器学习预测巴西将赢得冠军。
这一结果跟微软的AI和数据科学专家Sorin Peste的预测结果一致。

实际上,预测世界杯冠军是一个典型的机器学习问题,你首先预测每场比赛的获胜者,接着再预测小组赛、半决赛和决赛的冠军。在这个过程中,你需要进行数据整合、特征建模和结果预测。因此,很多机器学习或数据科学家,都做过类似的项目。

Muriuki和Peste两个人都是根据足球比赛的历史数据,建立机器学习模型,模拟比赛,并预测这些比赛的结果。下面我们分别来看看。

使用逻辑回归进行预测
Muriuki使用了两个来自Kaggle的数据集,包含了从1872年到2017年国际足球比赛的结果。他先分析了两个数据集,做了一些特征工程,选择跟2018年世界杯最相关的特征进行预测,再足控了一些数据增强。

在模型的选择上,Muriuki用的是逻辑回归,一种分类器算法。逻辑回归通过使用逻辑函数预估概率,从而衡量分类因变量和一个或多个自变量之间的关系。简单说,给定一组相关的数据后,逻辑回归能够预测结果(在世界杯的情况下,就是预测是输还是赢)。

这是他的模型预测最初几场比赛的结果:俄罗斯vs沙特,俄罗斯胜利;乌拉圭vs埃及,乌拉圭胜利;伊朗vs摩洛哥,平局。4天以后就可以验证这个结果是对还是错了。

1.png

16强的结果是这样的:
2.png

四分之一决赛将在葡萄牙vs巴西,以及德国vs阿根廷之间展开。

3.png
最终巴西vs德国,巴西获胜。

4.png

使用随机森林进行预测

另一方面,微软的AI和数据科学专家Sorin Peste的预测过程则更加完善。在数据的选择上,除了历年世界杯结果,Peste还使用了欧洲杯、奥运会等大型比赛的数据,以及这些比赛的胜率分布。

5.png

6.png

此外,Peste还考虑了比赛的地址,也即是在主场、客场还是在双方都无关的中立场所,以及比赛是否“friendly”,在踢friendly比赛时,目的不是为了赢球,而是为了观察对手的球员和策略。

在模型的选择上,Peste用的是随机森林(深度500),一种根据呈现给它的特征生成多个决策树的算法,并且每个单独的树对每个新输入向量的结果“投票”。随机森林的速度快,相当准确,可以对泛化误差进行无偏估计,因此不需要交叉验证。

下图展示了迭代1000次后的结果,巴西获胜,阿根廷第二。

7.png
统计的方法:德国战车险胜巴西

当然,除了机器学习,还有更多预测是使用大数据方法。KDnuggets上一位狂热球迷用统计的方法,预测德国队会夺冠。他的操作步骤如下:

收集信息:

国际足联世界排名:这是所有211支国家足球队的排名系统。使用积分系统,积分是基于所有FIFA认可的国际比赛的结果。然而,这并不是最好的系统,而且有很多缺点。

Elo评级:该系统最初是为国际象棋联合会FIDE开发的,目的是给棋手打分。它的复杂矩阵根据比赛的类型分配点数,并考虑到双方的净胜球差异。它和国际足联的主要不同之处在于,它也统计了友谊赛的数量。

TransferMarkt team value:这个总部位于德国的网站提供了关于足球各个方面的信息,包括每个知名球员的估计市值。他们列出了参与国的名单和他们的团队价值。

投注赔率:使用投注比较网站OddsChecker,采用每个国家最慷慨的赔率。

TransferMarkt的数字是欧元,而FIFA和Elo有他们自己的评级系统,投注赔率是分数。作者将每一个系统都标准化,使它们具有可比性。在统计中,标准分数(也称为z分数/值,正常分数或标准化值)是数值与平均值不同的标准偏差数。

8.png

2018年世界杯,四个流行的预测来源

9.png

KDnuggets预测的z分数
如果KDnuggets的预测是正确的,那么世界杯小组赛的结果会是下面这样的:

10.png

德国排名第一,但仅略高于巴西。紧随其后的是西班牙和法国。
Elo排名系统和投注几率看起来最相似,都列出了相同的前五名(上面提到的四个球队和阿根廷)。
在整个体系中有一些鲜明的对比,其中最引人注目的是秘鲁在国际足联(FIFA)和Elo排名中z分数都排在第10位,而在TrasferMarkt的球队价值排名却在第30位。

除了KDnuggets上的预测,还有诸多世界杯赛前的其他预测:

《每日电讯报》对每支球队进行了广泛的分析,最后进行了一项投票,让读者预测冠军,投票结果如下:

11.png

四年前,巴西在家门口以1:7输给了德国队,创下了自1920年0:6输给乌拉圭以来最大的世界杯输球记录,震惊全国人民。最终,德国队夺得了当年的世界杯冠军。

今年的俄罗斯世界杯,诸多机构预测巴西和德国将上演冠军大战。巴西能否一雪前耻,德国能否成功卫冕?我们拭目以待。

回复

使用道具 举报

  • TA的每日心情
    奋斗
    昨天 08:59
  • 签到天数: 119 天

    [LV.6]常住居民II

    4

    主题

    294

    帖子

    843

    积分

    高级会员

    Rank: 4

    积分
    843
    发表于 2018-6-14 08:54:24 | 显示全部楼层
    基本上夺冠最大热门,都会被干掉
    该会员没有填写今日想说内容.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    昨天 19:24
  • 签到天数: 538 天

    [LV.9]以坛为家II

    6

    主题

    1523

    帖子

    6718

    积分

    金牌会员

    Rank: 6Rank: 6

    积分
    6718
    发表于 2018-6-14 09:29:22 | 显示全部楼层
    期待巴西啊,
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    关闭

    站长推荐上一条 /3 下一条

    小黑屋|手机版|Archiver|恩智浦技术社区   

    GMT+8, 2018-6-22 00:24 , Processed in 0.074801 second(s), 11 queries , MemCache On.

    Powered by Discuz! X3.4

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表