相关体育分类 | ||
葡超直播 | 葡超直播 | 西甲直播 |
意甲直播 | 德甲直播 | 法甲直播 |
西甲球队 | ||
前言:再次科普XG与“真实射门得分率”
本专栏时隔许久再次回归,第一件事仍旧是重新科普一下目前应用最广的高阶数据:预期进球(Expected Goal,通常简称XG),以及由XG衍生出的“真实射门得分率”。
所谓“预期进球”(XG),是指每次射门的进球概率。这一概念最早由OPTA公司提出,目前已经算不上什么新鲜数据,只不过国内有很多足球媒体人甚至所谓的“业内人士”的科普都是错的。这里首先给出一个OPTA公司在解释这一数据时所用视频的截图:
这个视频要告诉我们的是:按照过去所采集到的大量射门数据(OPTA一般会采用“过去30万次射门”这样一个样本),根据这次射门的角度、距离球门的距离(当然,现在考虑的因素已经非常多了),这次射门的进球概率是35%,那么在XG系统中就记为0.35。假设一个球员整个赛季打出100次射门全部是这个情况,那么他的XG就是35。
这里我们要注意的是:XG是一项发生在射门之前的统计,它量化的不是“射门质量”,而是“射门难度”。换言之,同样的环境下,我奶奶和罗纳尔多去踢都是完全一样的“进球概率”。那么罗纳尔多进球了,我奶奶没进球,这说明什么?很显然,这说明罗纳尔多的射门能力强。于是我们有了下一个推论:
能否用XG来计算射门能力?换言之,能否用XG来计算一个球员“修正射门难度”的能力?
这就是我自己提出“真实射门得分率”的动因所在。它的计算公式是“真实射门得分率=(进球数-XG)/射门次数”。目前比较专业的数据网站(不包括whoscored这种基础的)都能查到一名球员的进球数与XG之间的差值,但这里面的问题在于,我们不知道这个差值是多次射门累积的结果还是少量射门之下的小样本产物。因此要用这个差值同射门次数做比,最终求得“平均每次射门修正射门难度的能力”。
这样的算法公平吗?
只要样本足够大,非常公平。至少相对于以往的“进球+助攻”的量化方式而言,是一个巨大的进步。
举例来说,我们都知道一个射手王如果进球中包含大量点球,那么对其射门能力的评估就会存在水分。但引入该计算方法会让结果截然不同。因为点球的XG高达0.76,换言之打进一粒点球,你所收获的“真实射门得分率”只有24%,再打丢一个XG仅为0.24的射门(这样的射门非常多),就会让你从点球中收获的评分加成荡然无存。反之,轰进一脚世界波的收获,又绝非几次高难度射门不进所能掩盖。比如下图中孙兴慜的这脚弧线,xg只有0.01,它在“真实射门得分率”算法中的价值就绝非一粒进球这么简单了。
当然,这个算法只顾及了效率,而没有顾及产量。因此每个赛季处于评分榜首的往往是射门不多但远射比例很大的中场。因为这些远射就算不进损失也不大,一旦进了则是巨大加成。因此我们必须多维度的考量,这里我在产量方面使用“每90分钟射门次数”这一统计。看看过去一个赛季,五大联赛谁的射门最多,谁的射门最准。为防止小样本个案混入,我们将条件限制为“射门次数不少于40次”。
英超:孙兴慜试比天高,瓦尔迪老而弥坚,德布劳内最终封王
横轴为每90分钟射门次数;纵轴为真实射门得分率;圆点大小代表平均每次射门预期进球数;颜色深浅代表进球数。
纵轴最顶端被中场占据并不稀奇,诡异的是这个区域最靠右的居然还是中场——德布劳内意外地成为了上赛季英超最能兼顾射门效率与产量的球员。当然,这很大程度上要拜曼城无孔不入而又全民皆兵的传控渗透所赐,德布劳内在这个体系中如鱼得水。比如下图中德布劳内先通过直塞撕破对手防线,再利用这次渗透获得近距离射门机会,此球xg达到相当不错的0.31:
同为中场的史密斯-罗、罗德里等人很难有这样的待遇,他们更多是凭借数量较少但难度极高的射门跻身榜单。当然,样本越小,意外因素就越大。比如史密斯-罗下面这个进球,xg只有0.06,但实际上这球难度并没有这么大,因为对方门将德赫亚受伤了:
这也是XG计算系统难以克服的天然难题——如前所述,该系统的样本库是过去一段时间内的大量射门,opta一般是“过去30万次”,wyscout则是“过去5年的射门”,两个数据库得出的结论相差不大。问题是不管哪一个样本库都不可能找到足够数量的守门员受伤导致无法扑救的案例。因此这种球只能将错就错算成一脚难度极大的世界波。
当然,类似情况是非常少见的,我们也可以看到史密斯·罗在表达产量的参数当中表现都很一般。我们之所以引入产量元素,也是因为多数情况下前锋很难在纯效率维度同中场竞争。但上赛季英超有两个例外:亚洲天王孙兴慜和老而弥坚的瓦尔迪,捍卫着射手们的荣耀。
孙球王整季的惊人表现自不待言,倘若结合非惯用脚考评,孙兴慜的射术实属当世顶级。下图这脚抽射xg仅为0.03:
此外,近年来越发流行的边路任意球向后门柱似传似射的踢法,也属实帮助很多脚法好的定位球手攒足了数据,下图这叫任意球,xg仅为0.06:
而瓦尔迪的励志程度恐怕丝毫不亚于孙兴慜这为亚洲之光。已然35岁的瓦尔迪整季交出12.66%的超高真实射门得分率,高居英超第二。理论上讲老将保持射门精度相对容易,但要像下图中的瓦尔迪一样在如此高龄靠爆发力超过对手并拧着腰把xg仅为0.08的射门抽进去,就委实难能了:
横轴最右边聚集了一大堆开火权拉满的射手,其中C罗射门环节差强人意,萨拉赫则是利物浦生涯最差。C罗我们会在其去向明确后专门写一篇文章深度讨论,这里先说萨拉赫:埃及法老上赛季的表现可以说是6个赛季以来最差的一季,其真实射门得分率首次跌破0:
严格来说如此表现是配不上英超最高开火权的。然而马内与若塔的准星也没好到哪里去,再在队内调整恐怕也是巧妇难为无米之炊。休赛期引进在葡超真实射门得分率高达12.73%的努涅斯,一向有重视数据分析之名的利物浦恐怕没少采取类似算法评估球员。
至于整季射门最糟糕的前锋,自然非拉卡泽特莫属。此人整季交出-11.67%的“逆天”真实射门得分率,其中不乏一场比赛两次荒腔走板的近距离射门不中:
受此影响,阿森纳在多名中场射门准星爆棚的情况下,以-1.43%的真实射门得分率排在英超倒数第6……找一个好射手,就是这么重要。
西甲:本泽马球权拉满,维尼修斯大爆发
横轴为每90分钟射门次数;纵轴为真实射门得分率;圆点大小代表平均每次射门预期进球数;颜色深浅代表进球数。
本赛季本泽马关键时刻屡屡救主,俨然有问鼎金球的趋势,外界都认为此人在34岁高龄突然打通任督二脉,实际上他在联赛中0.97%的真实射门得分率别说同其他人横向对比稀松平常,甚至在自己的职业生涯中也算小年。此人真正的厉害之处有三:
其一,皇马中场强大、边锋成群,唯独缺乏前场接应点。结果给C罗当了几年僚机的本泽马在生涯晚期突然化身禁区纯爷们,每90分钟6.04次禁区内触球高居西甲第二。皇马进攻机会由谁开发不得而知,但一大半的终结重任只能落在本泽马身上,多数时候他如果拉扯出禁区,那么抢点的就只剩下状态大跌的阿森西奥或干脆某个偶尔插上的后卫了。
其二,本泽马生涯末年开火权拉满的同时,前期积攒的全面技能毫无退化迹象,结果俨然以无所不能的姿态成为足坛罕见的怪物。多数前锋是越老技能越单一、专精,唯独本泽马,年事虽高却补短板不影响长板。
其三,欧冠IP价值太大,皇马这赛季一路逆转夺冠,说是后靠裤袜前靠奔马毫不为过。别看本泽马在联赛的真实射门得分率仅只堪堪过0,此人在欧冠小样本下可是轰出了15.45%的恐怖真实射门得分率。这里面除了“天道酬勤”、“运气上佳”之外,还包括一些偶然因素导致XG算法崩溃的现象,比如下图就和史密斯·罗抽德赫亚的那脚类似——任何公司的XG系统都不可能把“守门员出击到禁区外留空门”给专门列一个样本类型。本泽马这球说是XG只有0.07,实际上单就射门而言并不难:
当然,到大样本的联赛中,本泽马这一效率是不足以撑起球队进攻的。尤其是也没几个西甲球队会面对皇马选择压上来死磕,本泽马那套逼抢门将的绝活用武之地还真不大。那么皇马又是如何轰出西甲最高进球数?除去竞争对手拉胯之外,最重要的因素自然是维尼修斯突然开窍。
上赛季维尼修斯打出8.36%的真实射门得分率,位列西甲第三。是,偶尔某个赛季打出8%以上的真实射门得分率没什么值得大惊小怪的,但要知道,这可是维尼修斯……此人之前的履历,展现出的不是“快乐”,而是“压根就不会射门”……这里放一个维尼修斯生涯至今真实射门得分率变化图(由于在巴西联赛出场时间较少,将两个赛季合成一个赛季):
事实是:自登陆西甲以来,刚刚过去的21-22赛季是维尼修斯第一次将真实射门得分率打到正数,在此之前他甚至不是“不到0”这么简单,而是“西甲最差射手”,其射门只能用荒谬来形容。谁能想到,第一次正值,就是西甲第三的水准……
一年之前,你能想到下图是维尼修斯能干出来的事么:
另外要注意的是横轴最右端的贝贝和纵轴下端我用黄色高亮标注出的费兰-托雷斯。贝贝效力于巴列卡诺,身为一名边锋竟然每次射门预期进球数只有0.035,为西甲最低;偏偏此人每90分钟射门次数高居西甲第一,也不知道此人哪来的自信去贯彻这种“遇事不决抡一脚”的球霸打法。五大联赛头号浪射王非他莫属。
费兰-托雷斯则是交出了真实射门得分率-5.12%的离谱答卷。好在此人曾在英超于小样本下打出过还算不错的射门履历,后续如维尼修斯一般爆发也未必不可能。只不过以巴萨现在的前场阵容还能给他多少发挥空间?
德甲:无需担心莱万与哈兰德
横轴为每90分钟射门次数;纵轴为真实射门得分率;圆点大小代表平均每次射门预期进球数;颜色深浅代表进球数。
22年夏天德甲遭逢打击,两大中锋同时离开。某种意义上,球队放弃这二人似乎可以接受,尤其是莱万在33岁的年纪迎来了比较明显的生涯小年。但结合二人履历,巴萨与曼城又不用太过担心。
我们先看莱万最近7个赛季真实射门得分率变化:
莱万其实整个生涯基本都维持在2%上下的真实射门得分率,说是21-22赛季为生涯小年,实际上是因为此前两季出现爆发,让人们产生了误判而已。这并不是说莱万不厉害,而是他这个段位的射手,效率相对较低是完全可以用产量来弥补的。注意上面的圆点图:莱万在横轴上是无人能出其右的,换言之只要莱万维持住差不多的效率,就能够靠产量支撑起自己顶级中锋的档次。
再看哈兰德,由于哈兰德太过年轻,我们只能从他在奥地利大爆发然后加盟多特的那个赛季开始算,到现在也不过三个赛季:
诚然,哈兰德的真实射门得分率确实是一路走低,但如果我们看一下纵轴的刻度就会发现问题:哈兰德在19-20赛季打出了惊人的超过12%的真实射门得分率,接下来的大滑坡只不过是相对于那个神奇的赛季而言,实际上仍旧维持在6%以上的高水准。即便3个赛季样本还是太小,但有这个底子在,就算差能差在哪里?要知道哈兰德顶替的斯特林之流,极有可能这辈子都没法在顶级联赛打出这样的数据了……
意甲:世界波鬼才默滕斯
、
横轴为每90分钟射门次数;纵轴为真实射门得分率;圆点大小代表平均每次射门预期进球数;颜色深浅代表进球数。
意甲的面孔相对比较熟悉,最值得一提的是高居纵轴顶端的默滕斯。此人整季不过40脚射门,将将达到上榜条件,但却动辄来一脚惊世骇俗的世界波,算得上少而精的典范。高达16.48%的真实射门得分率,也让他成为五大联赛21-22赛季射门最准的人。下面两个进球,xg分别只有0.04和0.03:
法甲:梅西生涯最低谷
横轴为每90分钟射门次数;纵轴为真实射门得分率;圆点大小代表平均每次射门预期进球数;颜色深浅代表进球数。内马尔使用了“桑托斯”这个名字
很遗憾,出于种种原因,梅西终于也迎来了这一天。在此之前,从有数据可查的2015-16赛季至今,无论如何波动,梅西都从未出现过真实射门得分率为负的情况:
出现这一情况的原因十分复杂,我们会在合适的时候专门写一下梅西在巴黎的角色转换。这里面有一个非常不好的信号是:梅西上赛季不仅是射门准星丢失,就连一贯擅长的盘带也出现了下滑,在此之前,梅西至少是能在效率和频率之间保住一项的。这里我们选取五大联赛出场时间不少于800分钟且每90分钟射门不少于2次的前腰以及所有前场球员作为样本,做一个八维图:
理论上相较于射门,持球推进环节才是最值得担心的,毕竟这一环节受身体状态影响更大。但好消息是,梅西还有传球特长,职业生涯末年不排除位置向后改打中场的可能性(实际上他在21-22赛季的主要位置已经被一些数据网站定义为前腰了)。
很久不再写稿、做数据,这一篇写下来,老一辈射手的逐渐老去带来的唏嘘感是最强的。数据会无情地记录当下发生的一切,就像年轮记载着树木的年龄。满是年轮的老树也许不再发芽,但它毕竟曾为我们遮风挡雨。
在这篇文章中,我们写到了30多岁的瓦尔迪、C罗、本泽马、默滕斯、莱万、梅西,仔细看图,你还会发现伊布这样的老人的名字。好消息是,他们其中的很多人依旧是顶级水准,似乎现代足球正在用越来越科学的训练方法和战术认知,延续我们的梦想中的青春。
(花花午夜嚎叫)
利物浦队球员 | ||
米尔纳 | 拉拉纳 | 恩里克 |
科洛·图雷 | 丹尼尔·阿格 | 阿尔伯托 |
苏亚雷斯 | 史蒂文·杰拉德 | 阿斯帕斯 |
菲利佩·库蒂尼奥 | 乔丹·亨德森 | 斯图里奇 |
玛玛杜·萨科 | 西蒙·米尼奥莱特 | 艾伦 |
约翰·弗拉纳根 | 佩德罗·奇里贝拉·博格斯 | 阿达姆·波格丹 |
马丁·斯科特尔 | D.卡尼路 | R.门基艾瑞 |
P.奥斯翰 | 海梅.阿拿斯 | L.靴南迪斯 |
伦德罗斯 | 奥斯.卡塞伦 | 赫伯特.索萨 |
加西亚 | M.莫厉娜 | J.巴里奥斯 |
顶部