今年我打算深入研究定位球。我知道我已经多次提到过这一点,这也是我今年的目标之一——但生活总是会打乱所有的计划。如今,我已经做了很多关于指标开发的工作,在年底之前,我想和大家分享最后一个与定位球相关的指标开发/方法论。
我在一些任意球上做了点事情:
- 角球威胁评分:衡量球员通过处理内旋和外旋角球所产生的威胁
- 任意球威胁评分:衡量球员通过间接任意球罚球所产生的威胁
- 可操作分析:个体头球评分 (IHR) 确定防守与进攻的选择
- 掷界外球成功:通过强调掷界外球的套路和技巧来产生射门
- 角球控球指数:衡量球队在完成进攻角球后的控球质量
但是,我想做一个更深入的,基于个体头球评级(IHR)思路的最终尝试。我单独分析了球员在头球方面的潜力贡献,但球队在定位球中的表现如何评估呢?这就是我通过引入SPER来说明的。SPER是一种衡量球队在定位球中预期进球差异的评级方法。
为什么选择这个指标来分析定位球?这个特定的指标其实并不是特别必要。其中一个原因是我想试着根据预期进球来制定一个定位球的排名。不过,有了这个洞察,我们可以创建一种评估球队在定位球的预期进球表现的方法,并据此判断是否应该依赖它们。
换句话说,通过这个指标,我们可以得出团队在定位球xG方面的表现如何的结论。这可以让我们得出一些结论,说明为什么团队需要依赖他们的定位球战术,或者需要改进他们的非定位球进攻,以提高他们的获胜机会。
角球控球率:评估球队在角球进攻后的控球情况。最近一年来,我越来越多地关注与定位球相关的数据,特别是角球。它……marclamberts.medium.com通过这个指标,我们可以把它和每个人的头球表现评分结合起来,从而在个人和团队层面获得更深入的分析结果。
数据收集与呈现这个项目用到的数据来自Opta/Statsperform,收集日期为2024年12月18日。所有的数据均为原始事件数据,从中开发出了XY坐标数据。基于这些数据,我们开发并绘制了各种指标,并进行了相应的计算和处理。
数据来自2024-2025赛季的荷甲,既包含比赛级别的数据,也包含赛季级别的数据。没有对数据进行任何过滤处理,但这是在下一次更新时可以实现的功能,我将在文章后面详细解释。
这关注的是团队的表现,因此定位球产生的预期进球(xG)是为每个团队生成的,而不是为个人球员。我们可以为球员拆分这些数据,但这将不再如实地反映情况。当我们从团队层面来看,定位球产生的预期进球通常是由于一次好的传球配合造成的,如果从个人角度来看,这样的贡献就不会被体现出来。
市面上有许多提供XY数据的供应商,但我还是使用Opta的数据。因为我之前所有关于事件数据的研究都是基于Opta数据的,这样可以保持工作的连续性并增强可信度,使其与我的先前研究保持一致。
可操作分析:个体头部评分(IHR)决定防守者与进攻者的抉择在2024–2025新赛季中,我想尝试一些新事物。我一直尝试创新(比如创建新的…… 什么是定位球?这可能看起来是一个简单的问题,但我们还是得聊聊。在数据里,我们的xG有各种不同的筛选条件(注:xG为技术术语)。
所以,我们需要区分不同的戏剧或比赛。我们将重点放在定位球上,但,如你所见,可以看到,有各种不同的因素。
- 任意球配合:来自交叉球的射门
- 角球:来自角球的射门
- 直接任意球射门:来自直接任意球的射门
- 界外球配合:来自掷界球的射门
这些定义来自Tom,详情请见https://github.com/tomh05/football-scores/blob/master/data/reference/opta-qualifiers.csv。
我将不考虑这次罚球。尽管这确实是一个角球,但这次单独的情况对预期进球的影响很大,因此我决定不考虑这次情况。这并不能反映比赛的实际水平,而是反映了射门技巧的质量。
研究方法在从我原始数据中获取SPER之前,我需要完成几个步骤。第一步是将我现有的射门转换为带有预期进球值的射门。这里指的是哪些射门?
- 偏出或越出球门的射门: 任何射正但偏出或越出球门的射门
- 门柱: 球击中门柱或球门柱
- 射门被扑出: 记录射门球员的被扑出射门
- 进球: 所有进球
我们将这4个事件转化为具有附加值的射门,通过使用我自己的预期进球(xG)模型处理它们,该模型是基于荷甲(即埃因霍温联赛)中40万次射门训练的。然后我们会得到一个Excel/CSV文件。
这是我们正在处理的核心,但下一步是计算并生成每场比赛对每一方的具体影响。这不仅会增加xG值,还会计算出每一方的胜率(百分比)和基于预期进球的预期得分。
所以,我有了两个构成我方法论和计算基础的Excel文件。接下来,我将专注于创建一个新的评分标准:SPER()。
那得用Python来做,因为Python就是我常用的编程语言,还需要准备一些东西。
此分析结合比赛结果和预期进球(xG)数据来评估球队表现,通过Glicko-2评级系统动态评估。比赛结果是根据主队和客队的xG值来决定的。根据xG值来判定胜、平或负。
此外,例如“角球”和“任意球”这种特定类型的进攻,其xG数据会被筛选出来并计算每个队伍的平均值。
缩放因子(0.1)确保调整按比例进行,使结果保持在0到1的范围内。
Glicko-2系统在每场比赛后根据调整后的比赛结果S更新队伍的等级。每个队伍都有一个等级(R)、等级偏差(RD)和波动性σ。更新基于对手的等级和RD,并结合调整后的比赛结果S来进行。系统会根据这些参数计算新的等级。
这显然是为你们这些技术数学家准备的,这是通过Python代码完成的计算。通过转换为Python代码,我们得到了可以直接用于分析的Excel。
用网络分析量化足球中的无球贡献:无球影响力评分……这可能是我迄今为止最棒也是最吓人的项目。吓人是因为它可能充满了缺陷,但同时也是最好的,因为……marclamberts.medium.com 解析:有了Excel文件中的数据,我现在有了每个球队在2024-2025赛季的上半段的每个比赛日的评分情况。这显示了每个球队的表现以及他们在赛季初期的进步。
在上面的条形图中,你可以看到荷甲的最终评分,包括平均值。条形图中还包含了每个球队的先前评分。费耶诺德、特温特、AZ、PSV和阿贾克斯在团队表现评价体系(SPER)评分中表现最佳。福图纳·西特哈德、PEC Zwolle、NAC布雷达和瓦尔维克在SPER评分中表现最差。
在上面的折线图中,你可以看到前五名埃迪迪斯球队的SPER评分在整个赛季中是如何变化的。正如我们所见,费耶诺德稳步变好,而PSV的轨迹则更为引人注目,一开始很高,之后再次上升。阿贾克斯在最后几周确实下滑了。
最后的感想Glicko-2评分系统提供了一种清晰的方式来根据比赛结果和平均预期进球数(xG)来排名荷甲球队。该系统动态调整评分,同时考虑了球队状态和对手强度,而xG则通过反映进球机会提供了更多的背景信息。这种方法比传统的排名更能准确地反映球队的真正表现。然而,其准确性依赖于准确且可靠的xG数据以及用于调整的缩放因子。总体而言,该系统适用于追踪球队的进步和比较实力,为球迷和分析师提供了宝贵的见解。