Page 34 - 《上海体育大学学报》2024年第4期
P. 34
石慧敏, 章东迎, 章永辉. 奥运奖牌可以被预测吗?——基于可解释机器学习视角
金牌数的预测变量进行识别。具体识别过程如下: 别是乒乓球、羽毛球、游泳、跳水、马术、击剑、柔道、
①利用前文中描述的数据信息,使用随机森林模型对 自行车、摔跤、帆船,金牌可预测性强(排前十)的项目
奖/金牌数进行分项目预测训练,训练集为 1992— 分别是花样游泳、跳水、乒乓球、射箭、马术、摔跤、游
2016 年夏季奥运会数据,测试集为 2020 年东京奥运 泳、篮球、水球、帆船。从表 2 的右半部分可知,奖牌
会数据。②对每个项目的奖/金牌数预测分别构建随 可预测性最弱的 10 项是水球、现代五项、排球、网
机森林模型。具体而言,在模型训练时的超参数选择 球、曲棍球、举重、铁人三项、篮球、跆拳道、射击,金
上,将子树的数目设定为 1 000,使用均方误差来衡量 牌可预测性最弱的 10 项是跆拳道、网球、足球、现代
分裂质量,将最大解释变量个数设定为总解释变量个 五项、排球、皮划艇、赛艇、铁人三项、射击、手球。
数的 1/3。③使用 SHAP 方法对模型训练结果进行分
表 2 2020 年东京奥运会奖/金牌数预测得分前十和后十的项目
析,识别出各项目中与预测奖/金牌数关系最为密切的
Table 2 Top 10 and Bottom 10 predictable events in Tokyo
特征变量。
Olympic awards/gold medal forecast
3.1 不同项目可预测性的差异 预测得分前十 预测得分后十
利用前述模型对 2020 年东京奥运会不同项目每 奖牌项目 得分 金牌项目 得分 奖牌项目 得分 金牌项目 得分
乒乓球 0.845 3 花样游泳 0.970 7 水球 −0.022 6 跆拳道 −0.578 0
个代表队的奖牌数和金牌数进行预测。基于预测结果
羽毛球 0.842 4 跳水 0.908 2 现代五项 0.058 2 网球 −0.317 5
和真实值之间的对比,评估在不同项目上模型预测的
游泳 0.833 9 乒乓球 0.819 7 排球 0.101 8 足球 −0.259 9
准确程度。笔者发现,虽然竞技体育普遍具有高度的 跳水 0.831 4 射箭 0.786 8 网球 0.166 4 现代五项 −0.161 3
不确定性,但不同项目的不确定程度存在非常大的差 马术 0.793 2 马术 0.695 6 曲棍球 0.230 7 排球 −0.143 7
异。每个项目参与代表队的多少、各代表队实力的分 击剑 0.713 9 摔跤 0.680 9 举重 0.249 4 皮划艇 −0.076 7
柔道 0.710 8 游泳 0.654 0 铁人三项 0.295 4 赛艇 0.107 7
布以及项目本身的偶然性都会影响奥运会项目的可预
自行车 0.705 8 篮球 0.633 5 篮球 0.300 1 铁人三项 0.153 6
测性。
摔跤 0.668 4 水球 0.632 5 跆拳道 0.392 1 射击 0.189 2
主要通过样本外预测表现评估不同项目的可预测 帆船 0.652 8 帆船 0.625 3 射击 0.496 7 手球 0.230 1
性。样本外预测是在训练数据集之外的测试数据集上
项目的可预测性强主要是因为有一个或少数几个
评估模型表现的一种方法,能直接反映模型在新数据
代表队在该项目中具有超强实力。例如:中国在乒乓
上的表现, 但往往需要足量且能分出独立测试集的场
球项目上强大的综合实力导致奖牌的可预测性较强;
景。笔者主要关注对 2020 年东京奥运会的预测,并对
而在花样游泳项目上,俄罗斯队在双人赛和团体赛上
样本进行了固定的分割:1992—2016 年数据作为训练
样本,2020 年东京奥运会数据作为测试样本。因此, 连续 6 届蝉联冠军,花样游泳项目金牌的可预测性最
该结构适合进行样本外预测评估。另外,未采用机器 强。项目的可预测性弱主要是因为参与该项目的代表
学习中最常用的交叉验证来评估模型,原因在于该方 队众多,同时实力较为接近,导致竞争激烈。例如,在
法适用于数据量较少或需更细致评估模型稳定性的场 足球项目上有 19 个代表队都曾获得金牌或奖牌。同
时,奖牌的可预测性和金牌的可预测性也存在差异。
景,同时交叉验证对样本的随机分割并不适用本文的
例如,在金牌的可预测性上篮球位居第八,在奖牌的可
R 2
数据。因此,主要采用固定样本分割的样本外预测
(可决系数)作为预测得分评估不同项目的可预测性, 预测性上则位于倒数第八,这主要是因为历史上曾经
分数越高,代表可预测性越强,项目的不确定性越低。 有 16 个代表队获得奖牌,但只有 4 个代表队(美国、独
当然,也可采取其他评估标准,如预测的均方误差等。 联体、阿根廷和拉脱维亚)夺得金牌。同时,在篮球项
R 的一个优点是该测 目产生的 18 枚金牌中,独联体、阿根廷、拉脱维亚各
2
但与其他标准相比,样本外预测
度不受测量单位的影响,易在不同项目之间进行可预 自只获得 1 枚金牌,其余 15 枚金牌都为美国队所得。
测性比较。 此外,一些项目(如射击)在比赛时运动员发挥的或然
性较高,其金牌和奖牌的可预测性都位居后十。
表 2 为 2020 年东京奥运会奖/金牌数样本外预测
R 排在前十和倒数前十的项目以及得分。从表 2 的左 3.2 各变量对不同项目预测结果的贡献程度
2
半部分可以看到,奖牌可预测性强(排前十)的项目分 以奥运会足球、篮球、排球三大球项目为例,展示
30