Page 34 - 《上海体育大学学报》2024年第4期
P. 34

石慧敏, 章东迎, 章永辉. 奥运奖牌可以被预测吗?——基于可解释机器学习视角

           金牌数的预测变量进行识别。具体识别过程如下:                              别是乒乓球、羽毛球、游泳、跳水、马术、击剑、柔道、

           ①利用前文中描述的数据信息,使用随机森林模型对                             自行车、摔跤、帆船,金牌可预测性强(排前十)的项目
           奖/金牌数进行分项目预测训练,训练集为                      1992—      分别是花样游泳、跳水、乒乓球、射箭、马术、摔跤、游
           2016 年夏季奥运会数据,测试集为              2020 年东京奥运          泳、篮球、水球、帆船。从表             2 的右半部分可知,奖牌
           会数据。②对每个项目的奖/金牌数预测分别构建随                             可预测性最弱的         10 项是水球、现代五项、排球、网
           机森林模型。具体而言,在模型训练时的超参数选择                             球、曲棍球、举重、铁人三项、篮球、跆拳道、射击,金
           上,将子树的数目设定为            1 000,使用均方误差来衡量              牌可预测性最弱的         10 项是跆拳道、网球、足球、现代
           分裂质量,将最大解释变量个数设定为总解释变量个                             五项、排球、皮划艇、赛艇、铁人三项、射击、手球。
           数的  1/3。③使用     SHAP  方法对模型训练结果进行分
                                                              表 2    2020 年东京奥运会奖/金牌数预测得分前十和后十的项目
           析,识别出各项目中与预测奖/金牌数关系最为密切的
                                                                Table 2    Top 10 and Bottom 10 predictable events in Tokyo
           特征变量。
                                                                         Olympic awards/gold medal forecast
            3.1 不同项目可预测性的差异                                          预测得分前十                   预测得分后十
               利用前述模型对        2020 年东京奥运会不同项目每                 奖牌项目 得分 金牌项目 得分        奖牌项目    得分   金牌项目 得分
                                                               乒乓球   0.845 3 花样游泳 0.970 7 水球  −0.022 6   跆拳道  −0.578 0
           个代表队的奖牌数和金牌数进行预测。基于预测结果
                                                               羽毛球   0.842 4 跳水  0.908 2 现代五项 0.058 2 网球  −0.317 5
           和真实值之间的对比,评估在不同项目上模型预测的
                                                               游泳    0.833 9 乒乓球  0.819 7 排球  0.101 8 足球  −0.259 9
           准确程度。笔者发现,虽然竞技体育普遍具有高度的                             跳水    0.831 4 射箭  0.786 8 网球  0.166 4 现代五项 −0.161 3
           不确定性,但不同项目的不确定程度存在非常大的差                             马术    0.793 2 马术  0.695 6 曲棍球  0.230 7 排球  −0.143 7
           异。每个项目参与代表队的多少、各代表队实力的分                             击剑    0.713 9 摔跤  0.680 9 举重  0.249 4 皮划艇  −0.076 7
                                                               柔道    0.710 8 游泳  0.654 0 铁人三项 0.295 4 赛艇    0.107 7
           布以及项目本身的偶然性都会影响奥运会项目的可预
                                                               自行车   0.705 8 篮球  0.633 5 篮球  0.300 1 铁人三项   0.153 6
           测性。
                                                               摔跤    0.668 4 水球  0.632 5 跆拳道  0.392 1 射击    0.189 2
               主要通过样本外预测表现评估不同项目的可预测                           帆船    0.652 8 帆船  0.625 3 射击  0.496 7 手球    0.230 1
           性。样本外预测是在训练数据集之外的测试数据集上
                                                                   项目的可预测性强主要是因为有一个或少数几个
           评估模型表现的一种方法,能直接反映模型在新数据
                                                               代表队在该项目中具有超强实力。例如:中国在乒乓
           上的表现, 但往往需要足量且能分出独立测试集的场
                                                               球项目上强大的综合实力导致奖牌的可预测性较强;
           景。笔者主要关注对          2020 年东京奥运会的预测,并对
                                                               而在花样游泳项目上,俄罗斯队在双人赛和团体赛上
           样本进行了固定的分割:1992—2016 年数据作为训练
           样本,2020 年东京奥运会数据作为测试样本。因此,                          连续  6 届蝉联冠军,花样游泳项目金牌的可预测性最
           该结构适合进行样本外预测评估。另外,未采用机器                             强。项目的可预测性弱主要是因为参与该项目的代表
           学习中最常用的交叉验证来评估模型,原因在于该方                             队众多,同时实力较为接近,导致竞争激烈。例如,在
           法适用于数据量较少或需更细致评估模型稳定性的场                             足球项目上有       19 个代表队都曾获得金牌或奖牌。同
                                                               时,奖牌的可预测性和金牌的可预测性也存在差异。
           景,同时交叉验证对样本的随机分割并不适用本文的
                                                               例如,在金牌的可预测性上篮球位居第八,在奖牌的可
                                                        R 2
           数据。因此,主要采用固定样本分割的样本外预测
           (可决系数)作为预测得分评估不同项目的可预测性,                            预测性上则位于倒数第八,这主要是因为历史上曾经
           分数越高,代表可预测性越强,项目的不确定性越低。                            有  16 个代表队获得奖牌,但只有           4 个代表队(美国、独
           当然,也可采取其他评估标准,如预测的均方误差等。                            联体、阿根廷和拉脱维亚)夺得金牌。同时,在篮球项

                                       R  的一个优点是该测             目产生的     18 枚金牌中,独联体、阿根廷、拉脱维亚各
                                         2
           但与其他标准相比,样本外预测
           度不受测量单位的影响,易在不同项目之间进行可预                             自只获得     1 枚金牌,其余     15 枚金牌都为美国队所得。
           测性比较。                                               此外,一些项目(如射击)在比赛时运动员发挥的或然
                                                               性较高,其金牌和奖牌的可预测性都位居后十。
               表  2 为  2020 年东京奥运会奖/金牌数样本外预测
           R  排在前十和倒数前十的项目以及得分。从表                    2 的左       3.2 各变量对不同项目预测结果的贡献程度
            2
           半部分可以看到,奖牌可预测性强(排前十)的项目分                                以奥运会足球、篮球、排球三大球项目为例,展示

           30
   29   30   31   32   33   34   35   36   37   38   39