Page 36 - 《上海体育大学学报》2024年第4期
P. 36

石慧敏, 章东迎, 章永辉. 奥运奖牌可以被预测吗?——基于可解释机器学习视角

              表 5    代表队固定效应对全样本金牌预测值影响超过                          根据表    6 的右半部分可知,虽然在之前男女项目
                           0.3 的代表队和项目                         奖牌的预测得分因为数据量的减半导致模型拟合能力
            Table 5    Teams and events with Shapley value greater than
                                                               下降,但在金牌的预测上有几个项目的样本外预测得
            0.3 for team fixed effect (full sample gold medal prediction)
                                                               分较高。原因在于:①这些项目都各自存在传统的“超
             项目    代表队    Shapley值   项目     代表队    Shapley值
                                                               级强国”,在这些项目的表现上有着绝对实力。②一个
            田径     俄罗斯     0.345 4  花样游泳    俄罗斯     0.382 0
            击剑     俄罗斯     0.443 0  游泳      俄罗斯     0.366 3    代表队的某种性别在一个项目上的强势并不意味着另
            摔跤     俄罗斯     0.599 7          美国      0.348 4    一个性别擅长此项目。将男女项目分开训练后,反而
            跳水     中国      0.519 2  举重      中国      0.418 8
                                                               排除了另一种性别对模型预测能力的干扰。例如,韩
            帆船     巴西      0.314 4          伊朗      0.403 1
                                                               国女子射箭队实力突出,排除了男子项目数据后,更容
            网球     美国      0.369 8  体操      俄罗斯     0.382 6
            跆拳道    韩国      0.604 2          乌克兰     0.342 4    易预测女子射箭的金牌数。③不同于奖牌数,金牌需
                                                               要预测的结果少,较少的预测数更容易让结果收敛,能

            3.4 不同性别项目预测结果分析
                                                               够体现出该项目传统优势强国的作用,排除了银牌、铜
               在  2020 年东京奥运会上,有           146 个男子项目、          牌数对结果的干扰。
           137 个女子项目和       15 个男女混合项目。从奥运项目                       在总的得分前十的项目中,从预测结果看,女子项
           表现看,我国女运动员取得的成绩好于男运动员。在                             目的模型预测质量远高于男子项目,在女子入围的
           2020 年东京奥运会中国代表团所获的                 38 枚金牌中,        6 个项目中,有     5 个得分超过了       90%,其中有     3 个超过
           女子项目     22 枚金牌,男子项目        13 枚金牌,混合项目             了  95%。这也从侧面印证了男子项目的竞争性要强于
           3 枚金牌。                                              女子项目,其结果的不可预测性更强。由于男子项目
               利用分性别的项目比赛数据对男女项目分别进行                           的高水平运动员更多、更分散,对男子项目的金牌预测
           了预测,识别在不同性别领域中男女项目各自的强项                             更加困难。这可能源于男女在竞技体育参与意愿、比
           和代表队固定效应。区分了男女项目后,将数据分为                             赛激烈程度、赞助商数量、大赛奖金数量和受欢迎程
           2 类重新训练了模型。从表            6 的左半部分可知,因为               度等多方面的差异。
           可供训练的数据集减少了一半,各项目在得分情况上                                 表  7 展示了代表队固定效应对男子、女子奖牌预

           相较于全样本模型来说都有较大程度的下降,但在男                             测值的影响超过        0.3 的项目—代表队组合。对比之前
           子乒乓球、男子跳水、女子田径等项目上,模型还是维                            全样本的预测结果,在对性别分组后,代表队固定效应
           持了相对较高的得分。此外,男子项目与女子项目的                             对各项目预测值的影响大多显著增加。同时,女子项
           差异也说明一个代表队在一个项目上的实力是性别非                             目中发达经济体代表队的比重较高。平均而言,在发
           对称的。                                                达经济体中女性地位较高,女性在这些代表队中可以

               表 6    分性别奖牌数和金牌数预测得分前十的项目                      获得更多的资源和受到较少的职业发展歧视,更有可
               Table 6    Top 10 predictable events for medals and  能成为奥运会运动员。
                         gold medals (by gender)                   表  8 呈现了在金牌数预测中,男女项目代表队固
                   奖牌项目                     金牌项目               定效应对预测值的影响超过               0.3 的项目—代表队组
           男子项目 得分 女子项目 得分         男子项目 得分 女子项目 得分
                                                               合。男子项目代表队固定效应依旧分散,在有些项目
           乒乓球    0.860 1 曲棍球  0.736 3 跳水  0.892 6 跳水  0.997 3
                                                               上有  2 个代表队入围,而女子项目中单个代表队居多,
           跳水     0.791 4 跳水  0.686 9 乒乓球  0.890 9 花样游泳 0.970 7
           柔道     0.701 1 田径  0.672 9 帆船  0.770 5 射箭  0.969 3  这是男子项目的竞争更激烈所致。
           摔跤     0.695 7 足球  0.666 4 水球  0.605 4 水球  0.933 9   3.5 经济发展水平与奥运项目表现
           赛艇     0.585 4 游泳  0.651 6 拳击  0.559 8 乒乓球  0.908 7
                                                                   Bernard 等 [1]  指出,一个国家人口数量越多,人均
           游泳     0.574 8 体操  0.643 9 摔跤  0.549 4 篮球  0.846 6
           自行车    0.573 9 花样游泳 0.608 5 游泳  0.519 6 自行车  0.559 9  GDP  越高,该国获得的奥运奖牌越多。培养高水平运
           击剑     0.535 0 手球  0.606 2 柔道  0.473 3 摔跤  0.554 0  动员既需要有运动员的才华作为“种子”,也需要一国
           拳击     0.527 3 乒乓球  0.595 2 篮球  0.429 8 柔道  0.521 2  人均经济收入达到一定程度作为培养的“土壤”。不
           帆船     0.488 5 皮划艇  0.570 4 射箭  0.371 5 游泳  0.410 6              [1]
                                                               同于  Bernard 等 基于奥运总体奖牌的发现,根据分项
           32
   31   32   33   34   35   36   37   38   39   40   41