Page 38 - 《上海体育大学学报》2024年第4期
P. 38

石慧敏, 章东迎, 章永辉. 奥运奖牌可以被预测吗?——基于可解释机器学习视角

           预测作用很小。                                             间存在一定差距,也说明体育赛事存在高度的不确定

               (3)除了上述项目出现了明显的根据人均收入的                          性,而这种不确定性也是竞技体育的魅力之一。
           代表队项目匹配差异之外,还发现对于一些项目(如跳
                                                                4 结论与建议
           水)而言,各种人均收入水平的代表队都有所参与并且
                                                                   本文发现:①虽然都是基于相同时间尺度数据训
           有可能获得奖牌,即         GDP  因素的各阶段在该项目上均
                                                               练的模型,奥运会各项目的可预测性具有显著差异。
           能够有所收益。如图           4 所示,从人均      GDP  与世界人
                                                               对奖牌总数而言,可预测性最高的前十名项目分别是
           均  GDP  的比值小于     1 的代表队到人均       GDP  是世界人
                                                               乒乓球、羽毛球、游泳、跳水、马术、击剑、柔道、自行
           均  GDP  数倍的代表队,在各类样本点上,GDP               因素对
                                                               车、摔跤和帆船。②在总体上,一个代表队所在国家或
           最终预测均有贡献。
                                                               地区的人口越多、人均          GDP  越高、是该届奥运会的主
                  0.012                                                                             [1]
                                                               办国,其获得的奖牌越多。这与              Bernard 等 的发现一
                  0.010                                        致。③在特定项目上,若某国或地区具有潜在传统优
                 shapley 值  0.008                              势,那么该国家或地区的哑变量对该项目奖牌的预测
                  0.006
                  0.004
                  0.002                                        贡献较大。以       Shapley 值为标准,代表队的潜在传统优
                                                               势或特征对预测结果的贡献超过                40%  的项目有射箭、
                     0
                       0   2.0  4.0  6.0  8.0  10.0  12.0      田径、拳击、击剑、体操、射击、游泳、举重和摔跤。
                        代表队人均 GDP 与世界人均 GDP 之比
                                                               ④对项目金牌而言,随机森林模型对女子项目的预测
                  图 4    人均收入对跳水项目奖牌预测
                                                               准确性普遍高于男子项目。⑤经济发展水平不同的代
                         (Shapley 值)的影响
                                                               表队,在奥运项目的选择上也存在差异。例如,自行
              Figure 4    The effect of per capita income on the
               prediction of medals in diving (Shapley value)  车、马术、现代五项的参与代表队基本为发达经济体,

                                                               而举重的参与代表队基本为发展中经济体。
            3.6 预测  2020  年东京奥运会奖牌榜和实际奖牌榜的
                                                                   本文对国家奥运争光战略和全民健身战略实施的
                对比
                                                               政策意义:①作为一个快速发展的国家,我国应根据经
               在预测结果部分,基于分项目拟合模型对                   2020 年
                                                               济发展水平调整竞技体育发展战略。②在重点项目上
           东京奥运会的预测结果进行加总并与实际结果进行对
                                                               加大投入,促进我国竞技体育的可持续发展。不应只
           比。在   Schlembach 等 的研究中,作者展示的预测结
                              [2]
                                                               关注金牌、奖牌的数量,而应对那些全球关注度高、参
           果能够很好地符合现实结果。但本文结果显示,在分
                                                               与度高、商业价值高、竞争激烈的项目加大投入。根
           项目对结果进行预测后,并没有提高对总体奖牌榜与
                                                               据经济发展水平,以前瞻性的眼光加大重点项目的人
           金牌榜的预测能力(表          9)。这主要是因为对数据按项
                                                               才培养。③我国各个地区发展水平存在较大的差异,
           目进行分组后,会显著降低每个项目中可用来训练的
                                                               应制定差异化竞争的体育发展战略。如在东部沿海地
           数据集。同时,模型预测结果和奥运会实际奖牌数之
                                                               区已有部分城市人均          GDP  接近发达经济体的水平,在

                      表 9    预测结果与实际结果对比                       这些区域应优先发展对经济水平依赖度较高的项目。
           Table 9    Comparison of predicted and actual outcomes /枚   ④本文量化了我国各项目代表队的传统优势,该结果
                   奖牌数预测                    金牌数预测              有助于制定竞技体育规划,例如选择垄断程度较低的
                             实际奖                     实际金
            代表队   不分性 分性别     牌数    代表队    不分性 分性别    牌数
                  别预测 预测                   别预测 预测              项目作为我国体育发展的突破口。⑤全民健身是奥运
           美国      102   95   113   美国      36   36    39      争光的基础,我国是人口大国,全民参与为竞技体育的
           中国        65   63    88   中国     22   19    38
           俄罗斯       46   44    70   日本       8     7   27     人才选拔提供了人口基数。我国应加大对重点项目全
           英国        41   39    64   英国     14   14    21      民参与的宣传和投入,如在足球、篮球等项目上加大对
           日本        32   28    57   俄罗斯    16   10    20
           澳大利亚      30   27    46   澳大利亚     7     4   17     青少年的投入。
           意大利       24   20    38   荷兰       4     3   10         最后,本文的研究方法不仅限于分析体育项目,相
           德国        35   31    37   意大利      4     4   10
           荷兰        15   13    36   德国       8     8   10     同的研究方法也可用在其他领域(如科技、数学)的人
           法国        32   30    33   法国       8     7   10     才培养和竞争研究上。

           34
   33   34   35   36   37   38   39   40   41   42   43