Page 36 - 《上海体育大学学报》2024年第4期
P. 36
石慧敏, 章东迎, 章永辉. 奥运奖牌可以被预测吗?——基于可解释机器学习视角
表 5 代表队固定效应对全样本金牌预测值影响超过 根据表 6 的右半部分可知,虽然在之前男女项目
0.3 的代表队和项目 奖牌的预测得分因为数据量的减半导致模型拟合能力
Table 5 Teams and events with Shapley value greater than
下降,但在金牌的预测上有几个项目的样本外预测得
0.3 for team fixed effect (full sample gold medal prediction)
分较高。原因在于:①这些项目都各自存在传统的“超
项目 代表队 Shapley值 项目 代表队 Shapley值
级强国”,在这些项目的表现上有着绝对实力。②一个
田径 俄罗斯 0.345 4 花样游泳 俄罗斯 0.382 0
击剑 俄罗斯 0.443 0 游泳 俄罗斯 0.366 3 代表队的某种性别在一个项目上的强势并不意味着另
摔跤 俄罗斯 0.599 7 美国 0.348 4 一个性别擅长此项目。将男女项目分开训练后,反而
跳水 中国 0.519 2 举重 中国 0.418 8
排除了另一种性别对模型预测能力的干扰。例如,韩
帆船 巴西 0.314 4 伊朗 0.403 1
国女子射箭队实力突出,排除了男子项目数据后,更容
网球 美国 0.369 8 体操 俄罗斯 0.382 6
跆拳道 韩国 0.604 2 乌克兰 0.342 4 易预测女子射箭的金牌数。③不同于奖牌数,金牌需
要预测的结果少,较少的预测数更容易让结果收敛,能
3.4 不同性别项目预测结果分析
够体现出该项目传统优势强国的作用,排除了银牌、铜
在 2020 年东京奥运会上,有 146 个男子项目、 牌数对结果的干扰。
137 个女子项目和 15 个男女混合项目。从奥运项目 在总的得分前十的项目中,从预测结果看,女子项
表现看,我国女运动员取得的成绩好于男运动员。在 目的模型预测质量远高于男子项目,在女子入围的
2020 年东京奥运会中国代表团所获的 38 枚金牌中, 6 个项目中,有 5 个得分超过了 90%,其中有 3 个超过
女子项目 22 枚金牌,男子项目 13 枚金牌,混合项目 了 95%。这也从侧面印证了男子项目的竞争性要强于
3 枚金牌。 女子项目,其结果的不可预测性更强。由于男子项目
利用分性别的项目比赛数据对男女项目分别进行 的高水平运动员更多、更分散,对男子项目的金牌预测
了预测,识别在不同性别领域中男女项目各自的强项 更加困难。这可能源于男女在竞技体育参与意愿、比
和代表队固定效应。区分了男女项目后,将数据分为 赛激烈程度、赞助商数量、大赛奖金数量和受欢迎程
2 类重新训练了模型。从表 6 的左半部分可知,因为 度等多方面的差异。
可供训练的数据集减少了一半,各项目在得分情况上 表 7 展示了代表队固定效应对男子、女子奖牌预
相较于全样本模型来说都有较大程度的下降,但在男 测值的影响超过 0.3 的项目—代表队组合。对比之前
子乒乓球、男子跳水、女子田径等项目上,模型还是维 全样本的预测结果,在对性别分组后,代表队固定效应
持了相对较高的得分。此外,男子项目与女子项目的 对各项目预测值的影响大多显著增加。同时,女子项
差异也说明一个代表队在一个项目上的实力是性别非 目中发达经济体代表队的比重较高。平均而言,在发
对称的。 达经济体中女性地位较高,女性在这些代表队中可以
表 6 分性别奖牌数和金牌数预测得分前十的项目 获得更多的资源和受到较少的职业发展歧视,更有可
Table 6 Top 10 predictable events for medals and 能成为奥运会运动员。
gold medals (by gender) 表 8 呈现了在金牌数预测中,男女项目代表队固
奖牌项目 金牌项目 定效应对预测值的影响超过 0.3 的项目—代表队组
男子项目 得分 女子项目 得分 男子项目 得分 女子项目 得分
合。男子项目代表队固定效应依旧分散,在有些项目
乒乓球 0.860 1 曲棍球 0.736 3 跳水 0.892 6 跳水 0.997 3
上有 2 个代表队入围,而女子项目中单个代表队居多,
跳水 0.791 4 跳水 0.686 9 乒乓球 0.890 9 花样游泳 0.970 7
柔道 0.701 1 田径 0.672 9 帆船 0.770 5 射箭 0.969 3 这是男子项目的竞争更激烈所致。
摔跤 0.695 7 足球 0.666 4 水球 0.605 4 水球 0.933 9 3.5 经济发展水平与奥运项目表现
赛艇 0.585 4 游泳 0.651 6 拳击 0.559 8 乒乓球 0.908 7
Bernard 等 [1] 指出,一个国家人口数量越多,人均
游泳 0.574 8 体操 0.643 9 摔跤 0.549 4 篮球 0.846 6
自行车 0.573 9 花样游泳 0.608 5 游泳 0.519 6 自行车 0.559 9 GDP 越高,该国获得的奥运奖牌越多。培养高水平运
击剑 0.535 0 手球 0.606 2 柔道 0.473 3 摔跤 0.554 0 动员既需要有运动员的才华作为“种子”,也需要一国
拳击 0.527 3 乒乓球 0.595 2 篮球 0.429 8 柔道 0.521 2 人均经济收入达到一定程度作为培养的“土壤”。不
帆船 0.488 5 皮划艇 0.570 4 射箭 0.371 5 游泳 0.410 6 [1]
同于 Bernard 等 基于奥运总体奖牌的发现,根据分项
32