Page 40 - 《上海体育大学学报》2024年第4期
P. 40
石慧敏, 章东迎, 章永辉. 奥运奖牌可以被预测吗?——基于可解释机器学习视角
Can Olympic Medals Be Predicted?:
Based on the Interpretable Machine Learning Perspective
SHI Huimin,ZHANG Dongying,ZHANG Yonghui
Abstract:Random forest models are constructed to predict the teams' medal numbers in different Olympic events
based on a large data set of 1992-2021 Summer Olympic Games. It is found that apparent differences exist in the
predictability of Olympic events. For the forecast of medals, the top three most predictable events are table tennis,
badminton and swimming, while the bottom three are water polo, modern pentathlon and volleyball. With
interpretable machine learning methods, the social-economic features are further investigated which have important
effects on the performance of Olympic Games. The results show that: (1) For the same event, the prediction
accuracy of women's events is usually higher than that of men's; (2) Factors like population, GDP per capita, and
the game hosting have some influences on the medal numbers; (3) For specific Olympic events, some traditionally
advantageous events like table tennis in China and athletics of the USA have a large impact on the medal forecast.
Keywords:Olympic medal; machine learning; feature importance; SHAP method; Shapley value
Authors' address: School of Economics, Renmin University of China, Beijing 100872, China
·新视点·
SHAP 算法:一种分析篮球比赛制胜因素的新方法
随着人工智能技术在体育领域的逐步应用,利用机器学习技术对篮球比赛进行分析预测,能显著提高比
赛胜负分析的准确性和效率。以往研究大多对篮球比赛胜负结果进行简单的预测和分析,缺乏对预测模型的
可解释性分析以及针对比赛不同时段影响比赛结果重要因素的差异化分析等相关工作。因此,分析机器学习
算法模型如何做出决策并揭示影响篮球比赛胜负的关键制胜因素是亟待解决的重要问题。美国华盛顿大学学
者 Lundberg 和 Lee 在第 31 届 NIPS(Conference and Workshop on Neural Information Processing Systems)发表
的 A Unified Approach to Interpreting Model Predictions 一文中提出了用于解释复杂机器学习模型的 SHAP 算
法,并通过对比发现 SHAP 算法较其他解释算法有更好的计算表现与模型解释性。SHAP 算法通过计算每一
个特征变量的 Shapley 值来反映不同特征变量对于机器学习算法模型的贡献程度,进而从局部和全局 2 个角
度解释复杂的机器学习算法模型的预测机制,通过应用 SHAP 算法能有效提高篮球比赛预测模型的解释性程
度,深度挖掘不同时段的篮球比赛关键性影响因素。
研究以 2021—2023 赛季 NBA 比赛技术统计数据为样本,采用融合机器学习算法与 SHAP 算法对
NBA 比赛不同时段的胜负进行预测以及制胜因素分析。将 XGBoost 算法与 LightGBM、K 近邻、随机森林、
决策树、支持向量机、逻辑回归等主流机器学习算法进行十折交叉验证对比实验,XGBoost 算法在对比实验
中 5 项评价指标(AUC 值、F 分数、准确率、精确率和召回率)综合表现最佳,证明了机器学习 XGBoost
1
算法在 NBA 比赛胜负预测的优越性。研究发现,XGBoost 算法可以较好地反映 NBA 比赛技术统计指标与比
赛胜负情况之间的复杂非线性关系。在比赛所有时段,投篮命中率、防守篮板和失误是影响比赛胜负的关键
指标。此外,在比赛上半场,助攻是影响比赛胜负的关键指标;在比赛下半场,进攻篮板和三分球命中率是
影响比赛胜负的关键指标。综上,SHAP 算法的应用为未来篮球赛事的制胜因素研究提供了新的方法和视
角,可充分利用该方法探索竞技体育项目的胜负影响因素,根据不同竞技项目的特点,如技战术数据、球员
状态、伤病情况等,构建全面、科学的比赛胜负预测模型。
(武汉体育学院 欧阳彦,洪伟,黎雪微,郑伟涛,彭李明)
基金项目:湖北省教育厅科学研究计划项目(B2021189)
36