Page 40 - 《上海体育大学学报》2024年第4期
P. 40

石慧敏, 章东迎, 章永辉. 奥运奖牌可以被预测吗?——基于可解释机器学习视角


           Can Olympic Medals Be Predicted?:
           Based on the Interpretable Machine Learning Perspective


           SHI Huimin,ZHANG Dongying,ZHANG Yonghui

           Abstract:Random forest models are constructed to predict the teams' medal numbers in different Olympic events
           based on a large data set of 1992-2021 Summer Olympic Games. It is found that apparent differences exist in the
           predictability of Olympic events. For the forecast of medals, the top three most predictable events are table tennis,
           badminton  and  swimming,  while  the  bottom  three  are  water  polo,  modern  pentathlon  and  volleyball.  With
           interpretable machine learning methods, the social-economic features are further investigated which have important
           effects  on  the  performance  of  Olympic  Games.  The  results  show  that:  (1)  For  the  same  event,  the  prediction
           accuracy of women's events is usually higher than that of men's; (2) Factors like population, GDP per capita, and
           the game hosting have some influences on the medal numbers; (3) For specific Olympic events, some traditionally
           advantageous events like table tennis in China and athletics of the USA have a large impact on the medal forecast.
           Keywords:Olympic medal; machine learning; feature importance; SHAP method; Shapley value
           Authors' address: School of Economics, Renmin University of China, Beijing 100872, China


          ·新视点·

                           SHAP     算法:一种分析篮球比赛制胜因素的新方法


               随着人工智能技术在体育领域的逐步应用,利用机器学习技术对篮球比赛进行分析预测,能显著提高比
           赛胜负分析的准确性和效率。以往研究大多对篮球比赛胜负结果进行简单的预测和分析,缺乏对预测模型的
           可解释性分析以及针对比赛不同时段影响比赛结果重要因素的差异化分析等相关工作。因此,分析机器学习
           算法模型如何做出决策并揭示影响篮球比赛胜负的关键制胜因素是亟待解决的重要问题。美国华盛顿大学学
           者  Lundberg  和  Lee 在第  31  届  NIPS(Conference and Workshop on Neural Information Processing Systems)发表
           的  A Unified Approach to Interpreting Model Predictions 一文中提出了用于解释复杂机器学习模型的                SHAP  算
           法,并通过对比发现          SHAP  算法较其他解释算法有更好的计算表现与模型解释性。SHAP                             算法通过计算每一
           个特征变量的       Shapley  值来反映不同特征变量对于机器学习算法模型的贡献程度,进而从局部和全局                                      2  个角
           度解释复杂的机器学习算法模型的预测机制,通过应用                           SHAP  算法能有效提高篮球比赛预测模型的解释性程
           度,深度挖掘不同时段的篮球比赛关键性影响因素。
               研究以    2021—2023   赛季   NBA  比赛技术统计数据为样本,采用融合机器学习算法与                               SHAP  算法对
           NBA  比赛不同时段的胜负进行预测以及制胜因素分析。将                          XGBoost 算法与     LightGBM、K   近邻、随机森林、
           决策树、支持向量机、逻辑回归等主流机器学习算法进行十折交叉验证对比实验,XGBoost 算法在对比实验
           中  5  项评价指标(AUC       值、F  分数、准确率、精确率和召回率)综合表现最佳,证明了机器学习                                    XGBoost
                                      1
           算法在   NBA  比赛胜负预测的优越性。研究发现,XGBoost 算法可以较好地反映                             NBA  比赛技术统计指标与比
           赛胜负情况之间的复杂非线性关系。在比赛所有时段,投篮命中率、防守篮板和失误是影响比赛胜负的关键
           指标。此外,在比赛上半场,助攻是影响比赛胜负的关键指标;在比赛下半场,进攻篮板和三分球命中率是

           影响比赛胜负的关键指标。综上,SHAP                   算法的应用为未来篮球赛事的制胜因素研究提供了新的方法和视
           角,可充分利用该方法探索竞技体育项目的胜负影响因素,根据不同竞技项目的特点,如技战术数据、球员
           状态、伤病情况等,构建全面、科学的比赛胜负预测模型。
                                                       (武汉体育学院 欧阳彦,洪伟,黎雪微,郑伟涛,彭李明)
                                                           基金项目:湖北省教育厅科学研究计划项目(B2021189)




           36
   35   36   37   38   39   40   41   42   43   44   45