Page 126 - 《软件学报》2021年第8期
P. 126

软件学报 ISSN 1000-9825, CODEN RUXUEW                                       E-mail: jos@iscas.ac.cn
                 Journal of Software,2021,32(8):2408−2424 [doi: 10.13328/j.cnki.jos.006190]   http://www.jos.org.cn
                 ©中国科学院软件研究所版权所有.                                                         Tel: +86-10-62562563


                                                                 ∗
                 基于强化学习的温度感知多核任务调度

                                        3
                      1
                                                        1
                                                4
                                                                       1
                                                               1
                 杨世贵 ,   王媛媛  1,2,5 ,   刘韦辰 ,   姜   徐 ,   赵明雄 ,   方   卉 ,   杨   宇 ,   刘   迪  1,3
                 1
                 (云南大学  软件学院,云南  昆明   650504)
                 2
                 (中国科学院  信息工程研究所,北京  100093)
                 3 (School of Computer Science and Engineering, Nanyang Technological University, Singapore)
                 4 (东北大学  计算机科学与工程学院,辽宁  沈阳  110169)
                 5
                 (中国科学院大学  网络空间安全学院,北京  100049)
                 通讯作者:  刘迪, E-mail: dliu@ynu.edu.cn

                 摘   要:  随着计算机中内核数量的增多,温度感知的多核任务调度算法成为计算机系统中的一个研究热点.近年
                 来,机器学习在各个领域展现出巨大的潜力,很多基于机器学习的系统温度管理研究工作应运而生.其中,强化学习
                 因其较强的自适应性,被广泛地运用于温度感知的任务调度算法中.然而,目前基于强化学习的温度感知任务调度算
                 法系统建模不够准确,很难做到温度、性能和复杂度的较好权衡.因此,提出一种基于强化学习的多核温度感知调度
                 算法——ReLeTA.在该算法中提出了更全面的状态建模方式和更加有效的奖励函数,从而帮助系统进一步降低温
                 度.实验部分通过 3 个不同的真实计算机平台验证该方法,实验结果表明了该方法的有效性以及可扩展性,与现有方
                 法相比,ReLeTA 可以更好地控制系统温度.
                 关键词:  温度感知;多核系统;强化学习;Q-Learning
                 中图法分类号: TP316

                 中文引用格式:  杨世贵,王媛媛,刘韦辰,姜徐,赵明雄,方卉,杨宇,刘迪.基于强化学习的温度感知多核任务调度.软件学报,2021,
                 32(8):2408−2424. http://www.jos.org.cn/1000-9825/6190.htm
                 英文引用格式: Yang SG, Wang YY, Liu WC, Jiang X, Zhao MX, Fang H, Yang Y, Liu D. Temperature-aware task scheduling
                 on  multicores based on  reinforcement  learning. Ruan  Jian Xue Bao/Journal of Software,  2021,32(8):2408−2424 (in  Chinese).
                 http://www.jos.org.cn/1000-9825/6190.htm
                 Temperature-aware Task Scheduling on Multicores Based on Reinforcement Learning

                            1
                                                                                          1
                                                                        4
                                                             3
                                                                                                     1
                 YANG Shi-Gui ,   WANG Yuan-Yuan 1,2,5 ,  LIU Wei-Chen ,   JIANG Xu ,   ZHAO Ming-Xiong ,   FANG Hui ,
                        1
                 YANG Yu ,  LIU Di 1,3
                 1
                 (School of Software, Yunnan University, Kunming 650504, China)
                 2
                 (Institute of Information Engineering, Chinese Academy of Sciences, Beijing 100093, China)
                 3
                 (School of Computer Science and Engineering, Nanyang Technological University, Singapore)
                 4
                 (School of Computer Science and Engineering, Northeastern University, Shenyang 110169, China)
                 5
                 (School of Cyber Security, University of Chinese Academy of Sciences, Beijing 100049, China)
                 Abstract:    With the increase of the number of cores in computers, temperature-aware multi-core task scheduling algorithms have become
                 a research hotspot in computer systems. In recent years, machine learning has shown great potential in various fields, and thus many work
                 using machine learning techniques to manage system temperature have emerged. Among them, reinforcement learning is widely used for
                 temperature-aware task scheduling  algorithms due to its  strong  adaptability.  However, the  state-of-the-art temperature-aware  task

                   ∗  基金项目:  国家自然科学基金(61902341)
                      Foundation item: National Natural Science Foundation of China (61902341)
                      本文由“泛在嵌入式智能系统”专题特约编辑郭兵教授、王泉教授、邓庆绪教授、陈铭松教授、张凯龙副教授推荐.
                      收稿时间: 2020-07-24;  修改时间: 2020-09-07;  采用时间: 2020-11-02; jos 在线出版时间: 2021-02-07
   121   122   123   124   125   126   127   128   129   130   131