Page 52 - 《软件学报》2020年第11期
P. 52

3368                                Journal of Software  软件学报 Vol.31, No.11, November 2020

                 反馈渠道、向部分用户进行访谈或发放调查问卷等方法,应用市场为移动应用开发者提供了大规模获取用户评
                 分与评论的渠道.因此,用户评价数据是一种获取用户接受度的重要来源.
                 2.1.1    评分指标
                    在不同的应用市场中,用户评分通常以两种模式实现.
                    •   一种是以 Google Play 为代表的 5 分模型,即用户选择一星~五星作为评分;在这种评分模式下,通常将
                        所有用户评分的平均值作为应用的整体评分.
                    •   另一种是二元模型,用户可以为应用标记“喜欢(like)”或“不喜欢(dislike)”.由于二元模型无法直接体
                        现喜欢程度或不喜欢程度的差异,可以定义好评率(like ratio)这一指标,表示所有标记用户中标记“喜
                        欢”的用户的比例.好评率计算公式为
                                                           number of likes
                                         Like  Ratio =                         .
                                                   number of likes number of dislikes+
                    通常情况下,应用市场展示的评分是应用发布以来的历史整体评分.当研究移动应用版本变化相关问题时,
                 使用整体评分作为用户接受度指标存在局限性:一方面,用户给出的往往是对当前使用版本的评分,历史整体评
                                           [1]
                 分不能反映对当前版本的接受度 ;另一方面,即便对于稳定的、成熟的、未发生版本更新的应用,其评分也不
                 稳定 [35] ,因而评分的变化无法直接体现用户对不同版本应用接受度的变化.此外,由于用户对应用的更新偏好不
                 同,加之应用市场支持开发者进行灰度更新,不同用户可能同时使用不同版本的应用,因此,简单以版本更新时
                 间作为评分与版本对应的依据亦不准确.为此,本文提出评分趋势作为一种新的用户接受度指标.评分趋势表示
                 应用评分在一段时间内的趋势.若将每天同一时间的评分为点连接为曲线,评分趋势可以通过曲线的斜率表示.
                 根据不同的拟合方法,可以计算出评分趋势的具体数值.当评分趋势发生变化时,可以认为该变化可能与一定时
                 间范围内的版本更新行为有关.对评分趋势的计算涉及到对拟合曲线的转折点检测问题,因而取决于选用的具
                 体算法.本文在第 3.3.2 节中给出一种具体的计算方法.
                 2.1.2    评论指标
                    基于现有研究,可以从情感、信息量、群体代表性等维度从评论数据中提取用户接受度指标.
                    1.   情感维度.研究发现,应用评论通常体现出明显的情感倾向,而短评论几乎都是由情感相关单词组成.
                        因此,对评论文本进行情感分析能帮助理解用户对应用的接受度.根据文本,可以定性地将用户态度
                        分为正面、负面、中性等类别.一种常见的做法是从评论中提取关键词,例如,“good”“great”“love”能够
                        代表积极的态度,而“bad”“hate”“terrible”则可以表示消极的态度.同时,也可以结合评分数据,以评分
                        的高低辅助对情感极性的判断.
                    2.   信息量维度.应用评论中存在一定比例的垃圾评论,因此,过滤常常是进一步分析之前的必经步骤.与
                        此同时,应用市场中的评论所包含的信息量整体较低                    [15] .为减轻这一现状对用户的影响,应用市场也
                        采取了一定的应对措施.例如,Google Play 根据用户对评论的评价对应用评论进行排序.对研究者来
                        说,一方面可以借助应用市场中用户辅助提供的排序结果;另一方面,也可以通过调研归纳                                [15] 等方式
                        找到对开发者有效的信息,进而计算每条评论的信息含量.当然,也可以通过主题模型等方法分析评
                        论中的具体信息.进一步地,通过对不同信息的权重分析,可以获得更为具体的发现.例如,基于对不同
                        功能提及概率的分布,可以得知用户更关心哪些功能.
                    3.   群体代表性维度.除了文本内容之外,用户信息可以体现评论者的分布情况,从而体现不同群体对应
                        用的接受度情况.例如,通过分析评论用户的设备机型,可以获取不同机型用户的接受度情况,从而为
                        选择测试机型提供参考         [36] .当此类数据可获得时,还可以从不同用户群体入手,细化对情感和信息量
                        的分析.
                    实际上,现有的基于评论的研究通常并不以抽取定量指标为目的,即便在分析过程中采取一些定量的方法,
                 其目标往往是为开发者提供更为直接的洞察或建议,例如哪些 Bug 出现频率较高,哪些功能需要尽快完善.当然,
                 在研究中如有实际需要,可以结合问题目标和数据质量,通过不同的算法实现对以上维度指标的度量.
   47   48   49   50   51   52   53   54   55   56   57