Page 59 - 《软件学报》2020年第11期
P. 59

陆璇  等:数据驱动的移动应用用户接受度建模与预测                                                       3375


                 使用 Android 原生 API 并开发面向较新 SDK 版本的应用.
                    当然,通过上述方法挖掘出的是特征与用户接受度指标之间的相关性,而非因果性.要得到因果性结论依然
                 需要进行严谨的实验分析.然而,考虑到可能影响用户接受度的因素规模,通过构建预测模型发现潜在因素的方
                 法,已经为开发者大幅缩小了考虑范围,提供了较为具体的分析方向.
                 3.3   更新效果预测

                 3.3.1    问题描述
                    在应用市场生态下,移动应用常常需要快速迭代,以满足用户的需求,提升应用的竞争力.通过应用市场进
                 行应用更新时,开发者在市场中发布新版本的安装包,并更新应用名称、描述等信息.然而,应用的更新策略,包括
                 应用发布时间、更新描述等,都有可能影响用户对新版本的接受度.特别地,当需要更新的内容已确定时,如何选
                 择最优的发布时间以达到相对最优的更新效果,是应用开发者关心的问题.
                 3.3.2    指标选择
                    当应用发生版本更新后,不同维度的用户接受度都有可能发生变化.本节从评分的角度刻画用户对不同版
                 本的接受度.考虑到评分本身存在不稳定性               [35] ,为减少不稳定性带来的影响,选取应用在一段时间内的评分趋势
                 作为用户接受度指标,并只考虑评分趋势发生显著变化时的情况.即进行一次更新后,只有在一定时间范围内出
                 现了评分趋势的显著变化,才认为此次更新行为对用户接受度产生了影响.以根据这一规则选取的更新作为研
                 究对象,预测更新行为可能带来的评分趋势的变化.
                    具体而言,将同一应用每一天的评分连接得到的评分曲线拟合为首尾连接的若干条线段,每条线段的斜率
                 表示相应时间内的评分趋势,连接点则表示评分趋势发生了转折.将此类连接点称为显著转折点(turning
                 points).为检测出显著转折点,可以构造出一个分割问题,即通过用若干个片段最优地表示向量 T                           [46,47] ,并使用自
                 顶向下在线算法为 T 训练模型         [48] 并给出最优的分割方案.图 3 即展示了一个应用的评分趋势转折点检测结果.











                                        Fig.3    An example of turning points in rating trends
                                             图 3   评分趋势中的显著转折点(示例)

                    当应用发布新版本后,用户需要时间在自己的设备上进行更新,并熟悉新的特性,因此对新版本的接受度需
                 要一定时间才能够通过评分等方式体现出来.所以,应用的评分曲线与更新曲线之间存在时滞效应.换言之,当
                 显著转折点已知时,需要找到转折点之前的一段时间区间,在该区间内发生的应用版本的更新可能与评分的转
                 折有关.这段区间称为时滞区间(time-lag slot),而区间内的更新称为显著更新.对于显著更新,计算对应转折点前
                 后的评分拟合曲线斜率之差以度量评分趋势的变化.
                    为了识别时滞效应,首先将更新点和评分抽象为不同的序列向量,并进行平滑处理以去除噪音;其次,使用
                 皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,简称 PPCC) [49] 计算在不同时滞区间下版本
                 更新与评分之间的相关程度.对每个应用进行时滞区间检测                     [50] ,并计算每一对向量之间的 PPCC 值.当 p≤0.01
                 时,认为更新向量与评分向量之间存在显著相关.通过计算每个应用在不同时滞区间下显著相关向量的百分比,
                 发现在区间长度为 4 天时这一比值最高,达到 48%.这验证了更新行为与评分的反应之间存在时滞效应,同时也
                 表明,应用评分的变化有可能与变化发生之前,时滞区间内的更新行为相关.
   54   55   56   57   58   59   60   61   62   63   64