Page 57 - 《软件学报》2020年第11期

P. 57

陆璇等:数据驱动的移动应用用户接受度建模与预测 3373

结合 3 种有效性指标可知,算法 3 的预测效果优于算法 2.即使对于机型命中数相同的应用类别,如购物、
通讯、社交,算法 3 的时长覆盖率和平均精准度均明显高于算法 2.这一结果表明,即使命中的机型数相同,算法
3 命中的机型排名更为靠前.这两种算法的主要区别在于统计市场占有率的数据集来源不同,因此预测目标用
户群体时,应考虑数据集来源因素.
将算法 1 和算法 2 的预测效果进行比较可以发现,在所有应用类别上,算法 1 的机型命中数、时长覆盖率、
平均精准度均优于算法 2.与算法 3 比较可知,算法 1 的预测效果依然更优.即使在商务和母婴类别中,算法 1 的
机型命中数(中位数)与算法 3 相同,均为 5 种,但算法 1 的时长覆盖率和平均精准度依然高于算法 3.这表明算法
1 命中的机型更为重要,能够帮助开发者定位出更为重要的目标用户群体.
比较算法 1 在不同应用类型上的表现可知,算法 1 在大部分应用类型中可以取得较好的预测效果.例如在
游戏类应用中,算法 1 能够准确预测前 10 种主要机型中的 8 种,时长覆盖率达到 97.35%,平均精准度为 0.75,均
明显优于两种基准算法.对于 14 种应用类别中的 10 种,算法 1 可以达到的时长覆盖率均超过 90%.从应用接受
度的角度看,覆盖越多使用时长的机型(用户群体)更为重要,因此,算法 1 能够有效帮助这些类别中应用的开发
者预测其主要用户群体.相对而言,算法 1 在效率类应用中的预测效果较差,这表明在该类别内部,不同应用在不
同机型上的在线使用时长分布的相似性较低,不易通过同类应用的数据分布情况进行预测.
在本实例中,以在线使用时长作为用户接受度指标,通过相似应用在不同设备型号上的用户接受度分布情
况,以协同过滤的思想预测新应用的用户群体分布情况,从而有效地识别出应用的目标用户群体.通过这一方
法,可以帮助开发者在给定的资源下更好地选择设备机型进行开发和测试,从而优化资源配置,优先解决覆盖更
多用户的适配性问题,提升用户体验.
3.2 用户规模预测

3.2.1 问题描述
以下载量为主要度量指标的用户规模,常常是体现应用成功度的重要方面.对应用开发者来说,越早了解应
用可能获取的用户规模,在软件开发过程中越能够灵活地进行调整和改进.然而在当前的应用发布模式下,开发
者需要在发布应用之后才能获取用户反馈数据.具体而言,开发者在应用开发过程中常常面临不同的决策问题,
包括是否选用某种设计、是否实现某一功能、以何种方式实现等等.一种常见的做法是以 A/B 测试的方式度量
用户的反馈情况,即同时实现并发布不同版本的应用,通过分析用户接受度指标的数值及其变化来决定采取哪
种方案.这一做法基于应用上线后获取的用户数据进行.然而,即便可以同时上线不同的版本,依然需要开发者
对大量因素进行决策,只保留有限的变量.例如,同时上线的两个版本只在某个特定功能的布局上有所不同,其
他因素完全相同,从而通过用户对不同版本的反馈情况对功能布局方案进行选择.这一过程中,对其他需要确定
的因素的决策依然在很大程度上依赖于开发人员的直觉与经验.同时,每个版本的实现都需要需求分析、设计、
开发、审核等多方面的成本.
因此,若能在应用上线之前对其可能获得的用户规模进行预测,则能够大大降低成本和对开发人员的决策
依赖.通过对可控因素与用户接受度关联性的挖掘,可以在开发阶段即对应用进行有针对性的改进.实际上,用
户规模预测也是研究者关心的问题 [40] .
3.2.2 指标选择
开发者所关心的用户规模通常以下载量作为主要度量指标.由于影响下载量的因素非常复杂,预测其绝对
值具有相当的难度.本例选取下载量的相对值,即在同类应用中的排名情况作为接受度指标之一.与此同时,仅
以下载量作为评价维度也存在局限性:一方面,用户在下载应用后可能卸载,因此引入卸载率,将用户的负面态
度纳入考量;另一方面,基于评价数据的指标依然为大部分开发者和研究者所关心,因此,同时选用好评率作为
指标的补充.
3.2.3 指标预测
在确定目标指标后,需要提取应用上线之前可获得的数据特征来预测应用的用户接受度.这些数据特征来
自应用市场中可获得的安装包和描述信息,属于开发者可控因素.具体而言,从安装包大小、代码复杂度、代码

52 53 54 55 56 57 58 59 60 61 62