Page 83 - 《软件学报》2021年第11期
P. 83
袁敏 等:面向数据特征的人机物融合服务分派方法 3409
Table 1 List of notations
表 1 注释表
V 业务员集合
v ij 待分配给用户 U[i]的业务员集合 v i 中第 j 个业务员
d 某分支部门代码
业务员 V[j]的所属部门代码
branch j
profile j 业务员 V[j]的概要描述文件
业务员 V[j]所在的机构等级
institution j
si j 业务员 V[j]所在的机构等级得分
业务员 V[j]自身的等级
level j
sl j 业务员 V[j]的自身的等级得分
其他用户对业务员 V[j]的历史评价
assess j
sa j 对业务员 V[j]评价的情感得分
其他用户对业务员 V[j]评级
r i
sr j 其他用户对业务员 V[j]评级得分
其他用户对业务员 V[j]的综合满意度得分
su j
U 用户集合 U,U[i]是第 i 个用户
用户 U[i]提交的任务描述
depict i
s ij depict i 和 profile j 的相似度
L[i][j] 业务员 j 对于用户 i 的最终得分
在服务分派的过程中,为了提高用户的体验,一方面希望执行任务的业务员的综合评分越高越好;另一方
面,对于任务描述而言,要求由最擅长该类任务的业务员来完成,即业务员的专长与任务特征相似度越大越好.
3 面向数据特征的跨域融合服务分派
3.1 认知空间的服务用户满意度
本节从人类社会角度出发,关注认知空间的属性特征,着重分析用户对于业务员服务的满意度.常规评分中
的分数是用户给出的评级,为了更全面地表达用户对此次服务的满意度,文中通过挖掘用户评价信息,对服务评
价进行情感倾向性分析,并与评级分数结合,实现用户情感倾向预测.因此采用情感分析方法计算评价得分,其
中,词典规则的方法是当前情感倾向性分析中较常用的方法.Cheng 等人提出了一种基于规则的中文微博文本
的情感分类方法,进行分析微博的情感倾向性 [26] .Gao 等人在研究中文微博文本中,根据其具有的特点,提出在语
义规则下分析微博热点 [27] .Park 等人基于种子词辞典和 3 个在线词典,选出所有的同义词存储进同义词词典,以
此来提高同义词词典的可靠性;同时,递归地收集同义词和反义词来扩展同义词辞典.在不使用人力资源的情况
下,有效地扩展了词典,增强了词典的可用性,提高了情感分类的准确性 [28] .Rao 等人使用三剪枝策略建立了对于
社会情绪检测的准确的情感词典,该方法生成的词典是与语言无关的、细粒度的 [29] .从技术角度上来看,情感词
典的构建还可以分为以下 4 种方法:基于语义和规则的方法 [30,31] 、基于图传播的方法、基于词对齐模型的方法
以及基于表示学习的方法 [32,33] .目前的语音情感分析和图形符号的情感分析也取得了较好的成果,以目前比较
成熟的文本情感倾向分析为例,分为以下几个关键步骤.
(1) 分词:对文本评价进行分词处理.分词就是将连续的字序列按照一定的规范重新组合成词序列的过
程.因为循环神经网络训练无法直接处理整段的文字,所以需要进行分词的处理.在分词之后,去掉一
些停用词,防止停用词影响情感倾向分类的准确度.对于 assess={assess 1 ,assess 2 ,…,assess n }这样的句
子数组,以其中的一个句子分词为例,得到表达式(3).
assess i =w i ={w i1 ,w i2 ,…,w ij } (3)
其中,w i 表示对每个句子的分词后的词数组,w ij 表示其中的一个分词.
(2) 词向量化.经过文本分词后,文本评论数据已经变成切分好的词片段,这些词片段需要经过向量化后,
才能放入神经网络中训练.词向量化提供了一种数学化的方法,把自然语言这种符号信息转化为向量
形式的数字信息.这样,就把自然语言理解的问题转化为机器学习的问题.本文通过 word2vec 方法进