Page 447 - 《软件学报》2024年第4期

P. 447

仝青山等: 面向指-笔混合输入的交互原语和交互模型研究 2025

置信息, 结合指-笔混合交互的双设备融合特征以及时序特征, 我们将指-笔交互信息 (pen-touch information, PTI)
定义为 PTI = <Position, Time, Device>, 表示某时间、某种指点设备在触摸屏上的位置. 其中, Position 为平面坐标
系中的 X、Y 坐标, Device 是指 Pen 或 Touch 两种指点设备. 指点设备在持续交互过程中的轨迹信息可以表示为
交互信息的集合 (pen-touch information set, PTIS), 即 PTIS=<PTI 1 , PTI 2 ,…, PTI n >, 可以描述某时间段内所有指点设
备的状态变化.

交互信息原语生成器
时间序列意图提取器
t 11 时刻处理器
指笔信息输入任务生成器

基于 POMDP 的
笔式识别器意图识别器
t 12 时刻交互原语交互意图
指笔信息输入

… 指式识别器上下文

t 1m 时刻决策器
指笔信息输入

… … … … …
交互信息原语生成器

t n1 时刻处理器
指笔信息输入任务生成器
基于 POMDP 的
笔式识别器意图识别器
t n2 时刻交互原语交互意图
指笔信息输入

… 指式识别器上下文

t nm 时刻
指笔信息输入决策器

图 1 指-笔混合输入交互模型

● 交互原语: 交互原语是用户施加到计算机上的独立的、不可分割的最小操作 [2] , 反映了人的交互动作的运
动状态和方式. 根据指点设备在触摸屏上的运动轨迹信息, 利用二维空间上的时间、空间约束, 可将其划分为多种
交互原语, 以完成更多的交互任务, 如单击、长击、平移、绘制等交互原语. 本文中的交互原语不仅包括归一化的
独立或串行的指、笔交互原语, 还包括并行的混合交互原语, 如表征“笔长击同时双指旋转”的原语.
● 原语生成器: 原语生成器由处理器、笔式原语识别器、指式原语识别器和决策器构成, 它们一起协作对接
收到的交互信息进行预处理和标准化、轨迹识别、混合原语决策等操作, 最终得到当前输入的交互原语.
● 意图: 在人机交互领域, 用户意图主要是指计算机对用户交互动作的理解和处理, 主要表现为从多种可能性
中识别出用户的真实意图. 不同上下文中的同一交互动作可能有多种交互意图, 最终目标是借助计算机来完成用
户期望的交互任务. 本文中交互意图主要指用户期待的计算机操作, 尤其指需要结合上下文才能确定的复杂交互

442 443 444 445 446 447 448 449 450 451 452