Page 445 - 《软件学报》2024年第4期

P. 445

仝青山等: 面向指-笔混合输入的交互原语和交互模型研究 2023

正在从单通道输入向多通道、多设备的混合输入演变 [1−3] , 传统的串行指-笔输入正逐渐向指-笔融合输入过渡 [4] .
近几年, 指-笔混合输入问题已成为学术界关注的热点问题 [5−9] .
目前, 指-笔混合输入的研究工作主要集中于两个方面: 一是探索指-笔交互协作的理论框架, 二是面向具体场
[6]
景的指-笔混合输入方式. Guiard 提出双手动作不对称性的初步理论框架, 该框架描述了人类在各种熟练的体力
活动中两只手的使用偏好, 指出了在活动中两只手扮演角色的差异以及彼此之间的配合; Microsoft Research 的
Hinckley 等人 [7] 基于物理纸笔下用户的输入行为, 提出了 Pen 书写、Touch 操作、Pen + Touch 混合的操作方式;
Pfeuffer 等人 [8] 与 Hinckley 等人 [9] 进一步对平板上的 Thumb + Pen 进行了研究, 提出了惯用手直接操作、握持设
备的非惯用手间接操作等操作方式. 这些指-笔协作方式的研究成果, 为利用指-笔组合操作解决实际问题奠定了
基础. Romat 等人 [10] 将 Pen + Touch 输入应用到文档编辑和审阅中, 实现了特定区域的空间调整; Srinivasan 等人 [11]
利用 Pen + Touch + Speech 解决了不同类型数据在平板上的一致性可视化问题; Pfeuffer 等人 [12] 提出了利用 Pen +
Touch 实现三维操作技术 Bi-3D. 整体来看, 当前的研究工作主要集中于如何利于指-笔解决特定问题, 缺乏一般情
境下的指笔交互问题研究, 如指-笔并行交互机制、指-笔混合交互模型、多义性交互动作意图理解等.
时间连续性、特征多维性和意图不确定性是指-笔交互的显著特征 [1] , 也是构建指-笔混合交互模型的基础. 很
多学者在相关领域进行了研究, 如田丰等人 [13] 提出了 PIBG 笔式交互范式并对笔手势进行了深入探索, Li 等人 [14,15]
提出了混合自动机的概念并对触摸屏上的手势识别进行了深入研究, 刘杰等人 [16] 提出了三维连续交互空间下的
混合手势交互模型. 虽然这些工作的研究重点不是指-笔混合输入, 但对指-笔混合交互原语的定义、指-笔融合方
式和指-笔状态描述都有很好的指导意义.
为此, 针对传统指-笔交互过程中交互空间受限和多语义交互动作意图不确定问题, 本文探索并构建了指-笔
混合输入的总体交互框架, 提出了指-笔混合输入交互模型, 将交互前期的指-笔协作与后期的交互意图理解进行
了融合, 并通过绩效对比实验佐证了该模型的可行性和先进性. 本文的贡献主要包括以下几点: (1) 提出了基于触
屏的指-笔混合输入交互模型, 给出了利用指-笔混合输入在触屏上进行单次交互、持续交互的方式; (2) 定义了指-
笔混合输入交互原语, 为规范化指-笔混合输入方式提供参考依据; (3) 提出了一种基于 POMDP 的增量式交互意
图提取方法, 可以提高针对多义性交互动作意图理解的准确率.

1 相关工作

笔交互与触摸交互同时具有使用自然、操作直观的特点, 且二者各有优势. 笔交互可支持细粒度、高精度输
入, 能够避免触摸交互中存在的“胖手指”问题 [1,2] ; 而基于手指的触摸交互不需要借助额外输入设备, 并且支持多
点和手势触控方式, 能够补充和扩展单点笔式交互能力 [4] . 因此, 在保持各自交互优势的前提下, 融合指和笔两个
通道进行输入, 不仅扩展了用户交互空间, 而且实现了从单通道输入向多通道的混合输入演变. 近几年, 学术界和
工业界开始重视指-笔混合输入相关问题. Microsoft Research 的 Hinckley 等人 [7] 结合物理纸笔下的用户输入行为
开展了多项 Pen + Touch 的研究, 提出了 Pen 书写、Touch 操作、Pen + Touch 融合的操作方式, 构建了 Microsoft
Surface 指笔组合交互的原型; 并在此基础上, 设计了 Manual Deskterity 原型数字绘图桌 [9] , 从自然的人类技能和
手的角色分工角度探索了笔和手指触控之间的任务分工, 为指-笔混合交互输入方式的发展奠定了基础. Zhang 等
人 [5] 提出了一种可以用于感知用户在 Pen + Touch 交互过程中静止和微小移动状态相互转变的技术, 不仅能够感
知到握姿的改变, 还可以为自适应用户界面提供技术支撑. Romat 等人 [10] 提出了一种基于 Pen + Touch 输入的文
档编辑和审阅技术 SpaceInk, 用户可以在指定位置为注释腾出空间, 动态地重排文档; 他们的另一项相关工作是一
个促进用户浏览信息和思想呈现的系统 ActiveInk [17] , 该系统可以为用户提供以笔交互为核心的主动阅读服务, 支
持基于笔迹激活的用户活动分析方法. Srinivasan 等人 [11] 构建了一个用于平板数据可视化的多通道交互系统
InChorus, 它支持 Pen、Touch、Speech 这 3 种输入形式. Cami 等人 [18] 使用不同握持姿势对单手的 Pen + Touch 交
互进行研究, 借助卷积神经网络方法能够从原始的电容传感数据实时识别出 10 个手势. 可以看到, 越来越多的工
作正在利用指-笔混合输入解决实际场景中的交互问题, 但很少有学者关注指-笔混合交互过程中的并行机制研究.
不确定性问题是触控交互研究的热点和难点 [15,19] , 指-笔混合交互过程中的不确定性也是指-笔混合交互的核

440 441 442 443 444 445 446 447 448 449 450