题名基于手势的视觉用户界面研究
作者武汇岳
学位类别博士
答辩日期2010-01-19
授予单位中国科学院软件研究所
授予地点中国科学院软件研究所
导师戴国忠研究员
关键词人机交互,视觉用户界面,用户界面模型,视觉手势,交互设计,手势工具箱,软件开发方法
其他题名Research on Vision Based Hand Gesture Interfaces
中文摘要随着人机交互技术的发展,各种新的交互手段不断涌现,使人机交互朝着更加自然、高效和智能化的方向前进。基于手势的视觉用户界面是post-WIMP时代的一种重要的界面形式,与传统的WIMP交互方式相比视觉手势交互能够使用户摆脱鼠标键盘的束缚而采用一种更加自然、无约束的交互方式,从而提供给用户更大的交互空间、更多的交互自由度和更逼真的交互体验,具有较高的应用价值和良好的应用前景,因此被国内外越来越多的研究者所关注,迅速成为了人机交互领域一个热门的研究方向,并被广泛应用于虚拟/增强现实、普适计算、智能空间以及基于计算机的互动游戏等多个领域。 视觉交互是自然人机交互的核心和热点研究内容之一,视觉交互可以通过手势、目光、头部运动或者面部表情等多种方式进行。其中,手势是人类进行视觉交互的主要手段,手势所能表达的语义信息十分丰富。在人机交互中使用视觉手势完成交互任务不仅自然、直观和方便,而且从计算机的角度出发来看系统实现起来也较为容易。因此,基于手势的视觉用户界面得到了广泛的关注并取得了许多研究成果。从目前的研究现状来看,在基于手势的视觉用户界面研究中,仍然存在着以下的问题: (1)传统的WIMP界面模型已经不适合描述视觉手势界面这种post-WIMP界面的特点,需要对传统的用户界面模型加以扩展,构造适于描述视觉交互特征的界面模型帮助用户清晰、准确地分析和表达界面功能及其变化,描述出用户与系统的交互过程,指导软件系统的设计和实现; (2)具体的交互设计过程中还存在着许多关键技术没有解决好,例如手势的正确理解问题、算法的鲁棒性问题以及手势的可扩展性问题等; (3)传统视觉工具箱复杂难用的问题。需要降低开发难度,开发出便捷、易用、可扩展的软件界面开发工具及相应的开发方法,支持领域内非专家用户快速开发出视觉手势原型系统。 本文正是从以上问题出发,围绕着视觉手势界面交互技术,从理论、方法与应用等几个方面展开了深入的研究。首先论述了用户界面的发展历程,继而对视觉界面研究现状进行了综述。在充分研究和对比国内外相关研究成果的基础上提出了一种基于手势的视觉用户界面模型UIDT。接下来针对视觉手势交互中存在的难题,以认知心理学为理论依据提出了一种可扩展的手势交互状态转移模型,并在此基础上构建了视觉手势处理框架。随后对该框架中的关键技术进行了针对性的研究。针对非专家用户在构建具有个性化视觉手势界面过程中所遇到的问题,设计开发了一个支持视觉手势交互的开发工具IEToolkit并给出了一套基于该工具的通用的软件开发方法。最后,将上述成果应用于互动娱乐领域,取得了满意的效果。 本文的创新点主要表现在以下几个方面: 1. 提出了一种基于手势的视觉用户界面模型UIDT 在充分分析视觉交互特征的基础上,以传统的用户界面模型为基础提出了一种基于手势交互的视觉界面模型UIDT。该模型从用户模型、任务模型、设备模型和交互模型等几个方面对视觉手势交互进行了深入分析和描述,给出了各个模型的形式化定义,介绍了模型的各个组成模块以及它们之间的相互关系,讨论了视觉手势界面设计中应该遵循的设计规范。评估结果表明,该模型具有较强的通用性,有助于设计者对VBI的任务、用户、设备以及交互的不同层次进行抽象描述,使用户界面满足可用性要求,提高界面设计和原型开发的效率。 2. 提出了一个可扩展的视觉手势交互模型及一种新的视觉手势识别处理框架,围绕着该框架提出了一种新的视觉手势跟踪和识别方法 首先,提出了一个可扩展的视觉手势交互模型。根据认知心理学原理将视觉手势交互处理过程细分为选择性处理、分配性处理和集中处理三个不同的阶段,有效解决了Midas Touch问题;基于该模型提出了一个视觉手势识别框架,并结合认知心理学从手势检测、跟踪和识别三个方面对该框架的各个组成模块的关键技术进行了阐述。其中手势检测模块和识别管理模块能够辅助系统在复杂的背景中滤除掉不相关信息而选择性地搜索人手并根据上下文信息对手势识别任务重定向,从而避免了系统时刻都处于激活状态并对所有的手势动作都进行识别分析,有效解决了Midas Touch问题;为了提高系统的性能,提出了一种鲁棒的面向实时交互的变形手势跟踪方法和基于小样本学习的模板匹配方法用于动态手势识别。评估结果表明,上述技术有效地提高了系统的实时性、准确性和鲁棒性。 3. 设计开发了一个支持快速原型开发的视觉手势工具箱系统 针对目前大多数视觉手势工具箱复杂难用的问题,设计开发了一个简单、易用、可扩展的手势工具箱系统IEToolkit,实现了本文所述的各种关键交互技术。它包含了构造一个基于视觉手势的交互系统所需要的方方面面,从事件模型、交互模型、数据流模型等几个方面对工具箱的组成结构进行了描述,并给出了一个基于IEToolkit的通用的软件系统开发流程,开发人员可以将更多的精力集中在具体的高层逻辑语义处理上,而不需要过多考虑底层的技术细节与支撑结构。应用实例及评估结果表明IEToolkit能够降低开发门槛,较好地支持基于视觉手势交互的应用系统的快速构造,具有较高的应用价值。 4. 基于上述研究成果设计开发了一系列典型的视觉手势交互系统 将上述理论模型与具体的交互技术进行有效结合,在视觉手势开发工具平台基础上开发了一系列典型的互动娱乐系统,在实践中对本文的研究成果进行了有效性验证。
语种中文
学科主题计算机应用
公开日期2010-01-25
内容类型学位论文
源URL[http://124.16.136.157/handle/311060/650]  
专题软件研究所_人机交互技术与智能信息处理实验室_学位论文
推荐引用方式
GB/T 7714
武汇岳. 基于手势的视觉用户界面研究[D]. 中国科学院软件研究所. 中国科学院软件研究所. 2010.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace