联系我们 contact us
地址:北京市朝阳区汤立路
   218号明天·STUDIO·A座
010-84678879

您当前所在位置:主页>技术共享>物联世界>

语音交互设计(二):设计流程与方法
时间:2018-06-05 08:26 作者:佚名 点击:

语音交互设计(二):设计流程与方法

  本文结合笔者参与的语音交互项目,梳理设计经过,对语音交互的设计流程、设计方法和设计产出做了较为详细的介绍。

  

语音交互设计(二):设计流程与方法

  “语音交互设计仅靠书本上的知识是不够的,在实际项目中,除了要了解需求、目标用户以外,还要了解语音设计所应用的场景、技术水平、设备配置等,从而有的放矢的展开设计。本文结合参与的项目,将语音交互设计的流程、设计关键点以及如何通过设计化解技术限制,和大家进行分享。”

  日常设计工作中,大家都会按照一定的设计流程开展工作,通用的流程一般有:探索调研 > 分析聚焦 > 设计策略 > 测试验证。同样,这个流程可以复用到语音交互设计中,只是设计对象的媒介和我们产出的设计原型发生了改变,但我们发现问题、解决问题的思路应该是类似且可复用的,尤其是在新的设计领域中,不妨借鉴成熟的方法、流程,确保工作顺利开展。具体的设计流程与环节如下图:

  

语音交互设计(二):设计流程与方法

  图1 · 语音交互设计流程

  1. 探索调研 1.1 明确需求

  笔者所参与的项目是“公司机房服务的工业机器人” 的语音设计,这类产品的功能比家用设备的更为强大,除了语音外,它支持:行走、人脸识别、任务解析、数据采集等,同时场景也更为复杂。首先机房环境声音嘈杂、环境复杂;它的性质又决定对人员的安全要求极高,需要准确的识别与判断,这些在了解需求阶段是必须明确的环节。

  机器人的主要功能就是辅助参观人员、维修人员、驻场工程师更好的完成机房工作,实现机房业务管理智能化,提高运维管理效率和准确率。那么作为体验设计方,则是通过各场景、各环节的体验设计,让人与机器人、与系统的交互高效、自然、流畅,让智能化的机房日常运维管理更加完善。

  1.2 了解业务场景及目标用户

  在上一篇文章中对主要的五种场景(智能家居、车载驾驶、企业应用、医疗、教育)分别进行了介绍。不同的场景,意味着用户不同的需求和目的,对语音交互的要求也不相同。下面就针对机房环境进行场景分析与设计难点的介绍。

  

语音交互设计(二):设计流程与方法

  图2 · 机器人功能及场景特征

  1.2.1 工作场景

  恒定噪音:作为机房服务场景的语音机器人,使用环境声音的嘈杂首先会影响语音录入的准确性。语音交互包含三个重要部分:自然语音识别、自然语音理解、自然语音生成, 因此解决设备“听”清楚的问题,关系到后续流程能否顺利展开。这里就需要依靠“设备技术”来解决,通过优化听筒的降噪能力,尽量过滤掉噪音。

  环境复杂:机房中机柜众多,服务器高低不一、设备管线错综复杂,如图3:这给机器人的正常作业带来挑战,尤其是这种对安全性和准确性要求很高的场景。首先,机房包间中的环境光线影响机器人对人脸的识别和机柜数据的读取;其次,机柜中服务器位置高低不同,机器人需要不断调整摄像头的角度,以确保采集到完整信息,也可能存在视野死角导致无法全部读取。这一部分,则需要通过不断的测试与调整,提高机器人自身性能,使其更好的适应现场环境,具有设备、网络线缆的识别能力,减少不必要的“人为”破坏,增加人脸、数据识别的准确性。

  

语音交互设计(二):设计流程与方法

  图3 · 一般的机房环境

  空间局促:在机房中机柜之间的空间不大,过道也比较狭窄,这给机器人行走带来一定影响。第一:行走速度不能过快,由于机器人自重150斤,走路太快会有惯性,有可能出现不小心撞到机柜的情况;第二:很多时候无法和人并行走路,这导致人机互动体验不好,再加上机器人本身走的慢,很有可能出现“人走在前面,遮挡住机器人视线”的问题。为此,在设计语音时,只要机器人感应到有遮挡,便会播报:“我好像被挡住了,请保持前方通畅”,以此来友善的提醒用户,减少这种封闭环境下用户的不适应。

  1.2.2 目标用户

  通过团队的调研,收集到在整个数据中心有5类用户,其中会进入机房与机器人直接发生交互的主要有三类:访客、厂商、数据中心驻场,如图4。图中是这三类用户的工作内容与场景接触点,确认目标用户,便于设计对后续用户调研的聚焦与体验地图的梳理。

  

语音交互设计(二):设计流程与方法

  图4 · 用户分析

  1.3 技术水平

  1.3.1 硬件

  硬件来说,目前的语音产品包括:纯语音(天猫精灵)和语音及界面结合(iphone的siri)两种配置。在设计之初,我们需要了解语音产品的基本硬件配置,这其中也包括麦克风、摄像头、听筒、设备联网程度等,因为,产品的配置会影响我们后期的设计策略与体验。例如问语音产品:“世界十大旅游胜地都是哪些?、中国56个名族都有什么?”,即便语音助手可以准确的告诉我们答案,但无疑是一个沉重的认知与记忆负担,如果配合屏幕来显示,情况会好很多。最好的人机交互形式是混合型的,即GUI+VUI(图像交互+语音交互)如图echo show,如果你所设计的是纯语音产品,那么在设计时则需要考虑更多的引导、容错、提示等。

  

语音交互设计(二):设计流程与方法

  图5 · 亚马逊Echo Show

  本次项目中所涉及的机器人不带显示屏幕,并且语音不联网,这就意味着所有对话都需要提前预设好,设计师需要根据可能出现的情况,将对话内容完善,并且做必要引导,让用户按照系统期望的流程进行,确保工作顺利、安全的开展。如下图:

网站地图 | RSS订阅 | RSS地图 | 网站首页 | 关于我们 | 技术共享 | 产品中心 | 成功案例 | 加盟我们 | 客户服务 | 联系我们 |
工况监测
    地址:北京市朝阳区汤立路218号明天·STUDIO·A座
    电话:0086-10-8467  8879      TEL:0086-133  6699  5587   (电话推销勿扰)
    版权所有:新企力(北京)检测服务有限公司   工作时间:(周一至周五  8:30-17:30)
    邮箱:web#xqili.com   京ICP备15050323号  
关闭