谷歌是怎么设计语音界面的?这篇总结了对话设计六原则!
编者按:新时代的界面将会突破现有的格局。界面将不再被滑动、轻触和点击局限,取而代之的是更天然精致的语言呈现情势。 用于GUI(图形用户界面)的设计技法和设计语言在语音交互这个全新的领域不再适用,VUI(语音用户界面)设计的新浪潮将基于「对话」这个我们最先学会而且最擅长的交流体例。
「对话」这种序言既复杂又体系,定义原则比小门生的校训还要玄妙、压人。
例如,不要用「而且」作为对话的开场,或者不可以打断别人讲话。我们与其他人对话交流时可以天然地应对各种复杂情况,这几乎成为了我们的第二本能。但是,假如我们不能真正理解「对话」的本质和其内在机制,就贸然开始设计人机对话,得到的用户体验通常是令人抓狂的。
语音是一种小我标志,表现了一小我的社会身份,也因此人们对它的标准极高。用户在使用过设计不佳的VUI后反映:这些VUI让他们觉得愚笨、可笑,甚至觉得被科技愚弄了。这些用户也因此透露表现不愿再次使用。事实上,这些都是可以避免的。
下面我将细致给各位VUI设计师们介绍这六项原则,而这些原则正是日常对话的延展。它们可以辅助设计师完成对话设计,并且引领VUI设计师进入以用户为中间的界面设计新时代。
一. 给VUI赋予形象
你可能觉得一个简单的语音应用不必要形象,但这不是需不必要的题目。对比下面这两个日历应用的例子:第一个例子展示了未经设计的助手形象(persona);第二个则是具有经过设计的形象。
对话1
用户:在日历里添加一个预约
VUI:请说出「日期」
用户:8月2日
VUI:请说出 「开始时间」
用户:1点
VUI:请说出「持续时间」
用户:哦,一个小时左右
VUI:请说出 「主题」
用户:性能评估
VUI:确认中,8月2日1点,持续一小时,是否精确?
用户:是
VUI:该事件现已在您的日历中
未经设计的VUI形象。
对话2
用户:在日历里添加一个预约
VUI:没题目,哪一天的?
用户:8月2日
VUI:谢谢,什么时候开始?
用户:1点
VUI:那么,预计要开多久?
用户:哦,一个小时左右
VUI:最后,我只必要记录一个简短的题目
用户:性能评估
VUI:搞定!让我重复一遍:8月2日1点,持续一小时,我记得对吗?
用户:对
VUI:赞!已经在你的日历上了
这个VUI的形象是经过设计的。
不管在不在你的计划之中,所有的语音都会映射出一种形象。就像第一个例子,按说应该是没有形象设计的VUI,却在「和睦、乐于助人」等性格属性上评价不高,在「无聊」上的得分却很高。
经过几十万年的演变,我们人类无法不用性格特性来评价一段语音,就连智能手表或GPS体系的语音也逃不过这种评价。这可不是主观观点,这是有据可查的事实。社会语言学家(如,拉波夫 1964 ①)的研究注解即使是极少的语音样本,也会让人产生对于演讲者性格、形象方面的印象。我们早已进化成可以根据人的声音来总结评判别人的专家。
曾有一个让人印象深刻的研究(Giles & Powesland 1975 ② ),研究者要求一些教师根据三样东西来评估8名假造的门生:一个书面笔墨样本,一张照片和一段语音演讲样本。研究效果令人惊奇,由语音样本产生的有利印象压过了书面笔墨和照片的负面印象。相反,门生的语音样本带来的不良印象则会压过其他两个内容带来的有利印象。
其他研究注解,我们寄托语音交流在许多方面评价别人:和睦度、诚实度、可信度、智力、教育水平、守时与否、慷慨度、浪漫程度、优胜程度和就业适合度等。总之,语音具有很大的能量。
小结
不要让你VUI的形象未经设计、随意地产生。从最开始就要瞄准创造最理想的形象来代表你的品牌。它们是什么样子的?它们听起来是怎么样的?最紧张的是,它们如何举措?在体验落地过程中,以形象设计作为根基并确保形象具有同等性。
更多有关形象设计的信息请访问 Actions on Google,代码实验室:Crafting a Character。
二. 推进对话
在日常对话中,好像有许多疑问句都可以用简单的一定或否定往返答。但现实上,它们扣问的信息远不止一定或否定。下面有两个如许的例子:
对话3
A:你知道派对会有谁来参加么?
B:知道。
这个题目想要得到的答案并不是简单的一定或否定。
对话4
A:可以给我唱首歌么?
B:不可以。
只用「可以」和「不可以」往返答这个题目并不知足对话性的预期。
你可能会觉得新鲜,这些作答的人为什么显得很不配合。这是由于在这两段对话中,作答的人违背了一个对话核心原则 – 量的准则(Maxim of Quantity)③。
根据这个对话举动原则,说话的人应向听者提供知足推进对话交流所需的信息量。假如作答的人只按字面意思回答一个题目,而没有提供可以推进话题的有用信息,对话互动是无法形成的。在上面的例子中,我们永久也无法知道谁会来参加派对或者拒绝唱歌的充分理由。这些说话的人吊了我们的胃口,假造助手也有可能做出和他们一样的事。比较下面两种处理由于价格上浮引起用户不快的方法:
对话5
用户:好,可以付出了。
VUI:目前这个时间,送餐费临时调整为7.99美元,由于美味面条家接单量过大。你还想继承进行付出吗?
用户:不了……
这个VUI没有成功将对话向前推进,迫使互动嘎然而止了。
对话6
用户:好,可以付出了。
VUI:我必须要告诉你,这个餐厅今天晚上8点到9点的运费是7.99美元,你还想继承下单吗?
用户:不了……
VUI:如许的话,这附近还有一些类似的餐厅。你感爱好吗?
用户:好,为什么不呢。
VUI:好的。附近还有另外两家面馆:马尔文区的涂鸦面馆,另外一个:谷流的斯塔意面。
这个VUI为用户提供了更多的选择,像天然的人类对话一样保持对话的持续推进。
显然,第二个VUI的形象更得力,更叫人喜好。但是,不是只有你的智能助理具备推进对话的社会伶俐,你的用户也有,而且这种本能是无法被压抑的。以下是用户尝试推进对话的例子,用户的举动就彷佛他们正与人类交谈一样:
对话7
产品:那么,几小我要去?
用户:呃……有我妻子和我。
这个用户盼望VUI可以从他给出的小我信息中推算出人数。
这个时候,假如识别机制被设计成只识别数字的话,例如「两个」,用户就会收到输入错误的提醒。而这个用户只不过是提供了更多的信息。假如识别器实在无法处理如许的回答,可以尝试用轻松愉悦的语言风格将对话引回正轨。比如,「对不起,有多少人?(上升语调)」。
研究注解:识别出错时,用户通常只必要一个简短的提醒。没有需要强调错误,也不要用机械而俗套的提醒语;例如「很抱歉,我不晓畅。如今,请用数字说出你们的人数。」你可以说:「比如,二个」。
小结
设计对话流时不能只关注字面意思。你必要尝试预判:VUI什么时候应该提供更多信息,什么时候必要识别来自用户的附加信息。如许才能保持对话的推进。你还必要意识到,业界所谓的「识别错误」现实的根源在于:人类乐于(在对话中)提供更多的信息,推动交流。
三. 简短、有用
语音与笔墨不同,语音是伴随着时间流动的。时间越长,听者就越难理解。我们大脑能处理的信息量是有限的,一旦超出,就会对短期记忆造成负担。「听」每每被认为是被动的;相反「说」被认为是自动的,高效的。事实上,听也会耗费不少精力。所以你的VUI必要给听众歇息的时间,也给他们一个机会说话,这是很紧张的。比较这两个例子:第一个VUI给听者克制感,第二个则更加简洁。
对话8
VUI:
天空航空47航班下战书1点从纽约肯尼迪机场起飞,下战书1点45分到达波士顿罗根机场;行仓航空234航班下战书2点15从纽约肯尼迪机场起飞,下战书3点45到达波士顿罗根机场;蓝鸟航空260航班下战书3点45从纽约肯尼迪机场起飞,下战书4点30分到达波士顿罗根机场;天运航空52航班下战书5点从纽约肯尼迪机场起飞,下战书5点45分到达波士顿罗根机场。你想要哪一个?
用户:……哈?!
这个VUI给用户的信息量大到令人窒息。
对话9
VUI: 向你展示4个航班:下战书1点、2点15、3点45 和下战书5点。 你想听其中一个的更多信息吗?
用户: 2点15的那个。
VUI:好的。下战书2点15,行仓航空234航班,从纽约肯尼迪机场起飞。下战书3点45到达波士顿罗根机场。你要预订吗?
用户: 啊,好啊。
这个VUI保持简短、扼要并提供了更天然、愉悦的交互。
与书面笔墨的永世性相反,语音是短暂的,须臾即逝的,且语音的传达体例是线性的。在VUI设计中,不相干的信息尤其令人反感。由于与GUI不同,用户无法略过一些内容。强迫用户处理没用的信息,是在虚耗用户的珍贵时间。在我看来,人们腻烦机器客服的首要缘故原由就是:冗长的废话。
很多VUI设计师和开发人员将不相干的信息强加于大众,比如:促销活动、向上贩卖和教育指导。你一定对如许的语音指导耳熟能详:请输入您的十位电话号码,从区号开始。
用户收益是关键。人们找东西或做事的时候,不乐意虚耗时间或绕圈子。研究注解,在做统一件事上,假如VUI没有显明的上风用户不会选择使用VUI。不然意义何在呢?因此,成功的VUI设计必要在相干性和便利性上都提供更优的用户收益。
小结
保持信息简短且有效,给用户说话的机会。确保信息对用户故意义,可以给用户带来显明收益。不要过早陷入冗长的细节。
四. 行使语境
要让对话真正有用,我们必须看重语境。一个良好的对话参与者必要通达对话的来龙去脉,熟记已说过的迁移转变点及关联点,并具备用户情景意识(比如:用户正身处国外,用户所在的地方将有一场暴风雨,或者用户今天曾三次尝试修改某种设置)。
同样,VUI设计也要尽可能地行使用户的语境。假如用户之前提供过一些信息,那VUI的回应最好基于已有信息。
比如,用户已经做了什么,用户已经知道了什么,用户在对话中已经说过了什么。显明的忽略上下文语境,会直接损害用户对智能助手的印象。有个众所周知的VUI反例:请听细心,由于我们的菜单选项最近有更改,这里还有另一个版本:
对话10
VUI:请细心听好,我们最近在选项上做出了一些改变。
虽然这段语音本意是辅助用户,现实却用可有可无的信息虚耗了用户的时间。这种语音提醒就是我所说的那种「VUI 糙货」中的典型,它的粗糙在于自以为是地忽略了用户的语境。
来让我们看看它那些一厢情愿的假设吧:它假设用户之前打过电话;它假设之前打过电话的用户当时听到的选项是修改前的版本「现实上,用户可能几分钟前才打过电话」;它假设「最近」的意思会被理解成是「最近几个月」;它还假设听过老版本选项的用户真能记住当时的选项是什么!因为忽视了用户的语境,这条提醒对绝大多数听者来说毫无用处,而我们也已经分析过为什么VUI中的无用信息令人尤为反感。
小结
我们在业界讨论了太多的个性化、人工智能、以及数据驱动创新。但其实,在设计中只要做到追踪对话的来龙去脉并保持对用户语境的意识,就可以有用地提拔用户对人工智能的看法。
五. 用语序和强调指导用户的细致力
制订单条语音的语言结构时,VUI对已提及内容的意识是相称紧张的。否则,断了「来龙去脉」的对话会给听者的理解造成负担,并导致模糊的不适感。看看这两个不同的VUI回复(用户要求在不存在的日期预订航班):
对话11
用户:预订…6月31号的。
VUI:其实只有30天,在您说的六月中。
这条语音把新信息放在前面,旧信息放在后面;打破了正常对话的「重点后置」原则 。
对话12
用户: 预订…6月31号的。
VUI:事实上,6月只有30天。
这条语音把新信息放在了句尾,更合理。
为什么第一段语音新鲜而且机械,而第二段更像天然对话呢?「重点后置」原则给出了诠释。根据这一对话原则(本文的引用经过简化)语言使用者对语言的信息排布具有偶然识的预期。
按照默认的规则,「新」信息出如今句子的末尾或接近末尾处,并用语气强调;而「旧」信息则出如今前面。在你刚刚听到的例子中,「30天」是新信息,所以它应该出如今最后并有适当的重音。在听起来很新鲜的版本中,旧信息「六月」错误地扮演了新信息的角色。事实上,「六月」不该放置在句子末尾,也不该使用语气强调,如许才能听起来更加天然。
违背「重点后置」原则会给交流增加没需要的阻力。反之,遵循用户对信息结构的预期不仅可以令体验更天然、顺畅,也可以让用户更加确信VUI确实听晓畅了本身的意思。
对话13
用户:印度的总理是谁?
VUI: 印度的总理是纳伦德拉·莫迪。
先陈述已知的信息,让用户知道机器听清了本身所说,从而增强用户对技术的信赖。
这个例子注解,把旧的信息「印度总理」放前面,用户会立刻知道机器精确识别到了「印度总理」。相反的,假如VUI说的是「意大利总理」,那用户就没需要花费精力去听后面的名字了。
小结
行使用户对语序和重音运用的预期,把用户的细致力集中在紧张的事情上。尽可能地把已知信息放在新信息的前面!(除非,你的VUI形象是效仿《星球大战》Yoda大师而设计的。④)
六. 不要教用户怎么下达指令 —— 语言是天然的
我小我最悔恨的业余VUI设计典型是「教用户怎么说话」。下面有两个例子:
对话14
VUI:假如必要更多选择,说「更多选择」。
VUI:假如想听更多,说「继承」。
这些提醒模仿了典型的按键界面「按键语音客服」,它们正在教育用户该如何交流。这些信息暗指用户必要学习怎么说话,不然VUI不会给你如许的提醒。
诸如此类的提醒还有许多:「假如必要什么,请说/请做什么」。这种提醒带有一些按键语音客服的痕迹:类似「技术支持请按1、付出和结算请按2」。事实上,这种信息是有价值(但是仅限于按键交互的领域),由于没有人从小就知道「1」 代表 「技术支持」。设计师和开发者赋予键盘的意义是用户无法通过直觉理解的。但在VUI的世界里如许的提醒听起来就很荒谬了。这暴露了设计者没有真正理解VUI。对大众来说VUI的意义和收益在于:说话是天然而然的, VUI是不必要学习的。
看看下面这个愉悦的对话式提醒的例子:
对话15
VUI:重播?回复?听下一条?
这一提醒充分行使了对话的结构:舒适、天然、使人亲近。
很难想象有人会听不懂如许简单、直接的提醒。假如他们真的没有听懂,你可以再次提醒。我们已经讨论过简洁、有用、和行使语境的紧张性。再重复一遍,只在需要时使用错误提醒。
总结
在VUI设计中避免教用户怎么下达指令。假如你必须对一个指令做出诠释时,那就说明哪里出错了,你必要回去返工。与其手把手的教用户说话;为什么不问用户一个题目,给用户机会说话呢?听起来耳熟吗?这就是聊天啊!
随着让人耳目一新的聊天机器人、语音助手和语音应用的持续问世,我们如今有机会传播一个观点:对话是用户体验成功的关键。这可不仅仅意味着使用接地气的语言,比如用「you’re」替换「you are」,或使用「哦」和「谢了」。
你要知道,对话是大天然最巨大的杰作之一,也是我们通过声音交流的最有力体例。最明智的做法是:效仿这些和人类一样古老的对话法则。而第一步就是开始从技术的角度解读对话的本质。
附录
相干出处及保举阅读
- Voice User Interface Design by Michael Cohen, James P. Giangola and Jennifer Balogh
- The Social Stratification of English in New York City by William Labov (PDF)
- Speech Style and Social Evaluation by Howard Giles and Peter Powesland
- The Media Equation: How People Treat Computers, Television, and New Media Like Real People and Places by Clifford Nass and Byron Reeves
- Logic and Conversation by H. P. Grice (PDF)
- A Concise Grammar of Contemporary English by Randolph Quirk and Sidney Greenbaum
译者注
- 拉波夫 1964: 威廉 拉波夫,美国语言学家,社会语言学的代表人物之一。
- Howard Giles 与 Peter Powesland 合著论文《言语风格与社会评价》。
- 量的准则:合作原则中的一条定义原则,该原则由闻名语言哲学家格莱斯于1967提出
- 尤达大师:电影《星际大战》中的人物尤达大师有着独特的说话体例,本文作为一个打趣出现。
原文地址:Library
原文作者:James Giangola
译文地址:uxc.baidu
「深入了解!将来大热的对话式交互设计」
- 《将来的趋势!好的 AI 对话体验应该是怎样的?》
- 《图形界面的末路?聊聊将来可能会流行的「对话式交互」》
- 《超周全!聊天机器人的界面交互设计实战经验总结》
- 《如何打造良好的语音交互体验?这儿总结了四个方法》
本文地址:http://www.tuquu.com/tutorial/di3836.html