提交需求
賽事與廣告咨詢合作,請?zhí)顚懶枨蟊韱?,我們會在第一時間與您聯(lián)系!
2018年的3月,小米,百度等多個公司發(fā)布智能音箱產(chǎn)品,小愛音響mini、小度在家、豹豹龍……可見智能音箱產(chǎn)業(yè)鏈這一年來的發(fā)展之快。隨著智能音箱、智能家居等智能硬件的普及,語音交互熱度也不斷飆升。
△ 語音交互設(shè)計(Voice User Interaction Design):它是一個以用戶心理模型為中心的設(shè)計過程,交談式為核心的交互設(shè)計。
本文內(nèi)容為語音交互啟蒙篇,不含詳細設(shè)計原則和方法。
︱一、語音交互的優(yōu)勢
如今,我們熟練并習(xí)慣用手指進行觸控交互,那么為什么要在現(xiàn)有的交互方式上增加語音交互方式呢?對于這樣的疑問,其實主要是語音交互有一些很重要的優(yōu)勢,包含以下幾個方面:
1.輸入效率高:百度、斯坦福大學(xué)和華盛頓大學(xué),曾共同完成了一項與智能手機輸入方式對比的相關(guān)研究。研究結(jié)果表明:智能手機利用語音輸入的速度比鍵盤輸入快3倍,且輸入準確率更高,語音輸入以絕對優(yōu)勢勝出。在日常生活中我也感受頗深,用微信發(fā)消息時,我經(jīng)常用訊飛輸入法語音轉(zhuǎn)文字,語音輸入速度快,識別的準確率也很高,大大提升了輸入效率。
2.釋放雙手和雙眼:在一些生活場景下,如在駕駛行車時,駕駛員的狀態(tài)是目視前方,手握方向盤。若想要完成選歌,或是接聽電話等操作這個時候語音交互會比其他交互方式更便捷,也更安全。另外,對于一些殘障人士來說語音交互也是友好的交互方式。
3.交互方式更自然:每個人都知道如何說話,就算是個新手用戶,也會通過直覺性自然地用語言進行回復(fù),語音交互是最為自然地交互方式。
4.傳遞豐富的信息:日常生活中我們會發(fā)現(xiàn)純文字溝通很難理解對方的情緒和語氣,但語音中卻包含了語氣、音量、語調(diào)和語速,這些特征可以傳達大量的信息。例如:“什么”這個詞,文字背后的可能包含驚訝、疑問、氣憤、不耐煩…的語氣,這是通過看文字感受不到的情緒。
5.設(shè)備特征需求:語音交互也常常成為小屏幕設(shè)備和不帶屏幕設(shè)備的首選,甚至是唯一的交互方式。
當(dāng)然也有很多情況不適合使用VUI場景的,如在公共場所的場景、用戶不適應(yīng)對機器說話或更習(xí)慣打字等情況,面對這些場景,多模態(tài)交互就很有必要了。
︱二、語音交互——語言對話與技術(shù)支持
1. 語言對話
在人際交往中,我們對話雙方似乎在有意無意地遵循著某一原則,來完成有效的社交對話。
語言學(xué)家Paul Grice 于1975年提出合作原則,即:
· 質(zhì)的準則 (QualityMaxim):所說的話需是自己相信的真實信息;
· 量的準則 (QuantityMaxim):恰到好處的信息含量,滿足并不超出交際所需的信息量;
· 相關(guān)準則(RelevantMaxim):所說的話需與當(dāng)前對話有關(guān);
· 方式準則 (MannerMaxim):說話需簡明扼要,直奔主題,避免模糊晦澀表達。
同樣沒有遵循這些原則VUI體驗也會很差:
(1)質(zhì)的準則:宣傳自己做不到的事
如:你對用戶說:“有什么可以幫助您的?”,而實際上整個VUI系統(tǒng)只能提供點歌功能。
(2)量的準則:多余的措辭
如:“好的主人,我已經(jīng)收到了,請您注意聽主人,我要開始給你講故事了……”(廢話好多)
(3)相關(guān)準則:給用戶當(dāng)前用不到的指示
如:用戶還沒下單的時候就開始解釋退貨政策。
(4)方式準則 :使用用戶難以理解的專業(yè)術(shù)語
如:“您的SSID是什么?”
人們已經(jīng)習(xí)慣于各種各樣的會話和社交行為,VUI雖然不是人類,但遵循基本的社會習(xí)俗是有好處的。
2. 相關(guān)技術(shù)
如今我們的手機和設(shè)備都已經(jīng)可以用語音處理很多事情了,從聽到我們的語音到執(zhí)行正確的指令為我們解決問題,都離不開語音交互的兩個重點核心技術(shù):語音識別(Automatic Speech Recognition,ASR)、自然語言處理(Natural Language Processing,NLP)。
(1)語音識別的挑戰(zhàn):
· 噪音處理:恒定以及突然產(chǎn)生的噪音、周遭說話聲;
· 多人講話情況:辨別誰在說話仍將是VUI系統(tǒng)的挑戰(zhàn);
· 兒童:聲帶短,音調(diào)高,語音數(shù)據(jù)少;低齡兒童容易自言自語,口吃、長時間停頓等;
· 中英文混合,名字、拼寫和字母數(shù)字:預(yù)設(shè)列表和上下文信息,運行時拋棄無效結(jié)果,優(yōu)選可能性高的。
(2)語義識別的挑戰(zhàn):
· 語言的多樣性:各種不同國家或地域語言:中英文、方言等;
· 語言的多義性:語言存在歧義,比如“我要去拉薩”,是理解為 火車票?音樂?景點查詢?
· 語言的表達錯誤:錯字、多字/少字、不連貫(我要看那個恩瑯琊榜);
· 語言的知識依賴:七天(時間/酒店)、大鴨梨(水果/餐廳)、別稱;
· 語言的上下文:對話上下文、因果關(guān)系、不同類型用戶的表達。
就目前行業(yè)來看,語音識別發(fā)展較為成熟,一些數(shù)據(jù)顯示ASR的準確性已經(jīng)超過90%,但那是在理想條件下。目前語義識別是學(xué)術(shù)界研究的聚焦領(lǐng)域,也是行業(yè)巨頭布局重點。
設(shè)計師需要在現(xiàn)有技術(shù)基礎(chǔ)上去做設(shè)計,理解語音交互相關(guān)的技術(shù)。并找到有效的設(shè)計方法來最大程度的利用科技進步,盡可能避免行業(yè)存在的技術(shù)瓶頸。
語音交互已經(jīng)出現(xiàn)在我們的視野,作為一名設(shè)計師,若不想局限自己,就是要培養(yǎng)自己的“敏感體質(zhì)”,保持好奇心、拓寬眼界、快速學(xué)習(xí)。
因為筆者并非語音交互相關(guān)的從業(yè)人員,所以本文內(nèi)容主要是筆者在業(yè)余學(xué)習(xí)過程中的的思考和總結(jié),該篇章為啟蒙篇大部分觀點來源于《語音用戶界面設(shè)計對話式體驗設(shè)計原則》這本書(這本書是關(guān)于VUI比較全面的一本書,也是天貓精靈團隊的參考書籍之一)分享給大家,希望對大家有所幫助,文章若有疏漏之處,歡迎交流指正。
END
大牛,別默默的看了,快登錄幫我點評一下吧!:)
登錄 立即注冊