當前位置:
首頁 > 科技 > 業內粉絲關注!AI語音方向:封閉域/開放域對話設計方法論

業內粉絲關注!AI語音方向:封閉域/開放域對話設計方法論

IEEE選舉進行時

中國科學院外籍院士、外專千人計劃入選者、中國政府友誼獎獲得者福田 敏男(Toshino Fukuda)正在競選2019年IEEE總主席,此次是亞洲人首次競選IEEE主席。福田教授多年來為中國與世界各國的學術交流及合作做出了巨大貢獻,廣大IEEE會員及機器人行業同仁們可以進行投票支持,擴大亞洲在IEEE的影響力。

IEEE網址:ieee.org/elections

投票:Directvote.net/ieee

投票時間:2018.8.15-2018.10.1 EDT USA時間下午1時,UTC時間下午5時

在今天,封閉域對話還是佔據語音交互產品的主流位置,智能音箱,智能車載,智能家電都是要以指令類對話作為主要要解決的問題,封閉域對話之所以存在是因為它可以很好的利用語音高效解決問題的特點,聽歌,訂外賣,網購,搜索等等,都可以相比藉助手機操作一些流程要簡便的多。

但是這裡有一個前提:用戶明確知道自己想要讓機器幫助自己完成什麼。

而不是一些模稜兩可的指令,比如:用戶說自己想買一件衣服(姑且不說它對質量和外形有要求這一特點),機器很難在簡短的對話中詢問到用戶的需求,甚至很多用戶都不清楚自己的需求是什麼,到底是要買短袖,還是外套,再加上語音輸出效率低的特點,用戶體驗自然不佳。

但是如果用戶可以明確的說:「買一瓶海飛絲洗頭膏」時,機器可以直接明確訴求,並完成購買任務,語音的優勢才得以發揮,具體封閉域對話的設計還可參考智能音箱初體驗和語音交互深思考。

在進行封閉域對話設計時有一個原則:儘可能做到對於用戶需求可能的任何表達方式,都要有對應的回復措施。

在進行產品功能設計時,雖然可以通過語音提示告訴用戶他們可以進行那些操作,讓機器完成那些事情(「我更擅長為您購買對外形和質量要求不高的商品哦,比如日用品,食品,洗漱用品」)。

但是隨著語音設備的普及,功能的完善在所難免,所以如何通過對話的設計來補足它不能顯示信息而帶來用戶體驗不足的缺陷是一定要邁過的坎,想要打到剛才所述的原則最好的方法在個人看來就是佔據對話的主動權。

如果一次對話總是讓用戶牽著走,一方面用戶會覺得累,總是要思考還能讓機器做些其他的什麼,不會有被機器服務的感覺,一方面也很難控制對話的節奏,超出能力範圍之內。

這裡有兩種方法,一種是引導用戶,也就是幫助用戶縮短範圍,逐步讓他們明確自己想要的商品或者想要得到的結果是什麼,避免陷入人和機器互相不知道對方處於什麼狀態的尷尬狀況,這是在進行對話交互設計的大忌。

其中分為直接引導和間接引導。

直接引導是明確帶領和用戶之間的對話,「我想買件衣服」「沒問題,您是想買短袖,襯衫,還是外套呢,我好為您更精確的篩選」或者「我餓了」「為為您推薦附近的外賣吧,您是想吃快餐,飯菜,麵食還是麻辣燙呢」。

這就像去商店裡一樣,服務員不會在客人一進屋就推薦某一個商品,而是先縮小用戶需求的範圍,而這種縮小範圍的過程並不會因為增加對話的論述讓用戶厭煩,因為這種被服務的感覺會增加他們容忍的界限,與此同時,在不斷用引導的方式服務的過程中,可以建立用戶越來越完整的畫像:穿衣風格,喜歡的顏色,鞋子尺碼等等,這樣也有助於進行日後商品的推薦,如果一個顧客已經在一家店鋪購買多次商品,可是每次服務員都要問一些相同的信息,客人會不會覺得不舒服呢。

也可以採用間接引導「我想買件衣服」「好的,根據銷量為您推薦XXX短袖,價格XXX,評分XXX,XXX外套,價格XXX,評分XXX,XXX襯衫,價格XXX,評分XXX,有您中意的么」在給用戶推薦的時候,主動根據可能會涉及到的幾種類別進行詢問,讓他們自己去找方向,也有助於對後續商品進行針對性的推薦。

另一種佔據主動權的方法是主動去服務,用戶使用機器是享受服務的,如果能給予超出想像之外的驚喜,那麼在帶領對話方向的同時,也會讓用戶覺得產品很智能,再加上根據長期對用戶畫像的建立,主動服務也會越來越幫助用戶享受意料之外的服務。

「我想買件襯衫」

「為您推薦XXX,價格XXX,銷量XXX,是否需要購買」

「買吧」

「購買成功,有設計師為這件襯衫搭配了相應的休閑褲,休閑鞋,是否為您推薦」

在進行語音設計時,還有一點可以注意,語音的特點會將表述的內容進行放大,這既可以是優點,也可以是缺點,很多活動優惠,在界面上,用戶感覺習以為常,甚至很多還容易被忽略,但是語音不會,而且由於這种放大,會讓這種被服務的感覺也放大,還是剛才的對話。

「我想買件襯衫」

「為您推薦XXX,價格XXX,銷量XXX,是否需要購買」

「買吧」

「購買成功,這家店鋪有滿200減30的活動,打折後價格為XXX,是輸入口令XXX」

這是在指令類對話設計的一些暫時性的思考,且行且想且記。

開放域對話即人可以和機器進行平等的交流,如果說用語音對機器進行問答和布置任務的操作是很好的利用了語音的優勢,讓問題的解決更加智能化,那麼這種交流就是先告訴人們,智能時代已經到來,因為沒有比能和一個機器進行對話更直觀的體驗了。

開放域對話有幾點用途,先從他的分類說起,在今天主流的開放域對話就是閑聊,有通用類的閑聊,也有針對特定人群的閑聊,比如孩子,病人,老人,那麼第二種與其說是閑聊,我更願意說他是一種情感上的交流,因為這種聊天存在的意義是讓你聊天的對象可以通過一次或者一段時間的人機對話得到心靈上的慰藉,疏通,那麼反觀通用類閑聊的作用呢。

很多公司都知道,對於一款語音類的設備,無論機器的核心功能是什麼,在為用戶盡量滿足任務的需求基礎上,加上閑聊總會感覺更加風趣幽默一些,而做這件事情的初衷,就是為了機器能更顯得人性化,將生活中各種各樣的事物人格化是我們每個人都骨子裡存在的本能。

為什麼斷舍離的思想如此盛行,因為每個人在使用一件東西很長一段時間後,都會和它產生感情,哪怕他沒有生命,哪怕我們知道這就是一件工具,我們之間只是使用和被使用的關係,但是也會不自覺得將它賦予了一種人格,將他們放在角落裡,也捨不得扔掉,而有一天在強制的斷舍離思想的驅使下,將它們丟棄,也是懷著「無比沉重」的心情,斷舍離可以讓我們的生活更加輕鬆,簡單,不用拖著太多的「過去」前行,但是這種將物體人格化卻是我們揮之不去的本能,而語音是一種再直觀不過的將機器賦予人格的方式,能為人們解決生活中方方面面問題的物體,還能與之對話,這是人們求之不得的。

我們再加入一種功能時應該思考加入的目的,但是也不能忽略這種功能背後的隱藏意義,在體驗了今天的幾種帶有閑聊功能的交互系統後,很普遍的現象就是「尬聊」。

什麼意思,你可以用我的公眾號感受一下。

就像是兩個相對無言的人,一個人努力的找話題,另一個避重就輕也好,斷章取義也好,總之在一輪或者幾輪過後讓另一個人不知道如何接下去,再努力去找另一個新的話題,然後走向另一個尋找話題的入口,對於用戶來說,有一種總是和一個新的陌生人對話的感覺,我們彼此不熟悉,努力找話題,下一次對話我們還是陌生人,甚至下一輪對話我們就是陌生人了。

我想這算不上聊天,也許是由於現在的開放域對話設計的機制是生成式的,可以讓對話更具有多樣性,不受一些條框的限制,也為了讓一個機器更像一個人,但是在我看來聊天更應該是和一個剛剛熟悉的人了解彼此,或者和曾經有過溝通的人尋找共同話題的過程,應該是一個藉助聊天建立起親密感的過程,而且機器可以藉助這種親密感去創造更多的服務空間,讓人們對它產生依賴,所以,在為閑聊設計對話時,應該把藉助閑聊讓人和機器彼此了解的初衷考慮進去。

人了解機器,就是在腦海里建立人格的過程,有了人格,人機更容易共存,否則機器就只是一個機器,特別是對於一切垂直領域,涉及用語音在解決人們日常生活的各方面問題時,人格顯得更加重要,這個機器是一個陪伴我學習,成長的老師,還是有著充足醫學知識的醫生,還是有著豐富旅行經驗的旅遊達人,在經過多次使用後,自然在人們心裡有一個概念,而在下一次遇到這個領域的問題時,他會第一時間想起它,依賴它。

機器了解人,可以通過為人建立立體的畫像,對人在自己所在的領域所關心的問題有一個全面的了解,比如,醫療,可以通過交流知道一個人的病史,身高,體重,生活習慣,作息規律等等他需要了解的信息,那麼在後續提供服務時,就會更加具有針對性,這也才是發揮人工智慧專屬為每一個人服務的優勢,想要專屬,先要了解,想要了解,語音是很自然的方式。

所以在設計對話時,不用純生成式的方式,要在一定的規則下生成,一次交談對於機器來說是有任務的,就是要通過自然的方式詢問用戶的信息,一方面可以完善自己需要的用戶的畫像,另一方面可以讓閑聊更像人和人之間的聊天一樣不尷尬。

舉個栗子更加直觀:

「你幹嘛呢」

「我在學習新的知識,你喜歡學習嗎」

「不喜歡」

「為什麼呢,學習多有趣啊」

「因為我感覺數學啊,物理啊什麼的太枯燥了」

這樣就可以了解到孩子是一個排斥學習的現狀,對於數學,物理有逆反心理,那麼在後期推送題目,安排課程時就選擇適當難度,先培養起孩子的興趣,成就感,而不是千篇一律,自然沒有進步,以此類推,用這種方式逐步加深對孩子與學習相關的各方面的了解,畫出完整的畫像,側面也反映一個問題,就是人工智慧相比於互聯網解決問題的方式,更加系統,有針對性,也更有機會將在每一個領域的問題根本解決,所以將需求挖的越深,將需求理解的越透徹,越能發揮出AI+的優勢。

與此同時,要注意不要讓用戶有很明顯的被「查戶口」的感覺,這樣用戶會本能覺得自己的隱私正在一點點泄露,整個生活情況正在被其他的人知道一樣,所以如何掌握人們表達的話術也是一件很重要的事,生硬的一問一答會讓警覺的用戶有意識地不再向你透漏任何信息,甚至不再使用產品。

如果想要更主動,更周到的服務,想要更深入,更系統的解決辦法就要用戶的個人信息做基石,就像去店裡買衣服,只有店員在你來了幾次之後,知道了你的尺碼,喜歡的風格,顏色,才能在下來進來時直接推薦你很有可能喜歡的,才能在出新品時主動提醒你,才能在你選好了一件衣服後,直接買適合你穿的那一件,不需要你每次進來都要重新做這一切,那麼以信息的輸出為代價下的時代進步就要先保證信息的安全,這也是最最重要的問題,使用法律體系來監督,還是科技手段來改良,還是讓用戶知道什麼時候選擇自己的信息可以被透露等等手段都需要不斷完善和摸索。

還有一類問題,也是開放域對話可以解決的,就是情感交流,在今天情感的缺失是一種城市病,也是社會病,在學習壓力,工作壓力,生活壓力下每個人都存在心理上的問題,或孤獨,或迷茫,或壓抑,或浮躁,即使是很多企業的老闆,都會有一些高級的心理醫生給他們排解負面情緒,那麼在人機共存的將來,機器既可以服務人,也可以陪伴人,陪伴的前提是需要平等的交流,那麼這種對話的設計就很重要。

而且這也是一個建立親密感的好機會,因為一個人在情感脆弱時,更容易記住那些幫助過他的人,也更容易建立起好感,那麼對於提供情感之外的其他服務也就更為方面,在情感這方面設計主要有三類,針對用戶的不同,用戶情況的不同有所差異。

一種是傾聽式,也就是一次對話主要以用戶傾訴為主,而機器承擔的是一個傾聽者的角色,今天的人們能做好一個傾聽者的都不多,但是機器可以很好的完成這件事,之所以會這樣是因為,很多負面情緒都是一時的生理反應,有時候越在心裡胡思亂想,越容易鑽牛角尖,所以傾訴出來是一種解壓的方式,但是能在身邊時長給你當負面情緒垃圾桶的人並不多,畢竟誰都想和一個正能量,陽光的人在一起,畢竟誰的生活都有自己的困擾,機器由於只是在一定的規則下行事,就可以很好的避開這一切,只需要學習一個傾聽者應該掌握的話術,在相應的時機,說出相應的話即可。

比如

「今天心情不好」

「怎麼啦」

「我和同學吵起來了... ... balabalabala」

「事情都過去啦,說出來心裡就舒服一些了,想一些高興的事吧」

類似這樣,而且在不斷的交流中也有助於建立用戶畫像。

第二種是反問式,這也是在生活中正常的情感交流方式,也就是很多有負面情緒的人,困擾他們的事,在他們心裡都很清楚,只不過有的是過不了心裡這道坎,有的是在一種情緒里出不來,被這種情緒蒙住了眼睛,這時候的需要有一個聲音喚醒他對這件事情的認知,讓他們認識到,這件事情想清楚了沒那麼嚴重,只是自己將他放大化了。

比如

「好煩啊」

「怎麼啦」

「今天和同學吵架了」

「為什麼和同學吵架了」

「因為他當著同學的面罵我」

「他為什麼要這樣做啊」

「因為我路過他的時候把桌子上的書碰掉地上了」

「為什麼把書碰掉地上了他就要罵你啊」

「不知道啊,可能是他心情不好唄」

「為啥他心情不好呢」

「可能是這次考試沒考好吧」

經過不斷剖析自己內心的這個過程,就會帶著用戶從負面情緒的陰影中走出來,這也是很多家長和孩子溝通的方式,幫助他們了解事情的原委,其實答案就在他們心中,當然為了避免在反問時過於生硬,同樣的,話術很重要。

第三種是交流式,也是最高級的情感交流方式,這時機器扮演的角色更像是心理醫生,針對用戶的情況基於相應的分析和解答,對心理問題解決的也更有針對性和透徹。

如果是在某一個領域附上情感交流功能的話,那麼可以針對這方面用戶群體可能會發生的各類情感問題做一個細分,然後做針對性的解決。

比如一個學生,可能會導致情感問題的方面有學習,家庭關係,同學關係,生活問題,那麼工作,生活壓力等等就和他們關係不大,然後在這四個方面,不同學習狀況,家庭情況,學習情況,以及生活方面的孩子都可能會有哪些問題,將情感這個抽象的概念量化。

如果是專門做情感交流的機器,就需要全方面了解各年齡段可能會遇到的問題,那麼這個體系就更加龐大,但是也可以量化出來,儘可能窮盡。

這就是在開放域對話暫時想要的一些設計方法,綜合來看,這是一個很好的將機器人格化的機會,人格化是為了在服務和陪伴時是在一種親密關係下進行的,而機器不只是冰冷的工具,而且針對性的服務需要建立足夠立體的用戶畫像,那麼交流是一種很舒服也很高效的方式,還是那句話,我們不僅要為機器添加功能,更要清楚功能背後的潛力和意義。

作者李洺宇,現AI語音方向研究生就讀,有意向尋找一份語音交互設計或AI產品經理方面的工作,如果您有這個需求,可與本人聯繫

文章來源: AI產品潛心修行

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器人大講堂 的精彩文章:

全球工業機器人巨頭數據對比
日本研發腦電波控制機械手,人人能瞬間擁有「第三隻手」

TAG:機器人大講堂 |