當前位置:
首頁 > 科技 > 思必馳俞凱:如何化解通用技術與個性化需求之間的矛盾?打造可定製的對話式人工智慧

思必馳俞凱:如何化解通用技術與個性化需求之間的矛盾?打造可定製的對話式人工智慧

「在這個時代,如果想要獲取信息,你很難不通過嘴。」 思必馳首席科學家、聯合創始人俞凱在上海市北·GMIS 全球人工智慧峰會的現場演講中的短短一句話,卻總結了目前人類的交互習慣發展趨勢。

思必馳俞凱:如何化解通用技術與個性化需求之間的矛盾?打造可定製的對話式人工智慧

打開今日頭條,查看更多圖片

在智能終端時代,有人認為 AR 眼鏡或許會是人類需要的 「最後一塊屏」,這種感覺在語音交互技術出現後可能表現得更加強烈。前瞻產業研究院發布的《2018-2023 年中國物聯網行業細分市場需求與投資機會分析報告》曾發布了初步估算的數據:2017 年全球物聯網設備數量達到 84 億,比 2016 年的 64 億增長 31%,2020 年物聯網設備數量將達到 204 億。在這些智能設備中,屏幕已經越來越小,而語音交互能力幾乎成了標配。可見,智能語音交互擁有極具誘惑力的諾大市場。

不過,在這個百家爭鳴的科技時代,有趣的不僅是宏觀的市場增量。企業在實踐摸索出規律,並對未來進行大膽、前瞻性的判斷,才更值得津津樂道。作為語音技術領域的平台交互型公司,同時也是行業前列的探索者,思必馳對於如何打造更加人性化的語音交互技術也提出了自己的新見解。

「通用的語音識別率基本上能到 95% 以上,語義識別率能到 90% 以上。但是語音交互本身是一個鏈條,儘管每個體系可達到 90% 的可用度,但是技術加在一起的整體可用率會降低很多。」 俞凱先提出了現在語音交互行業面臨的技術問題。他認為,導致問題的原因主要是 「沒有做聯合優化」,即大家都是在每個任務上是獨立優化。為了提高整個語音交互技術的可用性,思必馳實行了技術上的全鏈路,如以語義理解為目標來優化語音識別,即目標不是看字的錯誤率,而是看理解上的偏差。簡單來說,思必馳的技術全鏈路 AI 可以把語音交互技術中,前面產生的錯誤在後面環節中自動做糾正,提高整體的可用率。

當然,除了技術層面的優化,優質的語音交互技術還需要產品設計的加持,以保證體驗升級。此前,有很多基於語音交互技術的產品,如娛樂、教育機器人等遭到了用戶的 「拋棄」。這給企業帶來了技術邊界與用戶期望之間關係的深思。我們目前的語音技術究竟足夠支撐多強大的產品?什麼樣的語音產品會減小用戶的失望程度?

「技術邊界和用戶期望平衡的核心點是產品設計。」 俞凱表示,合理的產品設計可以有效地 「揚長避短」。他認為,以目前的技術發展狀態來看,需要做一些用戶可配合的場景應用,即場景的可控性較高。「讓用戶在合適的情況下去做一些交互,那麼產品的性能就比較有保障。」 他以思必馳和順豐合作的語音下單機器人為例說明:這就是典型的比較窄的任務,用戶目的明確,所以用戶的期望比較可控。總之,在技術發展的階段中,企業不僅在自己做產品的時候需要實事求是,對於用戶也要誠實。

值得一提的是,思必馳主要是為企業和開發者提供自然語言交互解決方案,包括 DUI 開放平台、企業級智能服務、人機對話操作系統、人工智慧晶元模組等。那麼,對於思必馳而言,他們如何基於自身技術實力為企業類客戶帶來新體驗?

俞凱稱,近幾年人工智慧產業鏈發生了比較深刻的變革——專業化分工的加速。在這樣的背景下,人工智慧企業分為三層,一是基礎技術支撐層。他們就像發電廠商;二是中間層。他們以提供技術賦能為核心的智能交互層,像是輸電的企業;三是應用層,集成各種各樣不同的從語音到圖像各種各樣不同的 AI 技術,形成綜合的產品解決方案,就像做電器的企業。而智能交互層出現了一個主要矛盾,即:越來越強的通用技術,與使用者高度靈活化,高度可配置的個性化需求之間的矛盾。

「面對這樣的矛盾,作為平台型的驅動企業,思必馳希望打造可定製的對話式人工智慧。」 俞凱說道。

「定製化」 並不是新鮮詞,但是思必馳打造的可定製的對話式人工智慧,兼具定製化和可規模化。眾所周知,一般來說,定製化意味著很難規模化。但俞凱表示可定製的對話式人工智慧就像是 「柔性製造」 技術,可定製,可批量生產,可實現 「千人千面」。

關於具體實現可定製的對話式人工智慧的關鍵點,俞凱從三個方面分享:

  • 一是工程支撐方面,首先是以全鏈路對話交互技術為核心,實現 「高可用」,即讓更多的人可以定製,另外也要支持定製地規模化;
  • 二是需要相應的資源支撐,比如識別領域,需要方言、多語種、多個精細化語義領域的支撐,才能夠形成完整的模型;
  • 三是演算法支撐(個性化智能自適應)。智能地自適應要解決三個難點:一是目標發現,即向誰做自適應學習。二是小數據的自適應,傳統的深度學習需要喂大數據來訓練模型,而現在需要用很小的數據實現。三是在線的學習更新,即當語義理解不精確,或者出現語音識別錯誤時,人和機器在真實場景當中可繼續交互下去,就需要一個聰明的決策。機器系統怎樣通過問話,或者通過引導使對話更平滑地繼續下去,能夠更好地把意圖推理出來。

「未來我們看到的對話智能,並不是一種通用的技術,而是可以在每一個產業裡面有自己獨立個性的定製化對話式人工智慧。」 俞凱說道。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 動點科技 的精彩文章:

OYO 酒店任命王平為供給增長部門高級副總裁
消息稱蘋果已取消 AR/VR 硬體研發,但後續仍將在 iPhone、iPad 繼續布局

TAG:動點科技 |