當前位置:
首頁 > 知識 > 車好多王文斌:人工智慧如何在汽車交易中發揮作用?

車好多王文斌:人工智慧如何在汽車交易中發揮作用?

機器之心報道

演講者:王文斌

整理:宇多田

在剛剛結束的市北·GMIS 2019 全球數據智能峰會上,車好多高級演算法專家、NLP 與用戶畫像方向負責人王文斌帶來主題為「對話機器人賦能企業在線化」的演講,介紹了對話機器人在企業服務在線化的過程中是如何成為關鍵的智能化業務節點並提效業務發展的。

以下為機器之心根據演講內容進行的不改變原意的編輯、整理:

非常榮幸有這麼一個機會,能夠代表車好多集團和大家一起探討人工智慧、數據智能在一個具體的產業裡面是怎麼落地的。

提到車好多大家可能不太熟悉,但是翻到這一頁,應該很多人想起孫紅雷和楊穎的廣告詞,車好多旗下有很多品牌,包括瓜子二手車,毛豆新車,瓜子養車,瓜子金融,車好多保險等等一系列協同的業務,我們立足於讓每個家庭都擁有更好的車。

車好多現在在打造一個覆蓋車輛評估監測,二手車交易,新車交易,汽車金融,還有維修保養,汽車保險等等在內的全生態的產業閉環。

那麼汽車交易是否真的像吃瓜子毛豆這麼簡單呢?

其實不是的,汽車交易的複雜性很有可能讓你恨不得坐在汽車的引擎蓋上大哭一場。

為什麼汽車交易複雜呢?一方面,汽車交易的鏈條非常長,包括從一開始的體驗、交易到後續的金融,物流,保險,養護等等。另一方面,在交易過程中具有很大的不確定性,主要是來源於這個過程中有各種各樣人的決策的參與。

比如雙邊交易的買家和賣家,人工評估師,還有銷售的差異化的問題。既然有人的參與,我們在一個成功的交易過程中,其實在跟人性打交道,所以整個過程有很大的不透明性還有不確定性。

我們公司立足於通過技術創新的手段,讓整個複雜的交易,從傳統的純線下交易變成線上線下相結合,通過線上的技術能力賦能線下的場景,依託人工智慧和大數據的方案促使整個產業升級和轉變。

今天我就其中一個落地的實踐跟大家展開說一下,也就是對話機器人,在企業服務在線化的過程中是如何賦能提效業務發展的。

首先,一個用戶來到我們的 APP 或者 Web 頁面,會有有各種各樣的渠道,公司會提供一些在線化服務,中間就是包括機器人在內的在線產品,比如用戶需要什麼樣的服務,

用戶有什麼樣的訴求,他需要一個窗口反饋,會把他的數據和訴求留在這個系統裡面,後台的系統結合這些數據做出進一步的優化和產品的閉環。

對話機器人在這個過程中有縮減人力培訓成本,提升服務效率等等基本的提高效率的能力;更重要的是,它可以將服務在線化,企業在這一過程中做到溝通的可追蹤可優化,把用戶諮詢和訴求相關的數據記錄下來,提供差異化的服務,精細化的運營,從而推動企業精細化的發展。對話機器人的 IM,是其中特別關鍵的一環,它既是服務的入口又是服務的出口。

對話機器人還可以覆蓋售前、售中、售後,省去調查問卷做商業智能分析,把客服從傳統的重複工作中解脫出來,變成一個類似專家/秘書的更專業的角色。

特別是精準營銷,對話機器人在這方面有天然的優勢,是最直接的和用戶的觸達,我們可以用多輪對話引導用戶完善用戶畫像,從而提供更準確的千人千面的精準營銷,把傳統的花錢的客服部門轉化成賺錢的收益的部門。

接下來跟大家分享一下,我們在具體實踐過程中一些技術上的積累和經驗。

我一直在想怎麼把對話機器人給所有人解釋清楚,其中最核心的是兩個方面:一個是用戶留下了問題,我要知道他問的是什麼意思,也就是意圖識別;第二是拿到意圖以後,要給一個什麼樣的回答,除了意圖和回答關聯關係,我們會重點講一下知識庫在裡面扮演什麼角色。

首先對話機器人的基礎能力,不管用戶輸入什麼樣的問題都能很好的結構化,或者說把問題映射到一個意圖,例如畫面上這些問題都是在問買車的步驟。下面這是一個對話機器人經典的流程,我們在做的右邊這部分,語義理解,對話管理引擎,和基礎的知識庫。對話機器人的核心概念一個是意圖,一個是槽位。

在工業環境中,我把對話機器人技術演進為四個階段,首先是關健詞,後面有模板技術,搜索技術和深度學習技術,這些所有的技術都是基於自然語言處理的基礎之上去構建的。

先說一下模板技術,舉個例子,「泉州過戶到廈門會不會很麻煩」,先把這個問題進行預處理,然後映射到一個模板,在已經積累的模板庫裡面進行匹配,如果匹配上意圖就會回答,如果沒有匹配上,就失敗了。

模板對應的知識庫中,問題和模板是 N 比 1 關係,模板和回答也是 N 比 1 的關係,我們要積累大量模板庫,可以進行同義詞的擴展加人工審核,以及人工補充模板,回答也需要人工配置回答。

第二種技術,我把它叫做搜索,問題先經過一個預處理的 query 理解,然後把這個理解結果扔給搜索系統,搜索系統會反饋一個相關的問題 list,通過精細的 rank,得到一個最終從語義上相關度最高的問題。但是稍微變化一下說法,有可能依賴於語義相似度的局限性得到的問題看起來從字面上一樣的,實際上語義上完全不相關。

搜索的知識庫就是搜索系統,是我們搜索裡面知識的索引庫,它的問題和回答是一對一的,我們需要長期的通過人工補充相似問題,同一個意圖下不同的問法越多越好,回答也需要人工配置,或者去關聯問題。

對話機器人的基礎技術第三種,我把它叫做深度學習,深度學習在一般的 NLP 的基礎技術裡面已經帶來很大的提升。

在剛才提到的搜索技術裡面,其實深度學習也扮演很重要的角色,比如可以通過比較經典的語義計算框架做排序,排序的特徵也可以用深度學習模型提取,但是在具體的對話系統裡面,我們用深度學習直接做了一個最核心的提取,就是意圖識別和槽位解析。

深度學習的知識庫長什麼樣子呢?其實是問題到意圖是 N 比 1 的,我們需要通過人工標註大量的標籤,然後通過意圖再關聯對應的回答,這個回答也是需要人工配置的。

模板技術,它的優勢主要是準確率比較高,泛化能力比較弱,我認為它的模式是比較重的。

搜索這種技術,它的優勢是對業務的適應能力強,無需太多的標註工作,我把積累相似的問題還有回答直接扔到我的搜索系統裡面就可以進行一個簡單的冷啟動。它的劣勢是依賴於語義相似性的計算,需要依賴於特別大量的數據才能把模型做到相對準確的程度,同時泛化能力和準確率相對比較低。

深度學習泛化能力比較強,它充分利用深度學習的文本分類能力,但是這種泛化能力和準確率依賴於高質量的數據標註工作,所以它的模式輕重介於模板和搜索之間。

這個是我們對話機器人的演算法架構,基於這些基礎的技術,再往上我們去開發一些基礎的服務,比如意圖識別,智能導購,對話輔助,還有自己的 NLP 平台。我們包裝了一個比較完整的對話平台,使這個對話平台可以高效的支持新業務,包括 C 端的在線客服,還有打電話的在線機器人客服等等。

剛才提到的意圖識別,我們在實踐過程中發現可以把這幾種技術進行有效的結合,充分利用它們的優勢,彌補它們的劣勢。

比如第一層就是剛才以模板識別為主的快速識別過程,它的好處是準確率比較高,我也可以利用快速識別做 badcase 的實時響應。

第二層是深度學習,第三、四層是剛才提到的搜索,如果語義相關性足夠高,我們就可以把對應的回答反饋過來。如果語義相關性不高,就會返回最相關的幾種結果,讓用戶去選。

說到對話機器人,不得不提一下多輪對話,這是對話過程中更能精確的滿足用戶訴求的對話形式。

我總結多輪對話要做好三件事,第一個是填槽,比如說用戶說「幫我推薦一款車」,我要反覆的確認信息,比如說車型,品牌,價格等等。

第二個是場景管理,有兩個概念,一個叫長期記憶,一個是短期記憶,這個短期記憶是用戶當前會話或當天的上下文的信息,長期記憶就是積累的用戶畫像,有了這些記憶的內容讓整個對話更智能一些。

第三個是做好可配置,就像在座可能有很多程序開發人員,大家寫完一段代碼扔給編譯器,編譯器並不關心這個代碼邏輯是怎麼樣的,只要符合語法就可以了。這個可配置就是這個目的。

對話機器人整個的系統架構,從用戶的角度看到就是一個對話框,把消息發給消息伺服器,然後到對話引擎,對話引擎可以和場景管理的記憶進行交互,和知識庫進行交互,後面我們的回答有多種多樣的形式。

比如說文本類的,一些卡片類的,還有多輪對話,還有可能包含雲端服務獲取到的信息拼接的一些回答。

我們是需要通過知識庫這個媒介去配置回答裡面應該去訪問哪些動態 API,應該訪問哪一個多輪對話。

對話機器人做到後面最關鍵的是做知識庫,真正的把對話的維護能力賦能給業務方和產品。

大家可以看到在最左邊主要這麼幾個部分,知識的管理,意圖的管理,訓練樣本的管理,文本的配置,多輪對話的配置,還有一個標註的系統,我們每天把識別出來和識別不出來的抽樣進行標註。這是一個多輪對話的配置的圖,現在可以做到非常高效的配置的過程。

接下來跟大家分享一些我們在具體做這個事情的過程中,遇到的一些困難,以及從我個人角度得到的一些心得。

首先作為一個技術人員,比較理想的情況需要演算法、平台特別的牛,但是實際過程中我更多的考慮人的因素,產品的因素,整個平台迭代過程也是一個數據和產品驅動的過程。我們希望把這個平台真正賦能給運營,讓每個運營人員都成為一個高效的機器人訓練師。希望對話機器人配合產品完成整個產品的閉環。

在這個過程中還有一些比較有意思的事情,比如說數據的來源。剛開始做這個事情的時候,沒有任何的數據,我們通過規則定向挖掘一些數據,通過遷移學習得到一些預處理的特徵,通過人工糾正和模型反覆的迭代,讓這個數據訓練樣本的質量變得越來越高。

然後迭代出一些話術的確認流程,在這個過程中要權衡人和人之間主觀意識。產品和演算法的平衡,比如用戶剛來到對話框,我們會給他個性化的問題列表推薦,給用戶回答完以後給他推薦下一個問題,但是這種產品上的方式其實是對我們積累語料有傷害的,抑制用戶主動表達他們問題的意願。

比如業務和技術之間的平衡,大家平時用 APP 還有 Web 的時候覺得界面體驗非常炫。但是把這種界面封裝成特殊的卡片消息塞進對話框,實際上是與對話形式的交互相衝突的。比如說如果以後我們希望做成語音的交互,這些所有的卡片都沒有用了。

這是從技術的角度需要注意的地方,任何演算法的選擇只滿足於當前的需求,我們要堅持不懈的主動做模型的 ab 測試,隨著業務的發展意圖會呈現一個爆炸的趨勢,如何去權衡意圖的粒度,也就是服務的粒度,以及可維護性,也是比較有挑戰的。

怎麼去解決這些挑戰?我覺得就是一句話,永遠保持主動,我們會主動的提前做一些挑戰自己,挑戰自己現有系統的事情。

接下來給大家展示現有的一些場景,第一個是剛才提到的用戶剛開始進入問題列表的個性化問題推薦,第二個是剛才一直提到的在線化的例子,就是服務直達,我們希望用戶在表達他訴求以後把他的需求閉環的解決在這個對話框裡面。

第三個是剛才提到的智能導購,或者叫精準營銷,比如用戶主動表達我想買 30 萬的車,我們在對話中給他精準的推薦,用戶會表達看車地點太遠了,我們會挖掘他潛在的需求,後面為他做一個更準確的推薦。

這是一個例子,我們會引導他輸入城市,品牌等等信息,然後最終給他一個個性化的推薦結果。

在目前為止經過一年半的時間,對話機器人平台從 0 到 1 已經是比較完善的平台,有效支持公司 20 多款機器人,甚至可以實現一鍵上新一個機器人,現在已經有包括瓜子二手車的客服,毛豆新車的客服,還有企業內部等等各種各樣的對話機器人。

最後給大家簡單介紹一下,我們從三個維度,人貨場,人是用戶畫像,千人千面,還有分單調度,我們有大量的線下人員,哪些車分給哪一個評估師,或者哪一個客戶分給哪一個銷售都需要有一個智能調度的演算法在裡面。

貨主要做的車況智能評估,評估師戴上智能眼鏡就可以對車況進行智能的分析,包括汽車畫像,還有結合大數據和人工智慧的智能定價;然後是智能供應鏈,比如我們全國那麼多倉庫,每個倉庫下個月到底應該進多少輛車,都需要提前做出有效的預測。

最後場這一塊,主要是車輛的智能管理,資產的智能管理,以及智能的監控分析。我們會做一些人流監測和人臉識別類似的事情。

謝謝大家!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

看一眼就知手感,北大學神聯手朱俊彥讓機器人「想像」觸感
深度學習來得太晚也太猛,對話2018年度圖靈獎三位「大佬」

TAG:機器之心 |