業界 | 世界人工智慧大會背後的智能助理——樂言科技的技術思路

科技 10-03

機器之心報道

樂言科技

樂言科技是一家專註於認知智能領域，以技術驅動為核心的人工智慧公司。基於自然語言處理、知識圖譜、智能推薦等核心 AI 平台技術的應用，從認知計算出發去賦能各個行業，提供整體解決方案。目前公司已經成功將核心技術應用於電商行業，並佔領了相當的市場，金融、醫療和政務等各類垂直領域也有實際的應用初步落地，並展現加速趨勢。

隨著現代服務業智能化程度越來越高，用科技去賦能一部分人工，讓人類去做更有創造力的事，這既是順應市場要求，也是承擔時代使命。「躍升」是一個涵蓋時間、空間的詞：「躍」代表快速高效，在時間角度加速推進產業變革，這離不開深厚夯實的技術積澱；「升」則意味著解放知識密集型勞動，在空間角度最大限度拓展人類能力，這需要打破傳統方式。「樂言有著這樣的願景--躍升人類知識工作。這話聽起來很簡單，真正做起來卻非常艱難。把勞動力從簡單重複的工作中解放出來，是對社會有價值的一件事。」公司創始人及 CEO 沈李斌如是說。

在選擇新的應用領域時，樂言科技會判斷市場空間是有多大，可複製性有多強。在商業落地和遷移的過程中，每個行業的需求不一樣，產品形態也因此不同，而公司目前最核心的競爭優勢是已經形成了自己一套獨立的、成熟的技術和產品思路。以樂言賦能場景為例：電商客服的客戶以中小型的商家為主，且知識庫積累相對完備，產品服務需要更為人性化；政務智能服務系統知識庫的搭建和維護則尤為關鍵，既要基於內部文件建立，又要根據政策的更新及時維護，產品服務需要更為精準可靠。

值得一提的是，在剛剛結束的 2018 世界人工智慧大會上，樂言科技還提供了「智能秘書」，在大會的官方公眾號植入了聊天機器人，用戶可以詢問關於大會的各類問題，以獲取更便捷更精準的諮詢服務。

樂言科技利用自己成熟的技術體系和技術思維，加上強大的工程實力，完成了這項艱巨的任務。

1）開發時間短

首先，本次開發時間比較短，從 8 月中旬接到任務，直到大會開始前一周才收到完整的大會信息。樂言科技的做法是從已有的大會（烏鎮互聯網大會、其他人工智慧大會）信息出發，搭建了一個原型系統，待本次 AI 大會的具體信息出來後再快速遷移，這主要知識庫的遷移，這涉及知識圖譜層面和語言理解層面。公司使用了過去包括電商在內的開放域的各種各樣的數據，搭建了語義相似度模型、預訓練模型和通用意圖分類模型。

2）會務信息變化頻繁

針對這個問題，樂言科技在演算法層面從已有大會的會務信息出發，搭建原型系統，將數據和代碼不斷的解耦，使得當數據有更新的情況下儘可能不用修改代碼，從而快速響應數據的頻繁修改。樂言科技從兩個級別實現數據和代碼的解耦，實現熱插拔。

知識圖譜級別，大會知識圖譜中的元素可像 plug-in 一樣快速更新（CRUD）。新的實體採用動態的方式更新；新的 schema 採用離線的方式更新。在語義理解級別，大會知識圖譜的不同部分對應的語義理解元素也是熱插拔的，包括訓練數據、問法句式、意圖識別、實體識別等。此外，在工程層面，公司搭建了高效的 pipeline，對問答系統的問題收集、數據更新、模型更新等各部件進行快速迭代。

3) 零數據、冷啟動

面對缺乏相應大會的 schema 結構和 query log 等，樂言科技需要去解決冷啟動、零數據的問題，其採取了以下方法。

首先對知識圖譜進行半自動化構建，包括大會信息自動爬取，機器和人工相結合去抽取關鍵知識點，並對語義理解訓練數據進行增強，使用自動和人工的這兩方面去做一些數據增強——基於知識圖譜反向生成一些問句，然後再人工擴展或擴寫，這兩方面是交替迭代並互相增強。此外，還會從對話數據中直接學習，既然沒有現成可用的對話數據，那就找到一些希望支持的對話模式，比如說「這次大會一共來了多少位諾貝爾獎獲得者？」然後再去創造這些數據，再用剛剛數據增強的方法來進行增強。之後去做可解釋性比較強的特徵工程。

雖然現在比較流行 end2end，但樂言科技為了增強可解釋性以及應對數據稀疏的問題，就反其道而行之——把黑盒問題白盒化，然後把對話過程拆解為更細膩的模塊，然後每個模塊可以單獨建模，測試評估。

樂言完美的應對了以上三項挑戰，並體現出了自己四大技術亮點：

1）混合策略引擎，讓會議助手更智能

樂言使用了 KBQA（基於知識圖譜的 QA），為支持結構化數據的高精準和多角度查詢，從時態推理、上下位推理等方面深度設計知識圖譜，結合從問句中所含的 KB 的元素中抽象出拓撲結構，以及問題類型，答案類型，用戶意圖等信息，進行問題模板的匹配，從而支持各種複雜的查詢。IRQA（基於信息檢索的 QA）為了支持非結構化數據的查詢，公司採用了基於語義的匹配演算法，在模板和知識庫兩方面進行了增強。

之後，對 KBQA 和 IRQA 進行了融合，KBQA 的職責是負責 schema 覆蓋的部分，面向高準確率；IRQA 的職責是負責 schema 未能覆蓋的部分，面向高召回率，回答 KBQA 未能回答的問題。

此外，還加入了 FAQ，以形成三位一體的綜合策略引擎。有些問題可能並不適合 KBQA，但是它又不是 FAQ，更像是一種模板。比如詢問某人的報告在哪裡？在語義理解時，就可以把裡面的一些實體和概念抽出來，這些都可以去做替換，同時答案裡面的東西也可以做替換。所以說會存在三種問答類型，但這三種類型 QA 對用戶來說是感知不到。所有的優化都是針對整體 QA 系統，可能前面一個問題是 FAQ，後一句就變成一個 KBQA，再後面就跳到模板的。

2）多輪對話管理，讓會議助手更擬人

為了讓大會秘書的對話更自然，就需要進行多輪規劃設計。在進行語義理解建模時，樂言從意圖理解分類、問題類型分類、答案類型分類和多輪判定分類這四個角度去考慮。

問題類型是指用戶問的是觀點類的問題還是事實性的問題，是「yes or no」的問題還是「why」的問題，這是從問句本身的一些語言特徵和問法特徵去分析；意圖是說用戶想要什麼；答案類型是他想答案到底是什麼方面的，比如說「多少」或者「數目」。答案類型是指用戶所需答案的實體，比如是「人」、「地點」、「報告」；多輪判定就是說當前這個問題是否接續了上一輪。

使用當前流行的複雜的深度學習模型很難在很少的數據上達到較好的效果，此外，考慮到複雜深度學習模型在可解釋性和可干預性方面的欠缺，樂言科技使用了比較簡單的淺層模型來對上述四個分類問題進行建模，四個分類問題可統一抽象為一個函數：S(t+1) = f(S(t), Q)，其中 S(t) 是第 t 輪的狀態向量，每個分量代表其中一個分類問題；Q 是當前 query；f 則是一個可學習的正則化淺層線性模型。

此外，在會議助手中還引入了一個主動詢問入口，遇到沒法回答的問題時，會議助手會主動推薦用戶其他問題。

最後在工程實現上還有比較關鍵的一點——快速響應的 pipeline。當出現多輪判定或者類型分類的錯誤時，可以通過快速 update 數據來快速 update 模型；如果用戶問到一個知識圖譜里沒有的概念或者關係時，會議助手能夠快速感知到並進入到修複流程。

3）知識卡片推送，讓會議助手更多彩

會議助手能對用戶問題中的實體在知識圖譜進行推理，推薦實體更詳細的信息，以及與該實體相關的其他實體信息，讓用戶對該實體有立體化的了解，更好的符合了人的認知過程。同時，會議助手還會對大會熱點問題和參會常見問題進行推送，讓用戶對大會有更全面的了解，體現出問答的多樣性。

4）在線持續學習，讓會議助手不斷自我「成長」

樂言為會議助手構建了持續學習機制，使其能對線上數據、潛在 Bad cases、新實體等進行持續挖掘，並將結果反饋給系統各個模塊：挖掘出的熱點問題用於更新問題推送權重；挖掘出的 Bad cases 重新標註後更新模型；挖掘出的新實體更新知識圖譜。