當前位置:
首頁 > 新聞 > 解鎖三角獸,語義分析如何成就爆款產品?

解鎖三角獸,語義分析如何成就爆款產品?

機器之心原創

參與:高琳、微胖

2017 年 3 月 21 日,小米電視系列新品——小米 4A 發布會上,智能語音搜索功能成為最大亮點。比如用戶搜索時說「半月傳」,系統也可以明白用戶的意圖,輸出「羋月傳」的結果。還有「神探夏洛特」也可以自動識別成「神探夏洛克」。

解鎖三角獸,語義分析如何成就爆款產品?

4A 被小米稱為首台人工智慧語音電視,這背後集聚了三角獸科技的模糊語義理解和問答技術,而這家公司也曾因為向鎚子科技 Big Bang 語義識別功能提供底層技術而備受關注。

三角獸致力於利用自然語言處理(下簡稱 NLP)、深度學習技術,打造中文聊天對話系統。對話系統是人工智慧的一個子領域,實現人與機器自然交流。「這三四年來,我們發現越來越可以接近這個目標。現在我們依靠數據,希望用機器去學習人和人是怎麼對話。」三角獸聯合創始人兼 CTO 亓超說。

2004 年,還是遼寧科技大學碩士研究生的亓超初次接觸自然語言處理。傳統對話系統主要依據預先設計好的腳本與用戶交流,比如,Facebook Assist 需要輸入編號來執行動作。深度學習網路的出現改變了很多技術領域,包括推進了自然語言處理領域快速向前發展。正如 Sheffield 大學教授、亞馬遜人工智慧團隊成員 Neil Lawrence 所說,「NLP 有點像是深度學習機器車燈前的一隻兔子,等著被壓扁。」使用了深度學習網路的對話系統越來越聰明。

解鎖三角獸,語義分析如何成就爆款產品?

三角獸聯合創始人兼 CTO 亓超

伴隨著技術的不斷迭代,不少大公司在推進基於 NLP 的應用方面開始有所突破,亓超也在該領域紮根長達十幾年時間。他曾在第一代微軟小冰中負責核心演算法、也是百度度秘開放域聊天負責人、聊天及人機輔助負責人。他始終認為,「儘管到現在為止,(NLP)也沒有完美解決它面臨的問題,但不妨礙所有東西都用起來,它永遠不可能達到完美,但把技術應用到生活中,這是非常重要的。」

認定行業前景的亓超,找到同在百度「度秘」項目的王卓然,兩人一拍即合,王卓然說,「這個方向在這個時間點上是一個大有可為的事情。」王卓然還找來高中同學馬宇馳任 COO,後者擅長融資、運營和市場,與兩位技術搭檔形成互補。2016 年 2 月,三角獸正式成立,兩個月後,獲得洪泰基金和天善資本 1000 萬人民幣的天使輪投資。今年 1 月完成 A 輪融資,融資額 5000 萬人民幣,由博雍基金領投,恒生電子和索道資本跟投。在這之前,還完成由君聯資本和賽富基金 2000 萬人民幣的 Pre-A 輪投資。

解鎖三角獸,語義分析如何成就爆款產品?

三角獸科技創始團隊成員

三角獸的確趕上好時候。公司天使輪融資前後,全球焦點都還停留在 AlphaGo 對戰李世石,人機對話的概念一時間引來爆髮式關注,直到今天也仍然是人工智慧領域的追逐熱點。學術機構、科技巨頭和創業公司的研究人員都在努力開發能就更複雜的任務進行更詳盡對話的「機器人」,無論是做信息檢索、房貸諮詢還是安排旅行。亞馬遜甚至為能開發出進行「連貫生動地」談話 20 分鐘的機器人懸賞一百萬美元。「理解別人說什麼、寫什麼,這個潛在的市場非常巨大,甚至比計算機視覺處理還大。我認為,這是我們如何與計算機交互的方式,未來它會無處不在。」深度學習領域著名學者 Yoshua Bengio 也曾有這樣的判斷。

「整個自然語言處理回到核心,就是解決歧義的問題。」亓超告訴機器之能。現在,問答系統技術比較成熟,通常利用知識庫、web 和社會關係網路的多種智能體來回答問題。不過,要為用戶解決實際問題,系統需要檢測到用戶意圖並決定接下來的動作。只有考慮上下文,把整個對話都考慮進去,系統才能準確提供信息和服務。接下來,三角獸還將與小米智能硬體、百度度秘以及富士康等在開放域聊天和多輪對話等方面展開合作,通過對話技術更準備地匹配用戶更加個性化的需求。據亓超透露,公司還有十二個項目同時進行。

「由於之前經歷並打磨出市面上兩款較為成熟的產品,小冰和度秘在對人機互動系統的理解上相對較深,因此也有很多應用與基礎技術的積累。」亓超表示,任務驅動多輪對話系統是三角獸技術優勢之一,除此之外,公司的技術優勢還體現在開放域聊天和中控系統。

對話系統研究瓶頸之一是缺乏數據,同時也需要採用模擬形式來訓練模型。小冰和度秘使用的大部分數據都是網路公開可見的數據,比如,BBS 。三角獸最初的數據來源於微博、天涯等一些開放性社交網站,抓取大量數據後用演算法進行清洗。新型自然語言理解平台的興起有助於真實用戶數據收集,並訓練只能在現實環境中學習的基本技能。「我們主打方向是檢索式聊天系統和 Sequence To Sequnence、端到端的生成式聊天系統。底層技術方面,與小冰、度秘差別不太多,不同之處在於機器學習的語料。」亓超補充道。

具備難以複製的專有數據,初創人工智慧公司才會擁有防禦力。據了解,目前三角獸擁有 500 億組人與人之間的對話數據(未標記生語料),從這些語料中清洗出 150 億,系統學習了大概 70 億。公司也在數據處理上建立了一套數據處理系統,能很快消化新的語料和數據。「數據是我們的核心資源,數據抓取和建設會是長期重點。」亓超說。

第三個技術優勢是中控系統,可以將它理解為「管家」,亓超說。三角獸創始人兼 CEO 王卓然曾是百度度秘中控策略技術負責人,在智能交互、機器學習、垂直領域對話系統方面有十年經驗,曾領導建立東芝第一代對話系統。

事實上,從被動響應過渡為主動推薦,創造更新商業模式和更大商業價值離不開中控系統。調度系統可以根據用戶意圖(閑聊還是問答)調用相應的 Bot 執行相應的任務,技術則涉及到對用戶意圖的理解,比如對話的管理、領域知識、對話圖譜等。

當你用拇指大面積按壓鎚子手機屏幕中的文字時,「Big Bang」會將你按住的那一段落文字全部「炸」開,按照語義智能拆分成易於選取的獨立的字和詞,由你隨心所欲地選擇,並可直接搜索、分享和複製。手指粗大、動作笨拙的手機用戶不再苦於屏幕上處理文字的尷尬。

解鎖三角獸,語義分析如何成就爆款產品?

「Big Bang」操作界面

這個讓三角獸大紅的手機功能,是將對話中的一個子模塊,即分詞以及切斷分割技術,提取出來應用到一個場景中。「我們受啟發和鼓舞很大,我們會進一步將對話系統中成熟模塊和技術拆解出來,與手機系統綁定,實現更多更好的手機體驗,同時也將真實場景下的技術迭代帶來的收益反饋到對話系統里。」亓超說。

對話系統的訓練需要大量的語料進行數據分析。亓超分析稱,如果語義技術發展要依賴語音技術成熟,由語音轉為文本再去進行數據標註,到時再發展就會來不及。三角獸的解決方法是,尋找一些實際場景,在一些盡量通用或者適配的場景下,主動把子模塊訓練好,增強整個對話系統性能。

「對話系統是一個複雜的系統,融合了 NLP 各項技術。在這種情況下,三角獸也會拆解出一些模塊,不作為整體的一個部分,而是作為一個子模塊拆出來,放在合適場景。」亓超告訴機器之能,「就像咱們要煉就強壯的身體,如果需要非常強的胳膊,就鍛煉胳膊;要鍛煉腹肌,就專門按照某些項目去煉腹肌,各個模塊強大以後,整體才是一個比較強大的系統。」

不過,三角獸成立之初,大家也曾迷惑過。亓超告訴機器之能,「到底採取什麼樣的模式,2B、2C,還是做硬體或者 APP,這些都會討論到。」最後大家認為,目前 NLP 領域並沒有成熟到一定程度,「AI 這種,實打實地說,沒有成熟到我可以把它捏成一個任意形狀的產品。」作為初創公司,需要取捨。

目前,三角獸向 B 端公司推出 SDK 介面與 API 介面,通過合作探索的方式驗證不同使用場景。在對方的產品或平台上去提供語義理解的能力,為它們的平台和技術上做出貢獻,雙方合力把一定場景中需要用到自然語言處理部分的產品打磨到更完美。

CB Insights 數據顯示,近期,人工智慧初創公司的數量增加了三千萬,但是 90% 以上都是針對企業用戶。這類創業公司比消費者型創業公司數量多了將近 10 倍。分析指出,專註於企業對象有三個主要優勢:退出時,瞄準的價值創造池大了 40%;更廣泛的價值分布意味著更有可能創造出一個十億美元級別的企業型公司,而不是消費者型公司;企業併購創造的更大價值意味著在 IPO 前的大型併購退出時有更大的選擇餘地。

「AI 很像一個果樹林,不少果子有點泛紅或者泛黃但還沒有成熟,如果一上來就直接去摘這個果子,你可以認為是一個 2C 模式,看似很容易吃到,但果子是生的,這樣團隊或者公司很難走下去。不如大家合作,催熟果子。」亓超說。

做出一款好的產品,除了技術知識,還要重視場景。只有技術與具體應用場景比如車載、智能家居、可穿設備結合在一起,才能得到穩定的產品。目前,三角獸探索的垂直場景主要集中在三個領域:企業服務、物聯網和泛娛樂。「哪些果樹本身接收陽光好,離水源近,那麼催熟這顆果樹的成本和投入就是可接受的。」亓超告訴機器之能。各個領域中人工智慧發展的實際情況,比如現有數據情況等也是三角獸的取捨標準。

語音界面可以克服智能家居領域面臨的碎片化問題,成為各種智能家居硬體的標準集成器。三角獸為智能硬體包括手機、電視、車載,甚至一些穿戴設備——像耳機、音箱、智能家居等提供語義解析的技術服務。目前,公司重要硬體合作廠商有小米電視、鎚子手機、若琪機器人,後續還會與騰訊與華為有相關合作。

「泛娛樂,這一塊兒想像空間很大。」亓超說。重點打造 IP 形象,包括明星,直播主播有機器人幫助他們自動對話,可以獲取粉絲忠誠度。亓超認為,娛樂和遊戲行業的市場空間和大家消費能力越來越強了,有不錯的應用場景。

在企業服務這塊主要市場上,金融、媒體以及電商是公司的三個主打方向。數據分析顯示,作為降低企業人力成本的垂直細分市場,智能客服對應的市場是千億規模。在這一領域,三角獸已經與恒生電子、光明網、騰訊、新東方、新世界集團等公司達成合作。

雖然目前專註於這三大領域,但是,行業和領域的跨度比較大。但亓超認為,這些都是必須的。「大家需要在不同場景去做嘗試,AI 怎麼落地,這種情況是不能依靠別人的經驗,要靠自己去趟路。最終縮減成重要的幾個方向去做。」亓超表示,「三角獸所希望的,是將現階段的技術完全暴露出來,使之得到一些反饋,從而將技術進一步優化。」

除了時間,人才也是我們的壁壘和優勢,亓超說。

五月,三角獸搬進了新辦公室。發展僅一年多的三角獸團隊,目前約五十多人,大部分為具有相關工作經驗的演算法工程師,核心團隊的部分人也是亓超的老部下。「基本上,這些工程師都是通過一度、二度、三度的關係進來的,社招的很少。」亓超告訴機器之能。

一家創業公司,如果越早努力構建起混合多項強大技能(比如商業、數據、科學)的團隊,市場防禦能力就越強。馬宇馳是連續創業者,曾在 Viacom、奧美公關、Amway China 負責廣告、公關和品牌,在融資、運營和市場方面有多年積累。主要負責戰略合作的合伙人何晉,曾任靈境 VR 渠道總監、美團和百度外賣全國大客戶部項目負責人。公司會將新一輪融資用於團隊擴張、市場開拓和公關方面,預計今年將團隊規模擴至 60 人。亓超說,「要想形成競爭壁壘,壁壘不能只有一個,城牆特別牢固,但是有一個門是敞著的,就形不成壁壘,只有周邊所有的東西聯合在一起,才能形成壁壘。」

談及未來,亓超說,區別於百度和微軟的商業方向,三角獸希望可以做更多上下文、長時記憶、性格定製、情緒識別等更上一層樓的技術實現。

2015 年 6 月,巴黎 Facebook 人工智慧實驗室的開幕活動上,該實驗室主任 Yann LeCun 說:「深度學習的下一大步是自然語言理解,不只是給機器理解單個詞的能力,而是理解整個句子、段落的能力。」不過,早在 2014 年,多倫多大學計算機系教授 Geoffrey Hinton 也談到:「我認為接下來 5 年,最令人激動的領域將會是理解文本和視頻。如果 5 年內我們還沒有在看過 YouTube 視頻後能說出發生了什麼的東西,我會感到很失望。」

而三角獸仍走在打造這條「巴別魚」的路上。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

從成立到聲名鵲起,百度收購的 KITT.AI 與 Amazon 有著怎樣的密切關係
百度Create 2017:AI核心技術全面開放
讓照片走兩步:骨骼框架輔助的人物動作生成模型

TAG:機器之心 |

您可能感興趣

孩子識字困難別太擔心,「語義啟動效應」很重要,您了解過嗎?
如何妙筆勾檀妝:像素級語義理解
一文了解什麼是語義分割及常用的語義分割方法有哪些
入門|一文了解什麼是語義分割及常用的語義分割方法有哪些
細說語義分割,不只是畫個邊框那麼簡單
入門 | 一文了解什麼是語義分割及常用的語義分割方法有哪些
的四條標準語義
語義圖形!讓設計作品「能說會道」
圖像語義分割的那些事
語義分析或成視頻監控智能分析突破口
魚與熊掌可以兼得:何愷明等人一統語義分割與實例分割
谷歌等祭出圖像語義理解分割神器,PS再也不用專業設計師!
蘋果發文:全局語義信息能否改進神經語言模型?
如何在看不見的駕駛場景域進行強有力的語義分割?
人工智慧要「撞牆」?無法理解語義將是巨大阻礙
告別「複製」與「粘貼」:語義理解技術將如何改變我們的信息處理流和交互習慣
告別複製粘貼:語義理解技術將如何改變我們的信息處理和交互習慣
語義分析介紹及跨語言信息在語義分析中的應用
鄒炎炎:語義分析介紹及跨語言信息在語義分析中的應用
語義鴻溝、異構鴻溝、數據缺失,多模態技術如何跨過這些坎?