當前位置:
首頁 > 科技 > 三角獸:依靠語義理解,這個鎚子 BigBang 的幕後功臣搞定了 8000 萬融資 | 創業

三角獸:依靠語義理解,這個鎚子 BigBang 的幕後功臣搞定了 8000 萬融資 | 創業

三角獸:依靠語義理解,這個鎚子 BigBang 的幕後功臣搞定了 8000 萬融資 | 創業

2016 年 10 月,鎚子手機新品發布會上,羅永浩發布了一個名叫 BigBang(大爆炸)的手機功能,BigBang 會將你按住的那一段落文字全部「炸」開,按照語義智能拆分成易於選取的獨立的字和詞,從而幫助用戶更方便地對文字進行選擇複製。雖然 BigBang 是當年鎚子手機發布會上的最大亮點之一,但被很多人忽略的是,該技術的提供方卻是一家當時成立幾個月的初創公司——三角獸。

動點科技了解到,成立於 2016 年 2 月的三角獸主要為 To B 類合作方提供聊天、多輪對話和中控決策服務,一年多的時間,三角獸除了跟鎚子手機的合作以外,還包攬了新浪、中國移動、廣發證券、微軟、百度、小米、騰訊、新世界集團、恒生電子、Rokid、Jibo、光明網等在內的合作夥伴。而且,三角獸目前已經完成三輪融資,分別是 2016 年 4 月洪泰基金和天善資本的 1000 萬人民幣天使投資;2016 年 9 月君聯資本和海爾賽富的 2000 萬人民幣投資;以及 2017 年 1 月東方網力旗下博雍基金、恒生電子和索道資本的 5000 萬人民幣投資。

三角獸:依靠語義理解,這個鎚子 BigBang 的幕後功臣搞定了 8000 萬融資 | 創業

一年多的時間三筆融資,三角獸的能量來自哪?


難度大、效果差,語義理解反而是初創企業的機會

正如我們之前的 報道中所提及的,隨著蘋果推出 Siri 語音助手、亞馬遜推出內置 Alexa 語音助手的 Echo 智能音箱,語音智能已經成為行業發展的必然趨勢,目前僅在國內就形成了一大批以 BAT、科大訊飛、思必馳、雲知聲等為代表的語音技術公司,而三角獸與這些企業最大的不同則是其更加關注於語義理解。

「不管是語音識別還是語義理解,語音相關技術中的各個細節都面臨著巨大的挑戰。」三角獸首席科學家王寶勛告訴動點科技,「在語音識別領域,其面臨著遠場識別、噪音消除等問題;而在語義理解方面,如何讓計算機理解人們多種多樣的說話方式也是一個極大的挑戰。不過相比之下,語音識別的進展要遠遠大於語義識別的進展,語義識別由於涉及到自然語言理解,直到最近幾年才逐漸熱起來。」

王寶勛認為,語音識別技術在近幾年確實取得了突破性的進展,而接下來,語義識別將成為新的剛需點。

「基於深度學習的語音識別和圖像識別是從基本的信號輸入向上構建模型,其特徵提取過程與任務直接對應,所以模型比較容易達到預期的效果,然而,語義理解往往需要對輸入的文本進行語義表示,然後再基於這種表示構建模型,因此在特徵表達層面就比前兩者更難。」通過與圖像識別技術對比,王寶勛還將語義理解定義為人工智慧領域最難解決的問題。

「諸如翻譯,我們看見一段英文,其實首先要將這段引文轉換成腦海中一種與文字無關的概念,然後通過這個概念將英文翻譯成中文。而這裡的那個與文字無關的概念便是語義。語義在人腦中的存在形式尚不明確,雖客觀存在,但人類至今仍然無法準確定義或者量化它,這也使得語義理解變得最難。」


以機器學習為手段,提供對話式交互解決方案

據了解,三角獸目前在任務型對話與閑聊型對話方面都有所涉足。

關於任務型對話,王寶勛表示其首先會準確實現相關任務,其次三角獸 會將任務型對話中的本質問題提取出來,在此基礎之上可以實現領域的迅速遷移。「比如將購物類的任務型對話迅速改成購票類的任務型對話。」王寶勛舉例解釋。

而對於閑聊型對話,王寶勛認為這在人工智慧領域異常重要,「如果設備在完成任務型對話的基礎之上,還能跟用戶閑聊,這便能拉近人與機器之間的感情距離,那這真就是人工智慧,如果不能,那就僅僅只是機器。」

據了解,構建人機對話系統主要有 3 種方法:

  • 一是純機器的方法,即利用機器學習演算法為核心,以大數據為驅動,讓機器在海量數據中自主學習如何對話;
  • 二是純人工的方法,即利用人力為常用問題匹配答案;
  • 三是半人工半機器的方法。

王寶勛表示,任何公司在語義理解技術方面都有人工的成分,但關鍵得看其中人工與機器學習的佔比。而三角獸便是一家以機器學習佔主導的語義理解企業。

王寶勛表示三角獸之所以選擇機器學習的方法,主要是因為其可以使得訓練出的對話系統具有更強的可擴展性。「人工或許可以匹配 1 萬組對話,但 10 萬組如何匹配?更何況人與人之間的對話模式幾乎是無窮無盡的。」

三角獸:依靠語義理解,這個鎚子 BigBang 的幕後功臣搞定了 8000 萬融資 | 創業

另據介紹,三角獸目前除了採用被譽為「黑盒」的深度學習演算法外,也在研究更多「白盒」演算法,用一問一答的對話訓練機器學習總結其中規律性的東西。

而大數據方面,王寶勛表示目前三角獸的對話數據主要來自於網上的公開數據,比如網路論壇等。「雖然這些數據都是公開的,任何人都能爬蟲得到,但這種對話跟真實的人與人之間的對話還是不一樣的,其中很大一部分數據都是沒有用的,如果直接用於機器學習那絕對就是一場災難,所以後期對數據的梳理去噪也非常關鍵。」數據顯示,目前三角獸擁有 500 億組人與人之間的對話數據(未標記生語料),從這些語料中清洗出 150 億,系統學習了大概 70 億。

功夫不負有心人,三角獸的努力也使得其產品在競爭中得以脫穎而出,「比如我們與小米電視合作,可以幫助他們很好地查詢一些很複雜的問題 ,比如我們可以將『半月傳』這是個錯誤詞,正確識別成《羋月傳》等。我們可以讓人機對話很舒服很隨意,這是現在其他人工智慧公司很難做到的。」


關於落地,對智能音箱持保留態度

在具體的場景上,三角獸的技術主要落地於以下三方面:

  1. 企業服務

    ,包括互聯網企業傳統企業、媒體、金融、客服等領域。主要解決交互方式僵化和有效信息利用不足等問題,為企業入口注入生命,加入 bot 交互能力和主動學習反饋的能力。比如為新浪打造私信聊天與新聞服務的新浪機器人等。
  2. IoT 智能終端

    ,包括智能家居、智能車載、智能手機、智能機器人和音箱等。相當於為智能硬體裝上大腦,讓機器聽懂人話並作出回應,滿足用戶直接和潛在的需求,提供陪伴、信息和服務。比如為 Rokid 音箱與小米電視提供技術支持等。
  3. 泛娛樂

    ,例如模仿人物性格,賦予遊戲、動漫角色、虛擬偶像「生命」,以及明星偶像的機器「分身」,每個粉絲都能可以隨時與喜歡的角色互動。三角獸為 JIBO 機器人做的中文系統,就是打造了一個年輕的、邪萌的男性風格。

「人工智慧語義領域一下子就火起來,其中絕對是有泡沫的。」王寶勛認為過熱的宣傳與資本的追逐會導致人們產生過高的期望,而一旦這個期望沒有實現,行業就可能迅速冷落下來,「人工智慧發展的前幾次熱潮便是這樣冷落下來的。」

而至於如今技術進步是否已經達到了人們的期望?王寶勛表示,「作為研究者,我們對行業發展始終是報有希望的, 亞馬遜 Echo做得的確已經非常有味道了。 但實際上離成為人的私人助理的目標存在著很大的距離,它還有很多缺陷,離人們期望的強人工智慧有差距,但我們應該容忍這種階段性的不成熟,而且現有技術是可以落地應用的,從我們和合作方的諸多產品也可以看出來,我們也期待行業逐漸成熟起來。」

至於當前大火的 智能音箱是否能夠持續火下去,王寶勛則持保留態度。「現在說『換一首音樂』等控制功能已經做的足夠好了,但對於諸如『換一首減壓的音樂』之類的可能做的還不夠好。音箱在中國並不是家庭中的必備,相反,在中國,大家更需要的是電視,所以智能音箱想要在中國普及,用戶的教育也是一個很大的問題。」

「所以對於智能音箱在中國的前景,還需要看看今明兩年音箱行業的具體發展情況,除了音箱,手機,智能家居如電視,都是值得期待的智能入口,我們也針對這些做了解決方案,讓硬體真正智能起來。」王寶勛表示。

值得一提的是,人才方面的優勢也是三角獸做語義理解的底氣所在。

據了解,三角獸的核心團隊主要由 百度度秘、微軟小冰等的成員組成,三角獸創始人兼 CTO 亓超在自然語言理解領域紮根長達十幾年時間,他曾在第一代微軟小冰中負責核心演算法、也是百度度秘開放域聊天負責人、聊天及人機輔助負責人;CEO 王卓然同樣來自百度度秘團隊,曾是百度度秘中控決策負責人;而王寶勛曾任微軟小冰機器學習科學家。目前三角獸約有員工九十多人,而且大部分為具有相關工作經驗的演算法工程師。

題圖來自 123RF

本文 三角獸:依靠語義理解,這個鎚子 BigBang 的幕後功臣搞定了 8000 萬融資 | 創業來自動點科技.

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 動點科技 的精彩文章:

雷蛇首款智能手機,11 月 1 日你應該就能看到了
ofo 小黃車聯合中國信息通信研究院,打造全球首個 NB-IoT 共享單車標準
亞馬遜開放未成年人網購,不過下單需要父母審批
貨車幫 ETC 日充值金額破 1 億 ,白條累計貸款達 20 億
全球通信和空間信息解決方案供應商 MDA 公司收購 DigitalGlobe,合併後的新公司將推出全新的太空品牌、技術與業務

TAG:動點科技 |