當前位置:
首頁 > 科技 > 深度好奇:深挖語義理解,助力打造機器版「福爾摩斯」

深度好奇:深挖語義理解,助力打造機器版「福爾摩斯」

動點科技 | ID:technode

人與人之間說不同語言,尚且會出現溝通障礙,當人類和機器交互時,這種障礙則會變成巨大的鴻溝。毫無疑問,人工智慧是時代發展不可逆的技術趨勢,而作為這個時代的核心參與者——人與機器,如何更好地交互始終是待解問題。其中,最關鍵的是讓機器能夠理解人類的語言。

市面上已經出現了大量的自然語言處理(NLP)企業,致力於人機之間的語言交互問題。不過,人工智慧企業深度好奇則將研發的重心細化到 NLP 領域的核心——自然語言理解(NLU),以挖掘深度語義理解的商業價值。NLU 旨在把人類語言翻譯成機器可以 「讀懂」 和 「使用」 的形式,即把非結構化的數據變成結構化的、機器容易操作的東西。當文本變成機器可以讀懂的結構化信息時,同一流程上的很多操作就可以讓機器來做,或者讓機器之間進行某種形式的交互。

與 NLP 相比,NLU 更加深度垂直,就像 「深度好奇」 這個名字一樣神秘。該公司的創始人兼 CTO 呂正東,曾任職於微軟亞洲研究院、華為諾亞方舟實驗室,長期從事機器學習和自然語言處理的研究。作為自然語言處理領域的專家,他創業的初衷是做出具有嶄新技術高度的語言智能產品。

不過,由於公司切入點比較深入,呂正東笑稱很多人不理解他們在幹什麼。「我們希望形成一個完整的行業語義圖譜,一方面,它能夠和其他結構化信息做無縫連接,另一方面,它可以直接輔助行業專家的決策。」 呂正東介紹到,公司的願景是探索理解人類語言的演算法,並且創造服務於行業的人工智慧。

據他介紹,深度好奇最開始涉及的領域是法律,現在主要在公安和金融領域中做應用,代表性的例如智能審訊類產品和智能風控產品。以公安相關場景為例,呂正東介紹到,深度好奇有兩大技術框架,一是做複雜文本的解析,即將複雜的文本轉化成語義圖譜;二是基於語義圖譜進行推理,包括圖譜之間的比對、融合、預測、分析等。

案件里的信息主要體現為文本形式的非結構化數據,深度好奇首先需要對文本數據進行結構化,從而串聯整個案件已知和待確認的信息,形成一個完整的語義圖譜,這即是語義解析平台的功能。此外,深度好奇還有一個推理平台,可以用來處理語義圖譜與其他信息的融合、比對以及在此之上的預測和行動建議等。需要說明的是,在偵破過程中的很多信息是模糊和待確認的,推理平台會通過多信息源的比對以及和人的交互,來逐漸完成對信息的豐富和清晰化。隨著事實性信息的不斷完善,該圖譜會變成一個越來越完整和清晰的對案情信息的綜合表徵。

呂正東表示,公安場景是 NLU 可以大展拳腳的領域。「其實,在邏輯層上大有可為。之前很多企業已經在感知層上獲得了快速成長,但總的來說,感知層市場的增長已經大幅放緩。」 他認為,公安方面接下來更亟待解決的任務,就是如何在認知層和邏輯層把數據串聯起來形成解決方案。

與醫療領域有著較為相似的痛點,公安領域也面臨著專家資源的缺乏以及與時代的脫節。「新警察缺乏經驗,老警察也在被一個問題所困擾:他的經驗未必能和最新的偵破手段結合。」呂正東說。所以,在這樣的背景下,亟待一個既能融合老警察辦案思路,又能以極速的方式接觸到各種信息、適應最新偵破手段的解決方案。呂正東表示:「目前世界還沒有技術能一開始就做到機器版的福爾摩斯或者狄仁傑,但是我們可以在一些局部進行突破,先提高警察的辦案效率,逐漸就會串聯起一個更完整、更強大的解決方案。」

據悉,深度好奇在公安市場的商業模式目前主要有兩種:其一是將產品直接銷售至公安局,用戶已覆蓋多個縣區級公安局、地市級公安局和省廳;其二是與不同類型的平台型公司合作,通過他們的渠道進行市場推廣。顯然,深度好奇的技術產品在效果與落地方面均有所成,未來也可能衍生到其他領域。

深度好奇已經於 2016 年底完成了合力資本及阿米巴資本的天使輪融資,目前對於新一輪融資持開放態度。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 動點科技 的精彩文章:

Microsoft 限制「受美國制裁」國家使用 GitHub
郭明錤:2020 年新 iPhone 將拋棄劉海設計

TAG:動點科技 |