當前位置:
首頁 > 科技 > 專註 NLP+RPA+OCR,「達觀數據」發布新產品「智能文本 RPA」

專註 NLP+RPA+OCR,「達觀數據」發布新產品「智能文本 RPA」

36氪獲悉,「達觀數據」於昨日推出新產品「智能文本 RPA」。

達觀數據成立於 2015 年,技術方向是自然語言處理(NLP),即在文本數據基礎之上做各種應用,比如文本挖掘、搜索推薦等,主要產品是文本智能化處理軟體系統,能夠幫助客戶完成文檔智能審閱、推薦、搜索、空戶意見洞察等工作。此前,達觀已成功服務招商銀行、中國平安、華為、中國移動等數百家金融、製造、軍工、科技等領域企業和政府機構。

RPA(機器人流程自動化)是近兩年較為火熱的話題。簡單來說,這是一項橫向的、貼近業務流的技術,用於自動化處理重複、規則明確、並且需要人類切換不同系統來完成的工作。具體到產品形態,則是自動化軟體,模擬人類的交互完成重複性事務。

舉個例子,如果一個分析師每天需要關注一家上市公司的數據,每天要在同一個網站扒數據,並填到表內,那麼 RPA 機器人就可以自動完成獲取數據、填表、導出等工作。

具體到達觀的 RPA 產品,主打 NLP RPA OCR,即在機器人里集成了 NLP(自然語言處理) 和 OCR (光學字元識別) 模塊,優勢在於能做更多複雜應用場景的業務流程自動化。陳運文表示,在企業流程中,大約 10 - 20%是簡單業務流程,其他則是需要人工參與的複雜流程,本次達觀推出的 RPA 產品,相當於是傳統 RPA 的升級版,能夠大大提高服務能力。

傳統 RPA 產品由開發平台、控制中心、終端機器人組成。在 RPA 三大核心部分的產品功能設計上, 達觀智能 RPA 產品負責人金克指出,面向企業級用戶,達觀數據會從擅長的 NLP 與 OCR所覆蓋的場景切入,在產業設計層面結合兩者的易用性與準確率。在前端,達觀RPA提供兩個版本,一個是面向業務人員的版本,可直接拖拽模塊或錄屏,無代碼設置程序;另外也提供IT人員版本,可編程,用於更複雜的業務流程。

在目標市場上,達觀的 RPA 產品面向的還是中大型客戶,產品目前已經完成測試階段,並有實際落地案例。從落地效果上看,達觀 RPA 單個機器人能夠完成 4 個普通員工的工作,成本在人類員工的25%。

達觀數據副總裁賈學鋒在發布會上也介紹,截至目前,達觀智能 RPA 已推出銀行、財稅、政務、保險、證券基金等數十種不同崗位的機器人員工。在售後工單處理、商業案例報告生成、供應商准入核實、智慧政務行政審批、金融文檔的抽取驗查和填寫等場景中已開展工作。

對於此次新產品發布,36氪也對達觀數據創始人兼 CEO 陳運文進行了採訪。

NLP OCR,解決RPA「最後一公里問題」

陳運文表示,達觀數據自 2017 年即接觸到 RPA,並且與國內外 RPA 公司和諮詢公司均有合作,發現 RPA 與 NLP 天然的互補性, NLP 技術是提高 RPA 能力的重要模塊。因此,達觀自 2018 年年初開始研發,並且於今年 1 月完成 RPA 產品 1.0 研發,推向試點客戶。

他對 36 氪介紹:「在文本處理里,也分為簡單和複雜流程,簡單的文檔處理可以通過 RPA 來完成,而複雜的的工作單靠 RPA 無法處理,達觀即是補全了這塊的能力。」

通過自然語言邏輯分類、自然語言數據提取、識別和深度學習模式預測,達觀的新產品可以將 RPA 的應用場景覆蓋面提升 80% 以上,比如能更好地解決傳統 RPA無法處理的非結構化數據源問題,像圖片驗證碼識別、證件識別、紙質文檔識別、合同抽取、財務報表抽取、報告生成等業務需求。

比如說,金融行業和政府機構都有大量的資料報送和審查場景,存在大量非結構化的數據。陳運文以一個數據採集場景舉例,一張單據上,無論填寫者用「供應商」還是「甲方」,表達的意思是一樣的,但對於 RPA 機器人來說,如果不知道兩個欄位的意思相通,抓數據的時候就會出現錯誤,這就需要 NLP 模塊來幫忙。

RPA最早起源於國外,但陳運文認為,RPA 在中國規模化發展更需要做有中國特色的 RPA產品。和英文相比,中文更靈活,語法結構更複雜,這使得融合的 NLP 技術在實現路徑和方法上存在一定的差異化,在語義理解上也面臨更大的難度與挑戰;另一方面,中國大型企業複雜的組織架構與許可權劃分需要從產品設計上做好不同部門、職級、角色的機器人隔離設計。

以 NLP 起家,為何做 RPA?

目前國內做 RPA 的公司大致分為幾類:只做 RPA 的創業公司、傳統的IT/運維/運營自動化廠商、巨頭,以及人工智慧公司,達觀數據屬於人工智慧公司一類。

從業務邏輯來看,達觀數據做 RPA 產品可以說順其自然。

此前達觀數據的主營產品「文本智能化處理軟體系統」是以NLP OCR為核心,完成實際業務中的文本數據抽取、識別、關聯比對、核對、寫作等環節。對於業務中的各種非結構化文檔,前期獲取數據即會涉及到跨系統抓取,獲取後的處理環節,也需要結合業務操作流程。

與 RPA 的業務模式有共通互補之處,並且通過此前產品,已經了解了不少客戶的實際業務流程——這也是達觀數據將 RPA 與 NLP 結合的原因。

不過,現在 RPA 公司也會採取調用外部 NLP 模塊來做文本處理,NLP 公司還有無自己做 RPA 的必要?陳運文表示:

第一,如果 RPA 公司調用國外的 NLP 模塊,若對中文支持不好,機器人效率會不理想。

第二,RPA 貼近業務的特性,能讓客戶直觀地看到業務效率的提升,ROI表現突出,這能很好地降低AI的落地門檻——若作比喻,那麼RPA則是蛋殼,AI能力是內里,客戶想要的是一整個雞蛋,兩者不能缺失。無論是在拓新客戶,還是服務老客戶層面,做 RPA 都是很好的選擇。

相關閱讀

36氪首發 | 「達觀數據」完成1.6億元B輪融資,寬頻資本領投

文本挖掘有多大的想像空間?「達觀數據」基本實現盈虧平衡

搜索難用、個性推薦不準?達觀數據以此切入大數據服務

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 36氪 的精彩文章:

中國創投的短線遊戲
中國恆大前6月合約銷售額2916.9億元

TAG:36氪 |