當前位置:
首頁 > 科技 > 獲數千萬元A輪融資,從數據標註延伸到中台、AI建模

獲數千萬元A輪融資,從數據標註延伸到中台、AI建模

從數據標註到模型訓練迭代的一站式服務。

36氪獨家獲悉,「倍賽BasicFinder」已完成數千萬元A輪融資,由五嶽資本和Talkingdata投資。

36氪此前多次報道「倍賽BasicFinder」,公司註冊成立於2015年,靠數據標註工廠起家——將打字員改造成數據標記員,通過自營模式保證服務質量。後來公司收購了眾包模式起家的「丁火智能」。

過去一段時間,公司的發展在兩塊:

一方面,數據標記是個重人力的勞動密集型行業,關鍵點就在於——提升人員效率、交付質量。另一方面,BasicFinder重點發力技術平台,輸出AI基礎設施的全流程產品。

「當數據任務量大時,比如標記百萬級圖片,可能需要200人/月。此時人員的配合管理很是關鍵,所以,BasicFinder主要在優化系統。」這是倍賽BasicFinder創始人兼CEO杜霖在2018年接受採訪時表達,從前端採集,系統預處理,輔助標記,到監控數據集,產出模型等,BasicFinder自研發的系統不僅要通過工具提高人工標記的效率,而且更適配於企業對AI數據的全生命周期管理需求。

如今,倍賽BasicFinder已經形成標準化產品向外輸出,主要包括3大體系:

1、BasicFinder HIVE數據標註系統——從企業的任務發布開始,HIVE系統可以起到管理任務的作用,到標註人員使用過程中,HIVE則有一系列工具集用於提高人員效率。

2、BasicFinder DATA AI數據中台——標註完的數據,包括企業的其他數據,都可以集中在該平台上存儲、管理。該平台有一套檢索許可權機制,可以用於之後的數據建模。

3、BasicFinder PLAT建模平台——利用基於Docker技術,倍賽給企業做了一個建模環境,可以私有化部署在企業內部,前面流程中標註的數據,可以選取有效的直接到該平台上訓練。優化的結果,再反饋給標註平台。

從1到2,是幫企業從單一數據到全數據,整合數據中台的邏輯,再做到3,則是縱向延伸,從底層數據到上層建模的邏輯。從而,倍賽BasicFinder可以實現從數據標註到模型訓練迭代的一站式服務。

杜霖表示:「通過BasicFinder PLAT模型訓導平台訓練出的模型可以分為兩個方面進行部署,一方面應用於現實場景識別;另一方面部署為預標註模型。最終,將預標模型和現實場景收集的數據分別接入BasicFinder HIVE數據標註平台。作為數據流轉的原始起點,BasicFinder HIVE在新循環中將應用之前導入的預標模型,對新補充的數據進行智能預處理,然後人工復標,以確保數據準確性。標註完成數據版本化後流入數據中台BasicFinder DATA,之後再將數據掛載至BasicFinder PLAT模型訓導平台,進行模型迭代和升級。整個過程降低了數據集的版本控制、存儲和傳輸成本,也相應地縮減了模型周期性迭代成本,所以可以促進AI項目的快速落地。」(如下圖)

「而PLAT模型訓導平台,實質上相當於一個模型計算的容器管理系統,也可以理解為模型孵化器。該平台能夠管理調度企業的GPU等計算資源,實現一鍵導入數據、配置計算環境及部署模型,提升AI工程師研發效能,降低企業AI算力調度和管理成本,同時保障數據資產安全。」

來源:36氪

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 砍柴網 的精彩文章:

Facebook:Quest軟體銷售兩周破500萬美元
IBM推出人工智慧自動化新功能AutoAI

TAG:砍柴網 |