當前位置:
首頁 > 科技 > 天雲大數據:賦予平台自動化機器學習能力,沒有數據科學家也可以用好AI

天雲大數據:賦予平台自動化機器學習能力,沒有數據科學家也可以用好AI

在很多人眼裡,人工智慧就是人臉識別、語音交互、人機協同。但在天雲大數據CEO雷濤看來,以上這些都只是應用場景,並非AI的核心。他認為, AI的核心支撐技術是圍繞機器學習構建的技術框架。而這也是人工智慧門檻最高的地方。

天雲大數據(以下簡稱「天雲」)CEO雷濤是一位實打實的技術男。無論是訪談還是演講,你總會從他的口中聽到滔滔不絕的技術辭彙。然而,與大多數技術男不同的是,他也總能舉出最生動的例子和場景來解釋這些生硬的術語。

讓技術變得更接地氣,降低技術門檻。這是雷濤一直在做的事情,當然,這不只是他一個人的執念,同時也是天雲成立以來的初衷。

一年多前,在採訪時與雷濤聊起人工智慧,他就多次提及人工智慧的普及化和民主化,並且強調:「AI不是少數人的專利。天雲要做的就是把AI能力下沉到個體,讓企業獲取機器智能可以像讀書一樣簡單,讓更多的開發者、業務人員也能使用AI。」

天雲大數據:賦予平台自動化機器學習能力,沒有數據科學家也可以用好AI

天雲大數據CEO 雷濤

MaximAI 3.0發布,實現自動化機器學習

在很多人眼裡,人工智慧就是人臉識別、語音交互、人機協同。但在雷濤看來,以上這些都只是應用場景,並非AI的核心。他認為, AI的核心支撐技術是圍繞機器學習構建的技術框架。而這也是人工智慧門檻最高的地方。

以某股份制銀行為例,其官方APP的運行和維護,背後需要多達數千位的數據科學家團隊,他們每年要生產600個機器學習模型,以供APP調用。對於大多數企業來說,這都是難以承受的巨額成本。

另一方面,隨著企業在轉型過程中逐步從規則流程驅動向數據驅動轉變,這要求它們花費大量精力和成本,對以往的複雜業務流程進行梳理和改造,從而提高生產效率、節省時間。

為此,天雲給出的解決方案是——規模化的AI工具。具體來說,即融合數據、計算、演算法三方面的能力,結合具體商業實踐,通過構建支持自動化機器學習(Auto Machine Learning)特性的PaaS化AI平台「MaximAI」,為客戶做AI賦能,從而減少對數據科學家的依賴。

MaximAI是天雲基於Hadoop/spark分散式底層架構搭建的人工智慧平台,用於簡化預測模型生命周期的可視化和模塊化管理。其名字取自第一次世界大戰中的「Maxim機槍」。這款「自動武器之王」的出現使得步兵完成了從「獵人」到士兵的轉變,也使得人類兵器史完成了從瞄準到掃射的過渡演進。

而就如同Maxim的火藥一樣,天雲賦予MaximAI的使命也是讓AI變得更加接地氣,讓每一個個體都具有分析能力。

目前,MaximAI已經升級至3.0版本,能夠實現演算法的自動化優化和自我學習。同時,還可以實現notebook環境下的容器化部署,根據任務類型就能為用戶自動確定演算法,實現特徵工程的自動化、自動衍生或合成特徵、模型超參優化等多種任務。這意味著,用戶只需要用很少的操作,就能獲得高精度的機器學習模型。

據介紹,某大型股份制銀行已經基於MaximAI構建了大數據挖掘平台,通過數據挖掘和分析,不僅實現了對內部管理缺陷的精準定位,降低了管理運營成本,還幫助銀行確保了財務透明度,提高了計劃和預算的準確性。與此同時,通過全量大數據的數據挖掘建模,還幫助該銀行獲得了更廣闊的業務發展空間、更精準的決策判斷能力和更優秀的經營管理能力。

國產HTAP資料庫Hubble,低成本滿足業務變化需求

然而,自動化機器學習在給企業帶來AI使用便利的同時,也帶來了新的挑戰。過去,生產與離線分析各自獨立,信息化結構複雜,異構資料庫產品之間數據同步難度大。而如今,以數據驅動的創新業務要求企業必須構建一個面向生產交易等數據科學處理的核心計算框架。為此,以數據湖為代表的全新架構成為越來越多企業的選擇。

針對於此,天雲推出了百萬原生代碼規模的HTAP資料庫產品——Hubble。

據天雲研發總監喬旺龍介紹,Hubble對SQL進行了全面支持,並且提供多種交互介面,可以使用JAVA SDK、JDBC客戶端、SQL等多種訪問方式為前端應用提供數據的訪問。同時,它還具備NoSQL的能力,通過採用高擴展、高可用的架構,以滿足不同的業務應用,以及企業對實時、高性能的需求。

在底層技術層面,Hubble採用了HDFS作為數據的存儲介質,不僅能夠存儲海量數據,還具備集群的橫向動態擴展能力。此外,在安全性方面,Hubble還利用了HDFS的三副本機制來保證整個集群的穩定運行。

基於這樣的技術支持,Hubble能夠應用於歷史數據查詢、全量數據存儲、統一格式查詢等場景,從而實現對業務核心交易的減負,保障全量數據在線。

譬如,在遊戲和電商行業,Hubble可以支持海量遊戲和電商數據的存儲,從而對用戶進行畫像,實現精準營銷,並提供秒級的響應速度;在基礎設施監控方面,Hubble可以提供准實時入庫,對基礎實時數據進行流處理,並提供對基礎設施數據的監控;在IOT及感測器數據方面,Hubble也可以通過實時入庫,對物聯網數據進行存儲、查詢及挖掘。

「Hubble的目標是做國產的HTAP資料庫。用戶在使用Hubble時,無論業務規模大小,始終都與小型應用階段相同,無需改變使用習慣。當業務規模擴大時,只需要添加新的節點,提升資料庫的能力,就可以適應業務變化的需要,並且每個階段都不需要付出額外的成本。」喬旺龍表示。

以技術為核心賦能合作夥伴,共建生態服務體系

與「浮躁」氛圍濃厚的人工智慧市場不同,成立5年多來我們甚少看到天雲的高調發聲,但是,其在技術研究層面的專註投入卻是不遺餘力的。

正因如此,天雲一直有著非常紮實的技術功底。如今,它已經能夠提供完整的人工智慧產品和服務,除了底層的資料庫Hubble和AI平台MaximAI之外,其產品線還包括了基於Hadoop生態體系的企業級大數據中間件平台BDP、專業數據處理引擎Hilbert,以及面向消費端的C2C智能營銷SaaS平台。

針對於行業,除了最初涉足的金融領域外,天雲人工智慧平台在醫療、能源、藝術品交易所也得到了廣泛應用。在醫療領域,天雲利用機器學習演算法準確識別出影響冠心病患病概率的重要性因子,並依此建立模型、進行預測,在臨床實踐中為專業醫師提供參考和開拓診療思路;能源領域,天雲通過對油井故障的示功圖進行故障分類,將傳統以月為單位的反饋分析效率提升到了日,並且大大減少了維護工人的數量;藝術品交易領域,通過聚類演算法分析,為營銷以及藝術品的甄選上線提供精確的數據指導和預測。

得益於這樣的「兢兢業業」,在2017年中關村5000億計劃中,天雲被列為大數據領域TOP10,並且上榜了中科院發布的人工智慧企業排行榜百強。此外,在今年上半年天雲還獲得了由曦域資本、華映資本領投的1億人民幣增資。

「技術是天雲獲得這些榮譽的核心。」雷濤這樣說。據他介紹,下一步天雲還將從賦能於企業用戶進階到賦能於合作夥伴,與合作夥伴一起共建生態服務體系,其中主要包括以下四種合作方式:

一是技術轉賣,合作夥伴在價值轉移過程中獲得附加價值;

二是幫助合作夥伴服務轉型,由面向Java、DB流程型開發的服務團隊,轉型成DT時代的Machine Learning數據驅動團隊;

三是面向已經進入數據科學的團隊,天雲提供支持容器化部署docker的微服務Micro service,將數據科學的模型生產過程沉澱、打包成標準可擴展形態的產品,幫助合作夥伴擴大規模;

四是面向擁有數據和場景的合作夥伴,提供數據變現的資本合作。

「未來人工智慧發展趨勢凸顯的是規模化的生產能力,它會離我們的生活越來越近,而這需要的是更多合作夥伴相互賦能,共建生態服務體系,才能實現共贏,讓更多人受益。」雷濤表示。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 至頂網 的精彩文章:

開放與多元化 數據洪流下的IT產業變革
黑莓Key2:信仰賣不了好價錢,但加上「魔法」或許可以

TAG:至頂網 |