當前位置:
首頁 > 科技 > 天雲大數據CEO雷濤:DT時代中的人工智慧

天雲大數據CEO雷濤:DT時代中的人工智慧

2018年7月10日-12日,2018中國大數據應用大會在成都召開,大會以"大數據賦能數字中國"為主題。由成都市人民政府指導,中國大數據專家委員會、中國電子信息產業集團有限公司中國電子學會、四川省經濟和信息化委員會主辦,世界工程組織聯合會工程技術創新委員會(WFEO-CEIT)、成都市經濟和信息化委員會、成都市博覽局全力支持,中國電子器材有限公司、中國電子學會科技交流中心承辦,業內知名媒體至頂網與科技行者協辦。

在第二天的活動上,天雲融創數據科技(北京)有限公司【簡稱天雲大數據】首席執行官雷濤發表了題為《DT時代中的人工智慧》的主題演講。

天雲大數據CEO雷濤:DT時代中的人工智慧

天雲融創數據科技(北京)有限公司首席執行官雷濤

以下是雷濤演講實錄:(內容根據現場速記整理,未經發言嘉賓確認,僅供參考,謝絕轉載)

今天跟大家分享一下人工智慧在DT時代落地路徑的主題,希望我的演講能給大家一些啟發。

其實AI和DT這兩個內容會有滲透,最早期做DT的時候,2011年,我們看中國移動的一個項目要用到自然語言去規模化的服務1.2億用戶,它是數據科學加上數據處理的一個綜合體系的系統工程,像現在很主流的一些平台出現是因為ANP的概念出來。P更多講是商業的數據產品,定價、流通,商業事件。

我們今天看人工智慧,ABC又把大數據作為第二個B,又反過來包容,所以現在人工智慧這個領域,大家看的視野差異非常大。媒體看的是阿爾法狗,我們現在看到的是大數據應用端,就是人臉識別、自然語言處理,通過人機交互的處理達到很多漂亮的路徑,很多漂亮的應用。我們看到投資的項目都是在神經網路在看什麼,在推理什麼東西,固化在應用端,大量基於視覺的項目越來越多。

AI幫助我們改變了很多,像端到端的AI服務,比如說打車的服務,它每天要完成上百萬次的路徑計劃,它已經滲透在我們的生活和行業當中了。

今天想跟大家分享的一個主題,這個概念非常多,我們在經歷一個大機構的轉型,從一個大的IT到DT的變化。從數據、信息、知識到智慧,它是一個逐級上升的過程,現在我們如何處理一個低級的內容呢?原來我們更多的IT是服務於業務人員,業務定義的一個具體流程之後,所有的規則都是清晰明確的。我參與的15年以資料庫為導向,以這樣的技術堆棧完成我們對AI的構建。原來機器的角色是機器執行我們的指令,現在它可以達到我們模糊的一個技術邊界指令,我們在DT裡邊處理的數據越來越LOW了,這樣DT的信號和數據,我們用幾個大量的V去描述它,就需要不同的T,早期是以結構化為主含金量很高的體系,在T這個方面就是ABC了,這個T改變的是我們整個行業無論是技術內部的迭代,還是它所服務的內容。

數據本身也發生了很大的變化,我列了三個定義,第一個就是交易性的數據,這些數據是銀行裡邊核心的帳務系統,或者是某一個醫院的挂號系統,這些數據資源存儲在一個昂貴的陣列里,這個是由應用產生的數據,由信息化系統產生的數據,它無疑誕生了六千億美金的大公司,主導了我們整個希望信息化產業內部的三座大山;第二個數據是我們行為交往過程當中產生的數據,這部分的數據更多的是我們在分享、創建,通過微博、微信、網頁等產生的行為數據,這些行為數據的沉澱,數據幾十倍於我前面所說的數據,我們增量的數據要處理1700多條,傳統的數據處理方式是處理不了的,那麼這部分的數據就進入到大數據;我們看到感測器、可穿戴的手環,物聯網大量的設備,這部分的設備更是幾個數量級比以前更多的數量,個別的獨角獸企業也在每一個局部領域、每一個垂直的行業裡邊開始發力,大公司我們相信應該是出現在MI這個領域,更多是以感測器和物聯網為出發大規模的數據資源。

最根本的問題還是在商業模式,我們更多講的還是在技術迭代的過程中,在DT使用的時候,人工智慧它在三個層級發生作用。第一個在BI優化流程,通過一個演算法的分類也好,聚類也好建模也好,把更好的信息流得到更好的優化,我們做一個專家的系統,每一個專家系統都是一個決策數上的數點,今天我們開始應用一類新的方法,把原有的流程給覆蓋掉,比如說我們在信用卡裡頭用一些演算法,原來的決策數種一萬顆樹,這是對已有流程的優化;AI不僅僅是對已有流程的優化,更多的是兩個,一部分是我怎麼延展我的服務,把供應鏈的下游和消費者的上游兩個能夠通過人工智慧的手段連接回來,形成一個數據的閉環,這也是我們現在在AI裡邊看到的常見的體量的內容;第三個是最激動人心的階段,是對商業流程的完全替代,就是原來基於大量的商業經驗被AI扁平化了,我要買一個東西,我們要通過貨架才能找到,它都是有精確的擺放位置,以前都是規則擺放的,一個演算法會改變我們所有的商業流程,商業流程被重構,這個是AI帶來的改變。很多都是由演算法來改變,而不是聽業務來做業務指導。

一個航班的信息優化,我們是用不同的演算法來完成是做預測,航班會不會晚點,還是說我要調度一下擺渡車,這是一個動態規劃的問題,你會發現演算法開始決定了很多商業體量,而且很多演算法是很精巧的,把我們沒法定義的特徵用數學來表達。這也是阿爾法狗在做的事兒。管道泄露,我們把兩個口的兩個差做出來,然後做一個壓力差就可以了,現實當中不是有很多個頭,所以你要做很多的管道內容才能真正做出來。真正的問題是沒有那麼多的圖紙,多數的管道都只有一個圖表,沒有CAD的圖紙你怎麼做,當人類做的工作都沒有辦法做出來的時候,你做一個基於概率統計的演算法是可以找出方法的,當然這個要放在深度學習的框架裡邊去做。

一個演算法決定了商業時代的發展。面向這種AI服務的時候,在DT裡邊我們看到了需要大量的AI能力來替代商業流程和規則,任何人都開始需要訪問AI了,但是AI是不是少數人的專利。每一個新技術的出現,其實都經歷一個漫長的過程,第一部的手機出現,到今天的普及,它經歷了一個很長的周期,第一個演算法的出現,1994年銀碼用谷歌的計算分子,打敗了IBM40年,基於人類的語言學家,你我他這樣的主謂賓的體系,用循環嵌套的方法,但是這個方沒有被大量的應用在行業裡頭。

目前行業面臨人才的稀缺的窘境,德勤有一個報告,AI的畢業生98%被谷歌、蘋果等公司接收,畢業生起薪都是30萬美金,AI在人才上面是非常短缺的,而培養一個人也是需要很長的時間,有人說需要花數年的時間來培養一個博士。以前我們做一個大規模的語言項目處理的時候,第一期沒有用現在的新技術,NOP的方法。博士交給你的項目,所有的照會率都很完整的時候,連回收都不能做那就是邏輯包。一部分是雲計算代表的核心技術人員、工程人員,還有一類是數學、物理、控制的PHD,怎麼把這兩類人才,兩類能力做有效的融合,其實在整個市場去擴展AI的時候都碰到了一個高昂的成本問題。像BAT能夠賦能與程序員一樣,我們能不能給AI也做一個藍翔技校把這些功能賦能。

從2015年開始有大量的公司投入這個領域裡頭,這個圖是原來Facebook的負責人,後來他去了另外一個公司,在整個AI的工程裡頭它是一個系統性的工程,從數據的獲取到探查,特種工程這是是一個很大的工作,然後到後面的評估,上線這是一個整個的體系,這個在整個AI裡邊最重要的是調參。現在的AI體系的內容只是完成了一小部分,所以我們的觀點是像移動互聯網一樣,我們需要一個新的平台機制,谷歌在2016年底的時候定義了,他們的CEO講,我們谷歌要從移動有限轉向AI有限。

我們把主流的九大類演算法用新的分散式體系重構一遍。三年之前大家的關注度並不多,今年上半年英特爾這些巨頭也開始推,整個演算法庫包讓大家重新意識到CPU來跑演算法很明顯,尤其是結構化數據的深度學習,在金融裡頭一個簡單的全子網路,它的效果遠遠要超過其它的內容。

第一個我們怎麼通過算例來提供一個演算法的支撐,第二個就是數據資源的全量再現,數據我們在不斷的挖掘。我們做了一個項目,現在基於微信的營銷流數據的形態越來越及時化,這些數據不可能一個星期後再做處理。我們對於一個服務行業而言,催收的數據有一百萬級別,被催收的數據其實就是違約數據,銀行的壞客戶已經被標註出來,我們把它回到審批端,做審批端優化的,這樣學歷背景的人是不是可以做貸款或者是發信用卡。那麼這個也是要做訓練,每天有一百萬條的訓練記錄。這是一個在線反欺詐,原來申請的人寫的內容用大量的規則來描述,它是不是一個欺詐用戶,現在犯罪分子到農工去招工,拿了一些錢去收集一些身份證號辦一個卡。我們把大量的特徵值,每天上百個件彼此的關聯性,尋找網路特徵,再輸入到端裡邊,然後來識別是不是欺詐行為。

湯森路透是一個金融財經的服務商,他每年要讀幾十萬份公告,然後把一級市場的金額波動分析出來,怎麼重組,什麼時候增發,怎麼做可轉債,這個以前是靠人去做解讀的,後來我們做分析器給它出了一個的解決方案。

心血管疾病的案例,這些案例有些是我們直接參与的,有一些是我們的賦能平台,就像APP商店和IP的關係,通過平台的賦能,讓他們在AI的平台上(不用寫代碼的情況下)來完成深度學習這樣一個複雜的操作。

所以今天我主要表達的一個觀點就是通過一個AI的賦能工具化平台,將AI最初走到現在,來獲取機器智能像讀書一樣簡單。謝謝!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 至頂網 的精彩文章:

VMware宣布推出面向邊緣計算的NFV平台
向智能邁進的數字化轉型 如何挖掘數據新價值?

TAG:至頂網 |