當前位置:
首頁 > 新聞 > 永輝雲計算聯合創始人兼CTO胡魯輝:從微軟智能大數據到智慧零售,我的大數據與人工智慧融合實踐

永輝雲計算聯合創始人兼CTO胡魯輝:從微軟智能大數據到智慧零售,我的大數據與人工智慧融合實踐

雷鋒網按:2018 全球人工智慧與機器人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)承辦。

本次大會共吸引超過2500餘位 AI 業界人士參會,其中包含來自全球的 140 位在人工智慧領域享有盛譽的演講與圓桌嘉賓。

大會第三天的【AI+專場】中,美國德州農工大學數據挖掘實驗室主任胡俠,永輝雲計算聯合創始人兼CTO、前華為美研首席架構師兼CTO胡魯輝,乂學教育首席科學家崔煒,中興力維首席技術官曹友盛等重磅嘉賓先後發表精彩演講,分享AI在各自領域的落地實踐經驗。

其中永輝雲計算聯合創始人兼CTO胡魯輝作為第二位出場的嘉賓,發表了題為《機器學習融合大數據》的主題演講。

胡魯輝老師在演講中指出,這一次人工智慧浪潮的興起與大數據密切相關。過去大家覺得大數據很火但價值不大,是因為沒有形成閉環。他認為,未來大數據會朝著實時智能數據的方向發展。所謂實時智能數據應當從用戶的角度從發,包含實時批流計算、隨時可得、數據智能化、實時決策和安全共享五大特點。

胡魯輝老師還特彆強調,未來應該加強數據安全共享,因為數據雖然重要,但它不是黃金,如果現在不用、不分享就會不斷貶值。

隨後,他從微軟大數據平台和永輝雲計算兩個案例從發,分享了自己在促進機器學習與大數據融合方面的實踐經驗。

以下是胡魯輝老師的全部演講內容,雷鋒網做了不改變原意的整理與編輯:

大家下午好!剛才胡俠教授從學術角度做了精彩的分享。我來自工業界,所以跟大家分享一下人工智慧在工業界的應用。今天的分享主要包括兩個方面:一是機器學習和大數據怎麼融合,二是融合之後怎麼應用到工業中。我會列舉兩個例子:一個是微軟的場景,另一個是智慧零售的場景。

首先回顧一下科技的發展歷程。過去幾十年,基本每十年就會有一個大的技術突變。85年微軟發布第一個操作系統Windows開啟了PC時代,94、95年Amazon.com、Yahoo先後發布,宣告進入互聯網時代;07年蘋果手機發布,又開啟了移動時代,直到2015年人工智慧時代開啟。這些突變的價值一次比一次大,基本每一次突變的價值都是上一次的10倍。人工智慧有些例外,它的價值是上一次技術突變的2倍左右。

今天人工智慧概念非常火熱,也已經在一些領域落地應用了,但規模不大,所以大家可能感受不到它的巨大價值。但大家不妨回想下98年的互聯網是什麼樣的,當時的互聯網和今天的人工智慧很像——雖然很熱,但規模不大。所以大家要對未來充滿信心。

人工智慧在朝兩個方向發展:一是學術研究,包括TensorFlow、Torch等很多工具和平台;二是行業應用,包含IaaS和AI Edge兩個方面,IaaS即Intelligence as a Service,AI Edge則擁有很多應用場景。學術研究和工業應用中間是Cloud AI,通過雲化或平台化的方式來提升人工智慧的能力。

這一次人工智慧浪潮的興起和大數據密不可分,沒有大數據,這一次人工智慧浪潮就不會到來。例如Fraud Detection、Content Recommendation、Cognitive Assistance等的應用都和大數據密切相關。

大數據的演變經歷了Batch Processing、Stream Processing兩個階段,其中Batch Processing主要應用在報表上,Stream Processing則主要應用於報警。

大家或許會有這樣一種感覺——大數據很火,但價值卻不大。這是為什麼呢?因為在許多場景中,它還沒有形成閉環。只有讓它成為業務的關鍵,才能體現更大的價值。

大數據未來會如何發展呢?我認為大數據的下一個階段是實時智能數據(Real-time Intelligent Data),不是以技術角度定義大數據,而是從用戶體驗的角度來定義。具體包含五個方面:

1.實時批流計算。所謂實時不是從數據或技術層面,而是從用戶的角度來定義,即用戶什麼時候想用,數據就能產生結果。

2.數據結果隨時可得。如果數據量很大,如何也能快速得到結果?

3.數據和智能完全融合。

4.如何讓數據做到閉環,也就是實時決策。

5.數據安全共享,這一點非常重要。我在國內發現一個很有意思的現象:大家都認為數據很重要,所以握在手裡不分享。數據確實很重要,但它不是黃金,如果現在不用、不分享就會不斷快速貶值,因為每年產生的數據無論量還是豐富性都在快速增長。

下面列舉兩個機器學習和大數據融合的案例。


微軟智能大數據

下圖展示了微軟的實時大數據平台。在這個平台上我們主要實現了兩點功能:一是可配置,即在數據採集、展示、存儲、計算方面都是可配置的;二是實時性。這裡的「實時」指的不是流處理,關鍵的是實時搜索能力。站在用戶的角度,如果你需要什麼結果,搜索是更好的方法。

我們在這個大數據平台里結合了許多人工智慧的演算法。我們知道,微軟有很多的產品和服務,那麼如何維護它們呢?微軟有System Center,下面的圖表列舉了微軟所有的產品部門。

微軟的產品出了問題怎麼辦?微軟常常用Knowledge Base來解決。這對微軟來說是很大的市場,規模每年差不多有50億美元。而且這件事相當複雜,Knowledge Base有20萬個。我們利用人工智慧,根據用戶信息,有效地把解決方案和問題自動聯繫起來了,這是一件非常了不起的事情。

微軟的產品、伺服器、企業服務軟體都會產生很多的機器數據,另外也有一些人為配置數據。根據這些機器數據和配置數據,把問題和解決方案自動聯繫起來,這就是我們做到的事情。

我們具體是怎麼做的呢?我們把大數據平台和客戶數據中心(服務和設備都在客戶數據中心)通過混合雲的方式鏈接起來,然後在平台上運用人工智慧的方法。

前面提到,微軟有20萬個Knowledge Base,這個東西是文檔,處理起來有很大的挑戰。我們是如何把這些文檔或解決方案的文字轉化成對應特定場景的問題,一步步解析出來,幫助用戶解決問題的呢?

我們主要做了兩步工作:第一步是做線下NLP的Index,將20萬個Knowledge Base進行分類處理,放在大數據平台;第二步是數據採集和實時分析,這一步的演算法和第一步差不多,也應用了類似的NLP技術。但二者針對的數據不同,第一步處理的Knowledge Base是文檔式的;第二步處理的是客戶數據,是另一方面的數據。我們用類似的NLP演算法處理實時數據,產生一個fingerprint,然後把這個fingerprint與index里的Knowledge Base進行匹配。

比如,機器出現問題時會產生一堆logging,這些logging可以反映出某種特定的場景。於是我們根據這些logging生成一個fingerprint,再到Knowledge Base的index平台搜索匹配。有時候我們會搜索出很多個結果,這時候就需要特定的ranking來優化。

這件事看似簡單,其實蘊含著很多挑戰,下圖列舉了四個方面。比如對KB articles的NLP:微軟的產品相當之多,有Windows Server, Exchange Server等至少七八種Servers,每個Server都相當複雜,處理起來比較困難。


智慧零售與大數據融合

再跟大家分享一個大數據和人工智慧融合應用於零售領域的案例。

隨著消費升級、消費者行為變化,零售行業已經發生了巨變。早期60、70後是消費主力,現在消費主力漸漸成了80、90後。

如果說傳統零售是零售的1.0模式,那麼新興大賣場和互聯網電商就分別是2.0和3.0模式。1.0模式以貨為中心,只要有好的貨就能賣得很好;2.0和3.0模式沒有本質區別,主要是靠渠道和流量,只要有流量就能賣得很好。現在我們進入了零售4.0模式,也就是以人為本、以服務為中心的零售模式。

這個模式有很大的不同,因為消費者更加追求個性化、社交化、口碑化,更加在乎服務品質,不再是什麼便宜買什麼。

過去線上有電商,線下有門店,如果把線上、線下融合起來,就能給消費者帶來更大的便利。比如我去一家門店買東西,我想買很多東西,又嫌東西太重不想拿,怎麼辦?現在只要在APP上下單,門店就可以把商品配送到家,這就是典型的線上、線下融合。

過去電商解決了信息不對稱的問題,但用戶體驗商品還是比較困難。假如我有一個體驗店,消費者可以先到體驗店試用,再到線上下單購買,就解決了這個問題。這些是線上、線下融合的例子。

不管怎麼說,零售行業應該回歸到了本質——以人為本。如何做好服務、讓消費者滿意成為了零售行業的重點。

再來看一下永輝雲計算是怎麼做的。

永輝雲計算是在永輝和騰訊平台上搭建的面向零售的智慧雲。它的使命是運用雲計算、大數據和人工智慧賦能零售行業,以人為本,以服務為中心,讓消費者更滿意。

門店和電商在很多方面有著本質區別。首先,對電商來說數據是天生的,採集也比較容易。但對門店和超市來說,數據雖然很多,但形式各不相同,如何全面數據化是一個巨大的挑戰。

不過凡事都有兩面性,線上數據採集雖然容易,但數據的真實性不一定可靠。比如你幫朋友買東西,雖然是你下的單,但你朋友才是最後使用商品的人。門店的數據則相對真實,人工智慧可以精準識別到你的行為。

大數據和人工智慧在零售行業有很多的應用場景。

比如,合夥制是零售行業一種比較創新,也比較能激發員工動力的管理方法。如果能夠有效利用大數據,通過信息聯通、透明化,進行智能化的管理,將比人工管理更加有效。

另外,大數據可以加深對用戶的理解,實現更加精準化的營銷。我們經常把商品簡單理解成SKU,但其實並沒有這麼簡單,它還涉及很多東西,比如商品從何而來、怎麼庫存和哪些因素相關。這是一個生命周期的管理,過程中的數據非常富有挑戰,而且意義重大。

物流也是大數據和人工智慧非常好的應用場景,它的數據化也比較重要。

還有前端的線上、線下融合。消費者進店的時候手裡還有一個埠,比如小程序、APP。如何把這個埠有效的數據化,也是我們正在探索的。

數據化之後,下一步是數據智能,把數據和人工智慧融合起來,讓比較複雜的場景可預測。

最後一步是智慧賦能,即通過數據和智能的融合,賦能真實的應用場景。比如智慧選址,假如你要開一千家店,選址是一個非常龐大的工作量,用大數據和人工智慧選址,既有效又能節省成本。再比如,以前需要在POS機上刷卡支付,現在通過刷臉就能支付,登記一下就可以拿著東西走人。諸如此類,很多場景都可以將數據化和人工智慧有效結合起來。

我今天的分享就到這裡,謝謝大家。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

汽車信息安全刻不容緩,360助力 ITU制定國際汽車信息安全標準
明星臉、花鳥都不是問題,微軟中科大聯合推出細粒度圖像合成模型

TAG:雷鋒網 |