中國大數據利用率僅0.4%!行業大咖教你如何用好大數據
文/高虹
中國的大數據利用率只有0.4%!9月7日,第五屆中國雲計算大會的「大數據及人工智慧」分論壇上,相關專家的數據公布讓人們不禁為中國大數據領域的應用擔憂。如何有效利用大數據,打造新型的智慧城市過程中大數據的重要地位,怎樣讓大數據與人工智慧更好地服務企業,助推中國經濟發展。現場的行業大咖們各抒己見。
論壇上,大數據演算法與分析技術國家工程實驗室社會大數據分析與應用中心主任趙璽,北京供銷大數據集團首席信息官楊正洪,北京開數科技有限公司總裁熊梓楷,PingCAP工程部副總裁沈礫和京東資深雲架構師石穎,分別做了主題分享。
身處數據研究機構,基於學術層面,趙璽主任的分享更具有宏觀和指導意義。
「不可否認,互聯網和雲計算的深度發展,為我們的數字空間提供了骨架,而大數據又為數字空間提供了血和肉,我們越來越明顯地感到並列於我們物理空間的同時又一個網路空間或者是數字空間在快速的發展。計算社會學,就是當代社會學界藉助互聯網、雲計算、生物劑量等現代科技手段,利用大數據、機器學習來獲取與分析數據,從而研究與解釋社會的一種新的方式。現在的社會學界想研究社會,但是缺乏手段和工具,但是大數據和雲計算的方式,他們可以對人類了行為或者社會運行規律達到真實準確的認知。」趙璽主任分析認為,學術界里有很多代表性的研究,包括組織內部的郵件數據研究人們的互動行為,利用搜索數據分析流感的發病率與傳染情況,利用社交網站測量人的健康、心情、性格與行為方式等變數,利用家庭視頻檢控對嬰兒成長數據進行分析,研究社交情境對嬰兒的語言學習影響等。
「所以,在計算社會科學,我們看到很多的發展空間和潛力,那主要發展路徑是什麼呢?第一,還是落到我們大數據和雲計算上,大數據的獲取與解析。第二個路徑是人工處理與計算機方法的融合應用。另外還有社會互互聯網的研究,這種研究範式包括騰訊、京東他們都在用這方面的研究來做實例測試。最後,新型社會集散工具的研製與開發,這和我們大數據底層的技術是相關比較大的,一方面是自動化數據獲取工具,數據分析演算法,數據分析平台,可視化方法,我們做的可能偏數據分析方法和可視化方法。我們工程研究中心主要現在用的是關於人的手機上的行為數據,來做相關的研究。因為在2009年的時候,nature發現手機已經遍布全國90%以上的人了,所以這樣的非常有研究價值,這是一個人一天的行為數據。義大利的一些電信運營商已經公開了這部分數據來供研究。我們可以看到,用這樣的數據可以做到很多領域的應用,包括人道主義救援,公共衛生管理,氣象災害應急,農業食品安全,交通城市規劃,能源和國家調研統計,這樣的數據都可以用到這些領域裡面。」
北京供銷大數據集團首席信息官楊正洪,在論壇上分享了企業大數據管理平台的架構和整體運營思路。
北京供銷大數據集團的大數據建設整體架構分成三層。自下而上,第一層是大數據的基礎平台,也叫雲平台,包括了計算資源、存儲資源、網路資源和大數據的一些基礎的架構;第二層是大數據管理平台,主要是從很多的業務系統整合數據,管控數據,然後提供數據;第三層是對數據做分析,使用如機器學習、挖掘演算法等新技術。「要建設好大數據,需要組織保障,制定標準規範體系,而當所有數據整合時,數據信息安全就顯得十分重要。以上就是大數據建設的總體架構。」
楊正洪在講解了企業的大數據平台構架後,以保險行業客戶為例做了詳細的分析。大數據平台在新型智慧城市中佔據怎樣的位置?建設大數據管理平台,實現整個的數據整合、管控和服務,一般需要幾個系統?大數據管理平台軟體提供商需要提供哪些軟體?北京供銷大數據集團的大數據管理平台經驗分享可謂是乾貨滿滿,也讓更多的人意識到大數據的價值。
但是,企業對大數據的利用普遍偏低,而且企業也不知道應該怎麼去挖掘數據價值。對此,開數科技總裁熊梓楷給出了自己對看法和經驗。
「大數據應用」痛點首先出現在數據的整合領域。「我們之前做過戰略、諮詢、金融,還有其他的創業經驗,我發現,企業數據存在不同的資料庫,不同的系統是不同的供應商建設,每個系統不相通,大家的數據無法統一。對此,我們做了第一件事就是數據整合。」熊梓楷說,但這涉及到兩個非常關鍵的因素:做數據整合的人都非常懂業務;數據必須是非常容易可得的,電子化的。
隨後,熊梓楷從三個場景分析了如何解決大數據應用上的問題——定位和預測、通過人工智慧的演算法預測場景未來的表現、如何用人工智慧演算法匹配外部和內部的數據,發現更多的商機。
PingCAP的工程部副總裁沈礫,基於公司的資料庫業務,帶來了《資料庫在場景下的應用》主題分享。在沈礫看來,資料庫存發展了幾十年,從1970年開始就有各種資料庫出來,比較優秀的商業代表DP2,有一些Mysql,這些資料庫在支撐業務發展的過程中起了很多的作用。但是這些資料庫隨著業務量不斷擴大,出現了計算資源不夠等問題。
對此,沈礫詳細講解了企業所提供的行之有效的解決方法,如正在計劃做code generation,優化分散式計算引擎支持更加複雜的演算法,此外,還做了存儲引擎等。「不管是我們的分散式計算框架,還是比較強大的SQL優化器,還是從上到下的包括SPark的擴展,還有我們要做的事情,我們只是想通過這樣的手段,使不同的業務在一套場景中做的更好,讓大家不用忍受數據報表的延遲,更快更好的得到數據。」
京東資深雲架構師石穎重點分享了京東在人工智慧落地的商業和技術實踐經驗。石穎認為,推進京東在未來的12年成為一個新的智慧的商業體,其中人工智慧的力量顯然是不可忽視的。首先,電商場景。電商可以說是京東在人的心目中是最深刻的,甚至是唯一的印象。人工智慧技術在這裡的應用,已經覆蓋了從電商入口,到用戶購買的場景,再到支付階段,還有用戶評價體系等,甚至可以做到千人千面的精準營銷。
石穎的介紹中最讓人關注的是京東在金融場景下的相關應用。「實際上,我們金融有九大板塊,供應鏈金融、消費者金融、支付、農村金融,還有一些信貸和保險方面,已經形成了非常完整的一個生態系統。在這裡,我們現在用的最多的是人工智慧技術中的風控系統,如安全魔方。在安全魔方上,我們會依賴龐大用戶網購的行為數據,構建風險量化平台。」
此外,物流方面,京東物流是中國國內,甚至全球唯一一個具有中小件、大件和冷鏈三套業務體系的物流公司。除了有數據中心的整個機器學習的基於伺服器的後台系統之外,物流體系還涉及一些邊緣計算。「京東是要搭建全國第一個低空基於無人機的幹線物流網,我們會在不同的機場建立我們的配送點,在這幹線上面使用無人機進行貨物搬運。無人倉內,機器人的款式就有很多,堆垛機或者是傳送帶自動識別的一些東西,他們都非常廣泛應用機器人自動識別的技術等。以上就是我們的京東的大數據在我們自己企業內部的應用場景。」
而支撐京東如此龐大智能化運轉的就是「京東雲」。它目前擁有大概20萬的最大集群規模的集群,在數據處理能力上每天超過15P。目前活躍用戶是2.58億。
構建雲架構,利用大數據和雲計算提升企業的業務效率,充分利用人工智慧化提高企業生產效率,更好的服務客戶,雲時代給了人們更加廣闊的想想和發展空間。而知名企業大咖們的現身說法,也讓到場的行業技術人士、企業代表們對大數據的應用和實踐有了更為清晰的認識,拓展了企業發展的數據化、智能化運營思路。
點擊展開全文


※雲端時代科技創新 行業應用要以客戶需求為先
※北京市暫停共享單車新增投放;美團外賣宣布將控制接單量
※AI時代,哪些職業最有前景?
※樂視汽車開閉門會議;華為出貨量首超蘋果
※青山資本·張野:創業三觀
TAG:品途商業評論 |