淺析大數據與人工智慧
分享嘉賓:宋國傑
分享主題:淺析大數據與人工智慧
宋國傑
北京大學副教授。
主要從事網路大數據挖掘、機器學習、社會網路分析和智能交通系統等研發工作。
發表論文100餘篇,獲省部級獎勵3項。主持包括國家高技術研究發展計劃(863計劃)、國家科技支撐計劃、國家自然科學基金等10多項縱向課題。
與包括IBM 研究院、移動研究院、NEC 研究院、中興通訊研究院等科研機構,以及中國移動、中國交通集團、國家電網、北京高速、山西高速和安徽高速等企業合作多項橫向課題。
部分研究成果已經獲得實際應用,產生了顯著的經濟效益和社會效益。
2018年3月28日,益邦邀請了北京大學副教授宋國傑擔任EBO知行微講堂的分享嘉賓,帶來以「淺析大數據與人工智慧」為主題的精彩演講。
以下是分享實錄
01
大數據
產生的背景與概念
今天分享的主題是大數據和人工智慧方面的知識。技術層面的知識不詳細講解,我們主要講解什麼大數據的相關基本概念和基本應用,簡單講解一下涉及到的核心技術,最後總體概述一下人工智慧領域的一些發展戰略和國際和國家的整體形勢。
首先分享大數據相關內容:大數據和人工智慧是近期國際上最火的兩個詞,涉及各行各業。從大數據出現的背景來看,每隔十五年左右都會有一次比較大的變革,表現在:
第一次浪潮在80年左右,PC機盛行時期。PC機階段每個人都用計算機來信息處理,蘋果、微軟、聯想、戴爾、惠普、IBM都是典型的代表;
第二次浪潮是在互聯網出現以後,在95年前後的時期。每個計算機即可以處理個人的信息,而且把計算機鏈接起來進行相互溝通和交流形成互聯網,使得計算機不僅能夠處理信息,而且還能通過互聯網進行信息的共享。代表性的企業如雅虎、谷歌、百度、騰訊等;
第三次浪潮是在互聯網出現後到現在,這個階段的典型特徵是數據量急劇增加,對計算能力以及數據的深度挖掘分析需求日益迫切,代表性的企業有谷歌、百度、騰訊、阿里等,他們都從傳統的互聯網企業轉型成大數據和人工智慧企業。
02
大數據管理與分析
主要技術
那麼數據的產生和管理經歷什麼樣的發展呢?可分為如下三個階段:
第一階段是企業數據產生之後,數據通過人工輸入的方式輸入到資料庫裡面,進行統計查詢分析;
第三個階段屬於物聯網階段。這個階段中會有大量的感測器自動採集數據,把這些數據通過設備與設備、設備與人相連,形成一個互聯網系統。例如城市監控系統自動產生的數據等。這個階段機器自動採集和分享數據,數據量會進一步劇增。
其實,不管是web 2.0階段,還是馬上來到物聯網階段,我們已經進入了一個數據的爆發期。這麼多海量的數據如何存儲呢?
從存儲的角度來說,雖然數據的變化兩年翻一倍,但從硬體發展的角度來說也遵循這樣的規律。隨著存儲技術的發展存儲介質也越來越便宜,存儲的容量越來越大,雖然數據的暴增,但存儲的容量和價格也降低的非常快,能夠適應當前數據海量增長的需求。
03
大數據技術
在各領域的應用
大數據已經在各個領域發揮了顯著的作用。比如互聯網領域的推薦系統,城市管理方面的智能交通系統、環保監測系統等。另外,金融、電信、餐飲、政府、安全等領域都積累了非常大的數據,這些數據已經為企業的日常管理和決策發揮了非常大的作用。
國際上對大數據也非常重視,美國奧巴馬時期把大數據認為是一個國家未來發展的石油,把它當做一個國家的核心資產來看待,國家投入了很大的經費來支持大數據的研究;我們國家也把大數據作為我們重要的國家資產來盤活、應用,並且作為國民經濟的一個重要產業來發揮它的作用。近年來,國家對大數據項目的支持力度非常大,已經把人工智慧上升為國家的一個戰略。
什麼是大數據?大數據的定義很多,但有一個基本、大家還相對來說比較公認的一個說法,指無法在一定時間內用傳統資料庫軟體工具對其內容進行抓取、管理和處理的數據集合。這種說法還比較籠統,還有大家公認的4V的說法,它滿足四個特徵:
第一個特徵是量大,數據量要足夠大;
第二個特徵是形式很多,不單單是我們傳統關係資料庫裡面的數據;
第三個特徵是實時性,就是要求數據到來之後,能夠實時在線進行分析處理;
最後一個特徵是價值,並不能簡單地理解為它是有價值的,因為現在的數據量非常的大,但在數據中蘊藏有價值的東西,相對來說比較少,需要細加甄別。
從大數據的價值來說,它能發揮怎樣的作用?
第一,最重要的作用是引起了整個社會對數據的重視。近年來,企業里從領導到員工,對數據在企業的發展中作用都提上了一個很高的高度,這就是思維模式的一個變革。
第二,以前由於信息系統不發達,存儲的數據是對歷史比較片面的記錄和展現。現在在大數據時代,信息採集的手段越來越多,能夠把日常的行為信息都保存下來,相當於記錄了一個人、一個組織、一個社會的歷史行為。我們說要學習歷史,學習歷史的目的是為對將來社會、組織和個人的發展提供指導。如果說數據已經把社會、企業和個人的行為數據客觀、全面的記錄了下來,我們就可以做通過大數據建模的方式把它給抽象出來,可以為企業、個人、乃至社會的運轉提供支撐。大數據最重要的功能就是做預測,它憑什麼能夠預測?就是因為他能夠從大數據中把蘊含的模式以模型的方式抽象出來,為將來的社會、企業、個人或者是各種需求來提供預測,提供幫助,這就是大數據最本質的東西。
說到大數據,我們再探討一下雲計算。
雲計算的核心技術包括:
第一是虛擬化;
第二是分散式計算;
第三是分散式存儲;
第四是多租戶。
雲計算包含公有雲、混合雲、私有雲,公有雲是每個用戶都可以來申請,比如說谷歌、百度、騰訊等企業的雲系統;
混合雲就是說既有私有雲,也有對公服務的;
私有雲就是指我們的數據只有自己的企業用戶進行分享,外部用戶限制使用。
總的來說,雲計算的主要目的是通過對硬體系統復用或者虛擬化的方式來提高數據的處理能力,這是雲計算的一個基本得出發點。
最後一個概念是物聯網。企業裡面有很多物聯網的形態存在,比如ID、二維碼、攝像頭、音頻終端等,主要這些具有感知能力的智能終端,能夠自動的採集數據,並把採集到的數據進行傳輸,進行分享,進而進行上層的處理。物聯網在現實生活中的應用還是非常多的, 比如智能交通的感知器、城市裡的攝像頭、微博、雷達等。
雲計算、大數據和物聯網代表了IT領域最新的技術發展趨勢,三者既有區別又有聯繫,可以概括為:
(1)從大數據與雲計算的關係來說,雲計算為大數據提供了技術基礎,大數據為雲計算提供了用武之地;
(2)從雲計算與物聯網的角度來說,雲計算為物聯網提供了海量的數據存儲能力,而物聯網為雲計算技術提供了廣闊的應用空間;
(3)從大數據與物聯網的角度來看,物聯網是大數據的重要來源,而大數據技術為物聯網數據分析提供了支撐。
作為企業來說,應該有兩點認識:
第一,企業數據就是企業的資產:企業有很多現有的信息化系統,每天在產生很多數據。這些數據要想辦法合理的把它組織和管理起來,要挖掘這些數據當中蘊含的價值,要發揮這些數據的價值;
第二,開闢新的數據源:在一些業務領域建造一些新的數據源,這些採集的數據一方面支撐日常業務運營,同時也積累更多的企業運營數據。這些企業數據涵蓋各個方面和流程,數據越豐富,越能反映企業運轉的軌跡,記錄企業運營發展的規律。可以通過大數據分析的手段,探查企業運轉的流程,看是不是最優的運行方式;也可以挖掘企業運轉的模式,為將來企業的進一步發展和有效的運轉提供決策支持。
所以,第一個點告訴我們要樹立數據即資產的認識,想辦法盤活現有數據;第二點強調開闢更多的數據採集渠道和來源,儘可能的挖掘、發揮大數據蘊含的商業價值,為企業發展所用。
04
新一代
國家人工智慧發展規劃
新一代人工智慧,是國家剛剛發布的《新一代人工智慧白皮書(2017)》。對物流企業來說,掌握國家的人工智慧發展趨勢,也是非常必要的。
人工智慧的發展,經歷了三次浪潮:
第一次浪潮最早在50年代到60年代中間,人工智慧剛剛興起,但由於當時的技術不足以支持人工智慧的發展與實際應用,後來停滯不前進入了低谷;
80年代以後,人工智慧又熱起來,這一次熱的原因是技術得到了解決,在這個階段大家耳熟能詳的一些技術,如BP神經網路等;
第三次浪潮出現很多新的技術,如深度學習等。在這一時期,技術得到了一個很大的發展,很多企業把這種技術投入應用,解決一些社會的實際問題,產生了顯著的經濟價值。
總的來說,這次浪潮要比前兩次的生命周期要長一些。為什麼人工智慧的第三次浪潮不像前兩次很快就過去了?主要得益於三方面的驅動因素:
第一方面的驅動因素是大數據,現在數據採集的手段積累了大量的數據,這種數據為人工智慧的發展提供了一個很好的基礎;
第二個方面的驅動因素是計算平台運算能力的不斷提升,促進了人工智慧的落地;
第三個方面的驅動因素是應用場景的不斷擴充。總的來說,國際人工智慧產業預計仍然保持一個爆髮式的增長,我國人工智慧對全球人工智慧產業發展起到一個重要的推動作用。我們的企業要抓住大數據與人工智慧的機遇。
感謝嘉賓的精彩分享,知行微講堂將持續為您帶來更豐富的學術交流,期待下次與您再會。
EBON
大健康產業精益供應鏈服務生態創領者


TAG:益邦控股 |