信息孤島等三大問題亟待解決
經濟日報原標題:發展大數據還有啥問題
近日,在有關部門的調解之下,菜鳥和順豐的「數據斷交」事件總算告一段落,雙方經過緊急會談後,再次恢復了數據傳輸合作,算是和平解決。這次事件暴露出了大數據發展中的數據共享難題,但只是大數據種種問題的冰山一角。當前,我國大數據產業正處於起步階段,信息孤島、技術不足、人才缺失等都成為產業發展中亟待解決的大問題。
數據孤島問題突出
「巧婦難為無米之炊。」大數據的基礎在於數據,數據的生命在於共享,拿不到底層的數據,數據分析也就無從談起。如今,數據孤島林立、融合困難,已經成為政府與企業面前的首要難題。
「第一個問題就是沒數據,理論上我們中國有很多數據,但實際做數據分析會發現非常困難。」中國科學院院士、北京大數據研究院院長鄂維南表示,數據孤島是一個嚴重的問題,不同部門的數據儲存在不同地方,格式也不一樣。大數據最高的層次就是用數據來形成智慧,使得社會各方面可以運轉起來。做數據分析先要整合數據,這本身就是研究的困難。
由於政府部門之間、企業之間、政府和企業間信息不對稱、制度法律不具體、缺乏公共平台和共享渠道等多重因素,導致大量政府數據存在「不願公開、不敢公開、不能公開、不會公開」的問題,而已開放的數據也因格式標準缺失無法進行關聯融合,形成孤島。
缺乏動力和擔心安全是阻礙數據共享的另一個主要原因。貴陽大數據交易所執行總裁王叄壽透露,不少企業以保護商業機密或節省數據整理成本等為理由,不願意交易自身數據。部分政府部門也缺乏數據公開的動力:有的是因懶政而讓數據沉睡,有的則是已經利用數據開展商業化應用,因此不願共享。
「數據孤島的痛不是技術問題,是利益問題,背後隱藏的利益導致了數據孤島的產生。」鄂維南坦言。
對於如何打通數據孤島,工信部賽迪研究院軟體所所長潘文建議,要建立完善大數據發展協調機制,加快政府數據開放共享,穩步推動公共數據資源開放。同時,統籌規劃大數據基礎設施建設,推動制定公共信息資源保護和開放的制度性文件,並加強大數據標準化頂層設計,逐步完善標準體系。
在數據共享的路上,2015年成立的貴陽大數據交易所已經做出了成功的嘗試。王叄壽表示,若想打通城市現存的信息壁壘,就要讓城市多方資源聯動起來,搭建城市數據共享的平台,從而激活大數據價值,充分發揮數據資源整合的優質效應,用信息化手段輔助科學決策。
底層技術差距很大
即便解決了數據共享問題,數據可供隨時取用,數據的採集和分析仍是主要挑戰。微軟大中華區董事長兼CEO柯睿傑認為,數據智能並非那麼觸手可及。大數據來源眾多、數量巨大、形式各異,要從中獲得一目了然的信息,就需要真正高效、可靠的數據管理和分析平台。
如何處理巨量數據是中國大數據產業面臨的首要技術問題。鄂維南表示,「中國的數據體量特別大,比如,中國的視頻比任何國家都要多,這些數據儲存困難,需要用的時候往往就沒了」。再以基因測序領域為例,中國每年新增的基因組測序原始數據超過20PB(1PB相當於100萬GB),面臨著數據量大、數據處理流程長等技術挑戰。
另一方面,數據分析本身也是一個難題。大數據中,絕大部分屬於非結構化的數據,它們大量存在於社交網路、互聯網和電子商務等領域,這些數據的不確定性表現在高維、多變和強隨機性等方面。股票交易數據流就是不確定性大數據的一個典型例子。這些都需要通過包括數學、經濟學、社會學、計算機科學和管理科學在內的多學科交叉來研究和討論。
目前,我國大數據技術創新能力還有待提升。《大數據產業發展規劃(2016-2020年)》指出,我國在新型計算平台、分布式計算架構、大數據處理、分析和呈現方面與國外仍存在較大差距,對開源技術和相關生態系統影響力弱。同時,大數據應用水平不高。我國發展大數據具有強勁的應用市場優勢,但是目前還存在應用領域不廣泛、應用程度不深、認識不到位等問題。
「雖然我們在應用上不落後國外,但是在底層技術上和國外差距特別大,技術都來源於谷歌等國外大公司。」國務院發展研究中心信息中心研究處處長李廣乾說,很多時候我們的商業模式走在了技術前面,並沒有通過技術手段來推動創新。
對此,潘文表示,國家層面要支持大數據共性關鍵技術研究,加強海量數據存儲、數據清洗、數據分析發掘、數據可視化等領域關鍵技術攻關,並支持自然語言理解、機器學習、深度學習等人工智慧技術創新。
專業人才短缺嚴重
近年來,我國大數據產業發展進入爆發期,由於成熟的人才培訓體系尚未建立,直接導致人才短缺的問題日益突出。「我們面臨的最嚴重的問題就是應用場景和人才的問題,應用場景的問題是需要時間,人才問題是我這麼多年來碰到的最嚴峻的問題。」鄂維南說。
人才不足限制了大數據產業創新發展的成效。清華大學計算機系教授武永衛透露的數據顯示,未來3至5年,中國需要180萬數據人才,截至目前,中國大數據從業人員只有約30萬人。LinkedIn(領英)發布的《2016年中國互聯網最熱職位人才報告》則顯示,數據分析是當下中國互聯網行業需求最旺盛的6類人才職位之一。
同時,大數據行業選才的標準也不斷變化。初期,大數據人才的需求主要集中在ETL研發、系統架構開發、數據倉庫研究等偏硬體領域,以IT、計算機背景的人才居多。隨著大數據往各垂直領域的延伸發展,對統計學、數學專業的人才,主要從事數據分析、數據挖掘、人工智慧等偏軟體領域的需求加大。
在高端人才稀缺的現實情況下,企業多選擇從海外和傳統行業挖掘跨界人才,但仍然無法滿足國內市場的大量需求。針對大數據人才供應不足的現象,各種培訓機構和各大高校也開始強化大數據人才的培養。但培養大數據人才需要時間,在短期內對於大數據領域的高端人才仍然會呈現出供不應求的現象。
值得注意的是,今年3月份,教育部公布了第二批獲准開設「數據科學與大數據技術」的高校名單,加上第一批獲批的北京大學、對外經濟貿易大學、中南大學,一共35所高校獲批開設該專業。今年開始,部分院校將招收第一屆大數據專業本科生。
對於大數據人才建設,潘文表示,要建立適應大數據發展需求的人才培養和評價機制,並建立健全多層次、多類型的大數據人才培養體系。同時,還要完善配套措施,培養大數據領域創新型領軍人才,吸引海外大數據高層次人才來華就業、創業。(經濟日報·中國經濟網記者 王軼辰)
※法國旅遊業明顯回暖 中國遊客增長幅度最大
※網友熱評「增強消費自信」系列評論:我要買國貨,大聲說出來
※從穆加貝「賣牛」看非盟自力更生之路
※唱國歌,也要依法
※廣州高新區讓「IAB」產業落地生根開花結果
TAG:中國經濟網 |
※口吃問題解決方案
※解決問題的途徑
※東三省經濟發展根本問題仍有待解決
※口吃問題解決寶典
※小偏方解決大問題 咳嗽篇
※瑜伽眼鏡蛇式中的兩大問題解決方案
※關於「解決問題」的思考
※安倍有信心要解決北方四島問題,普京一句話一動作表明態度!
※終於找到解決騎士疲軟問題的關鍵,快船一球星能解決所有問題
※解決四大辦公問題的高效神器,讓你遠離腰頸痛
※如何解決婆媳關係問題
※如何解決大肚腩的問題
※柑普常見十大問題解答
※四大幼兒常見心理問題及解決辦法
※一招解決口紅粘杯的問題
※蘋果公司申請新專利 試圖解決鍵盤灰塵污染問題
※歷代封建王朝難以解決的七大問題,無人能解
※強大自己是解決問題的唯一方法
※蘋果公司申請了新專利 試圖解決鍵盤灰塵污染問題
※馬雲談電競申請入奧 仍有問題需要解決