當前位置:
首頁 > 知識 > 國家、數據、治理:排列組合文字遊戲下的思考

國家、數據、治理:排列組合文字遊戲下的思考

韓亦舜:講到國家數據治理,難點、痛點、特點,有幾個方面:一是不想用數據;二是不會用數據;三是不願用數據;四是不敢用數據;五是不善用數據。

1月26日,清華大學數據科學研究院執行副院長韓亦舜先生在第三屆中國電子信息行業發展大會 - 國家數據與治理論壇上,圍繞國家「治理數據」、 數據「治理國家」、治理「數據國家」、治理「國家數據」做了主題為《國家,數據,治理》的演講。(本文內容根據速記整理)

我先說明一下情況,我是時隔28年後,於2014年又重新回到學校參與數據科學研究院的建立和運營工作。我其實不是學者,曾經在很多企業做過管理工作,沒有做技術。所以今天我把在過去四年不到的時間裡自己的一些觀察和思考和大家分享一下。但是有這樣前提:我所有演講當中的觀點,對的算清華的,不對的算我的;而且還有無限的時效性,現在大家不認同的算我的,以後證明說的對的算清華的。我準備有點倉促,一些照片來自於互聯網,我沒有加鳴謝頁。楊部長剛才專門註明了一些資料的出處,對互聯網上的一些知識分享表示尊重,所以我在這裡對引用於互聯網的資料表示感謝。

本次論壇的話題「國家數據與治理」挺有意義,觀察一下也有意思。我偷懶把自己的題目索性叫「國家,數據,治理」,我想放在一起討論,和大家分享一下我的看法。

可以說「國家治理」這個概念提出的時間不短了,具體提出的時間和背景我沒有深入研究,但是帶上「數據」這個詞的時間並不長。2011年美國任命了首任聯邦政府的CIO,大概從那時起,發達國家開始有自己政府的CTO、CIO或者CDO,把新興IT技術產生的大數據和國家治理聯繫在了一起。標誌性的工作是2013年八國峰會提出數據開放的憲章。我們國家2012年在中科院香山會議上已經開始有前沿的專家學者看到了大數據的發展趨勢,提出了國家要搞大數據。真正轟轟烈烈做起來是2014年,以貴州省為代表,推動大數據在全國受到關注,之後又上升為國家戰略。黨中央國務院的文件和會議都提到了大數據應該怎麼發展,提到了國家治理。

我的觀察:儘管我們現在貴州傾全省之力在搞大數據,中央也高度重視大數據的發展,但在國家數據開放道路上,我們還任重道遠,還有很長的路要走。這張圖中的數字來自於Global Open Data的組織。他們有一個數據開放程度排名,2013年中國排名36,2014年中國排名到了58,2015年中國排名90多了,2016年中國不去排名了。是不是有帝國主義埋汰我們不好說,這個排名可能在某種程度上體現了我們任重道遠。2013、2014年第一名是英國,2015年第一名是台灣,我不認為台灣的信息化比咱們做得更好,而且台灣很多東西比我們落後。但是政府數據開放方面做得好,可能是意識形態方面台灣更接近西方。我們不一定需要跟蹤某一個特定的排名,但是我們應該清醒地認識到這方面我們的挑戰還是蠻大的。

講到國家數據治理,難點、痛點、特點,有幾個方面:一是不想用數據;二是不會用數據;三是不願用數據;四是不敢用數據;五是不善用數據。

我們來玩一下文字遊戲,中國文化博大精深,國家、數據、治理可以有這麼多組合方式,有的意思接近,有的是不同的話題,我會挑幾個有關的話題來深談。

比如說:國家「數據治理」,數據治理是較早在企業界用起來的概念,特別是走在前沿的企業,會用到數據治理。但是真正講到國家「數據治理」,我理解是國家來把「數據治理」上升到國家的層面上。我們真的應該有一些目標,比如說數據質量怎麼確定,國家在數據活動中行使什麼樣的權力,這都是可能牽扯到在國家層面上推動數據治理的時候要思考的問題。但是我也想說,凡是牽扯到國家行使某種權力的時候,還應該有相應的監督。

數據治理從基層數據安全、數據架構、標準,到中層平台的搭建,到上面真正的數據價值的體現,到對業務的指導,不僅是對企業有效,對國家也是有效的。真正到了基層的數據質量好以後,才能真正談到國家的政策產生很好的效果。所以應該是這樣一個過程,我們現在缺乏高質量的數據,只有在數據質量有保證的情況下再加上一些數據挖掘的理念,最後才能真正讓國家的數據成為有價值的東西,成為今後在治理國家方面有所作為的資源支撐。

國家「治理數據」,以國家來治理所有的數據,這個話題比較懸,如果國家出面治理所有數據的話,這事得慎重考慮。我們今天還在繼續沿用政府比較大比較強權的思維,用這個思路治理數據該不該?用「大一統」的思維匯聚數據是否應該?今天一些大型國企參與了很多國家數據匯聚的工作,結果是拿著燙手的山芋,就是乾耗電,幹不了什麼事。原來是希望用數據監督,把公權力關在籠子里,最後變成了把數據關在籠子里,這是挺大的挑戰。

數據「治理國家」,我們原來說的國家治理也好,治理國家也好,是同義詞或近義詞。真正基於數據來參與國家治理,還有很多問題和挑戰。數據怎樣產生價值?可以總結為三句話:總結過去,優化現在,預測未來。我們是不是真正這麼做了?過去的數據是不是充分運用好了?今後應該採用哪些數據?談到打破數據的壁壘,過去有一些東西是由當時推動信息化又沒有大數據意識造成的。

今天特別是在座的IT公司,不要以為大數據時代來臨,就覺得自己是天然的大數據的領軍企業。有的時候人在大數據時代,思維還是傳統的思維方式,認為自己的數據內部可以用,但是對外還是一個獨立王國,不能把數據共享。講到數據共享,我當然不是說所有的數據都應該共享。應該有目的地逐級推動數據開放與共享。可以反過來想像:如果每個公司都是壁壘,每個公司都在爬取同樣的數據,會產生大量的數據冗餘,無論是社會資源的佔用還是最後產生的社會價值,都會是巨大的損失。這需要觀念的改變,另外還有數據思維和數據制度。

我舉一個貴州的例子,在貴州這樣一個相對偏遠和欠發達省份推動大數據實在不容易,可喜的是有一些方面確實走在了全國的前面,我要為貴州站台,為貴州發聲。貴州做精準扶貧,能夠把這麼多數據彙集在一起非常不容易,也發現了一些問題:一些被幫扶的對象,用其他渠道的數據進行對比時,發現了異常。有人會爭執,誰的正確?依我看恰恰這個時候我們就是要利用差異發現我們工作當中的問題,真實的數據應該說只有一個,為什麼不同組織裡面,不同的機構裡面記錄的數據不一樣?再有,有人提出精準扶貧到個人,把這麼多數據彙集在一起,會不會牽扯到隱私問題?我們很多時候要換個角度,從國家的理念從公民的理念來想問題,今天扶貧是用納稅人的錢體現國家公平正義。這時候被幫助的對象應該有這個意識,被幫扶的前提是要讓度出一些個人關於財產方面的數據,證明你沒有欺騙國家,沒有欺騙納稅人,才能獲得幫扶。

治理「國家數據」,國家各種各樣的數據怎麼用起來?也是貴州的例子,這兩個圈是是這樣來的:我在貴陽講課的時候,規模好像比現在會場還大一些,講數據孤島,我說你們來說一下你所在的部門,你的工作需要誰的數據?誰的數據跟你分享之後對你工作有幫助,另外你覺得你的數據會對別人有哪些幫助?問卷收上來,加以整理和可視化,於是形成這樣的兩個圓。邊上一圈文字都是政府委辦局的名字,這邊是需求,那邊是供給。中層幹部中也蘊含著很多願意把數據拿出來分享和需要別人把數據分享過來,這是一個我們推動治理「國家數據」很好的基礎,不是簡單說今天數據開放,明天所有的公民都知道政府的機密數據了,而是一個層次一個層次上逐漸把數據的價值釋放出來。

治理「數據國家」,我在想,真正到了所謂的數據化時代,這個時候怎麼治理國家,涉及到很多問題,比如說新的法律問題,我們想像一下,過去的很多東西在今天不適合了,過去一個產品屬性和功能在離開工廠的時候,大致定了。今後出來一個人工智慧的產品,可能在離開工廠到了消費者方面隨時還在學習、在思考,有自己的價值觀和決策能力,這個時候責任誰來負?這是新問題,還有怎麼樣建立新的公序良俗。前不久發生高鐵擋車門事件,大家都很氣憤,但是不能因為她做錯了就人肉她,在今後數據化時代大家都會鄙視甚至懲罰人肉別人數據的人。

這張圖我想大家都不陌生。想像一下,今天我們在這邊,數據時空隧道的那邊是什麼?我們不知道。但一定是充滿機遇與挑戰。

我從兩個層面做總結,來結束我今天的演講。第一個危言聳聽些。大家也知道「我消滅你,但與你無關」、「升維思考,降維打擊」等這些新提法。其實這已經不是所謂的危言聳聽了,如果我們不進步、不發展,可能會在完全不知情的情況下被別人消滅。

第二個前途是光明的。我們每個人如果能夠做出一點自己的貢獻,把現在的數據用好,把接下來數據價值提高,用科學的方法決策的話,加速前進的話,一定會對我們實現中國夢有幫助。

謝謝大家。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 數據派THU 的精彩文章:

清華劉知遠:教你用HowNet在深度學習時代搞事情
8800個機器學習開源項目為你精選TOP30!

TAG:數據派THU |