當前位置:
首頁 > 最新 > 我國各行業數據總量的估計

我國各行業數據總量的估計

大數據時代,如何統計我國目前數據資源現狀。各行業都哪些數據,各種數據的總量是多少?

統計工作基於基礎數據資料,在直接數據不完備的情況下採用間接數據測算是一個辦法。下面解釋下我對了解我國數據現狀的一個思路和初步結論。我國國民經濟行業分類有20個大類和94個小類。簡便起見我基於主要大類進行討論。

一、農林牧漁業。整體信息化程度滲透很低。數據來源主要是大規模養殖場的監測數據,包括牲口的體重、體溫、進食量等生命活動數據。數據記錄低於KB級、採集頻次為日。為簡便運算,農林牧漁業整體按照每億元增加值1GB數據量估計。

二、工業。數據來源於一是工業生產過程產生的數據,二是工業產品銷售後的回傳數據。傳統工業數據主要是第一類數據,第二類數據主要是類似三一重工等裝備生產企業銷售出的裝備的回傳數據。工業數據的特點是數據記錄低於KB級,採集頻次為分鐘。為簡便運算,工業整體按照每億元增加值1TB數據量估計。

三、建築業。一是建築的三維設計BIM數據,二是智能建築的採集數據。一類數據的規模是GB級別,一個新建建築一套BIM。二類數據記錄是KB級別(溫度、壓力、出入人流等)或者MB(圖像),採集頻率為分鐘。為簡便運算,建築業整體按照每億元增加值1GB數據量估計。

四、批發和零售業。主要是零售交易數據,而無論是電商還是超市,目前基本實現交易記錄電子化了。數據記錄是KB級別,假設每100元交易額產生增加值1元,生成一個交易記錄。

五、交通運輸、倉儲和郵政業。和批發零售業類似。數據記錄是KB級別,假設平均每1000元運輸額產生增加值1元,生成一個運輸或者快遞記錄。

六、住宿和餐飲業。訂餐數據和「開房」數據。數據記錄是KB級別。假設平均每100元服務產生增加值10元,生成一個運輸或者快遞記錄。

七、金融業。數據記錄是KB級別。假設平均每10000元金融交易產生增加值5元,生成一個金融交易記錄。

八、房地產業。類似金融業。數據記錄是KB級別。假設平均每100000元地產銷售服務產生增加值1000元,生成一個金融交易記錄。

九、信息傳輸、軟體和信息技術服務業。大約有8億網民,每人每月產生100MB數據,主要是用戶上傳的照片和視頻數據,少量行為日誌和留言數據。經過電信網的信息傳輸通道,最終到達並存儲在互聯網平台上。電信和互聯網平台系統本身運行產生數據忽略不計。

十、公共管理、社會保障和社會組織。主要是市政、交通監控攝像頭圖像記錄和針對法人和自然人的數據記錄。全國293各地市大約有市政交通攝像頭293萬個,每個攝像頭日均數據量100MB。全國法人1800萬,自然人14億,每法人每年產生數據記錄100條,每自然人10條,數據記錄是KB級別。

十一、其他。包括租賃和商務服務業,科學研究和技術服務業,水利、環境和公共設施管理業,居民服務、修理和其他服務業,教育,衛生和社會工作,文化、體育和娛樂業,國際組織等。暫不一一測算,根據增加值佔GDP比做估算。

這樣測算下來總計我國各行業年數據產量是1EB左右。這裡指新產生數據,不包括複製轉發的數據量。

這是一個很粗的估計方式,結論遠達不到精確的要求。如果通過採樣調研對以上假設的參數進行修訂,並且對細分行業分別進行測算,那麼數據將逐漸精準。問題的求解就如打開百度地圖裡的遙感地圖,首先呈現的是較為粗粒度的圖片,然後隨著精細圖片的下載完成,呈現的地圖上的細節會越來越豐富。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 扣扣之家 的精彩文章:

TAG:扣扣之家 |