當前位置:
首頁 > 最新 > 時空網格,「智慧城市」大數據時空融合的密碼

時空網格,「智慧城市」大數據時空融合的密碼

作者:李振宇

編輯:洪月月 郭晶晶

上一篇從哲學時空觀和認知論的角度討論時空大數據與人工智慧,以及時空網格作為數據組織手段的應用方法。本篇討論一下,如何利用時空大數據方法,構建智慧城市中的「時空基礎設施」。


國家發改委和中央信息辦在智慧城市建設規劃中,將「時空基礎設施」建設的組織任務分配給(原)國家測繪地理信息局,很多城市啟動了「智慧城市時空大數據與雲平台」項目。

在《智慧城市時空大數據與雲平台建設技術大綱(2017版)》中,明確:「時空基礎設施作為智慧城市的重要組成,既是智慧城市不可或缺的、基礎性的信息資源,又是其他信息交換共享與協同應用的載體,為其他信息在三維空間和時間交織構成的四維環境中提供時空基礎,實現基於統一時空基礎下的規劃、布局、分析和決策。」

對以上目標,筆者完全認同。同時,筆者認為——

在「信息資源提供」和成為「交換共享與協同應用的載體」兩者之中,後者更為重要,時空作為數據融合共享的載體是天然的。

我們一起剝絲抽繭,討論一下時空大數據在智慧城市中的應用模式。


關於「大數據」的描述,筆者認同Teradata首席分析專家Bill Franks在《駕馭大數據》中表達的觀點:沒有一種數據叫做「大數據」,「大」和「數據」都不重要,使用數據的方法才重要。我們無需爭論哪些數據屬於大數據和時空大數據,所有的數據都在時空中,也都是大數據,只要用大數據的方法去使用。

收集和使用數據的方法取決於需要解決的問題,我們把工作任務分為兩類,一類是事務性任務,需要精確採集、記錄事實信息和處置過程,比如土地所有權發證、工程測量、辦理銀行存款、電子商務交易;一類是決策類任務,例如土地規劃、應急指揮、營銷策略制定等,需要收集多維度數據進行綜合分析。

大數據的應用目標是支持決策類任務,而非事務性工作。事務性工作是數據產生的源頭,其積累的數據成果,經過抽取、融合後方可成為支撐大數據分析的輸入。大數據分析不必、也不能直接面向原始業務數據。

順便說一下大數據和雲平台的關係。雲平台的本質是計算資源和存儲資源的虛擬化,是大數據實施的適宜支撐環境,但非必須。雲平台能力並不等同於大數據能力,兩者的關係類似於「結婚和買房」。

02.數據融合,是時空大數據的核心能力

智慧城市首先強調數據共享,各地紛紛成立「大數據局」彙集數據,此舉就可以消除「信息孤島」了嗎?一位資深地方信息中心主任半開玩笑地說:以前是「煙囪式」的數據調用,現在將一堆煙囪捆在一起集中排放,污染更加嚴重。

數據如果無法融合,共享便失去意義。

數據融合有兩種,一種是以人為線索。比如,將一個人在公安、社保、工商、稅務等多個部門的數據打通,實現信息互通。這是辦公流程的優化,事務性工作的效率提升,嚴格講不屬於大數據的範疇。在商業大數據領域,通過人的行為數據進行「客戶畫像」,制定個性化的營銷策略,應屬於大數據應用範疇。

另外一種融合,便是時空融合,目的是支撐城市管理者的時空決策,例如:土地規劃、產業布局規劃、交通治理、環境治理、應急指揮等等,基本邏輯是「何時、何地、何為」。時間和空間即是所有數據的共同特徵,又是所有智能的基礎,基於時空的數據融合是必然途徑。

數據融合需要線索,在商業大數據中,圍繞著「人」為線索形成「客戶畫像」;在時空大數據中,需要定義「地理實體」進行數據融合,形成「地理畫像」。


在《智慧城市時空大數據與雲平台建設技術大綱(2017版)》中,明確要求建設「地理實體」數據:以地形圖為基礎,對境界、政區、道路、水系、院落、建築物、植被等內容進行實體化,並賦予唯一編碼,作為與其它行業和專題數據進行關聯的基礎。

地理實體是佔據一定空間的地物或者現象,地理實體定義及編碼的目標是「通過編碼交換空間信息」,交換的內容是指附著在空間上的屬性信息,例如土地性質、人口統計、經濟指標等等。實施的關鍵是:建立編碼與空間範圍的對應關係並使之成為統一標準,例如全國統一的郵政編碼和行政區劃。

編碼是溝通效率最高、不易產生歧義且管理效率最高的手段,比如身份證號、樓棟號、學籍號、地類代碼等。用編碼代表空間範圍也是一種常用手段,如標準圖幅號、投影帶號、電話區號等。

用地理編碼作為數據的空間關聯線索,可以避免多尺度、多投影、多格式地圖數據整合所帶來的繁瑣工作。

但是,空間單元本質上是業務管理單元,每個部門都有各自的單元劃分和編碼標準,並在業務運行和信息系統建設中貫徹執行。郵政部門劃定郵政編碼、教育部門劃定學區、交通部門劃定道路分段、國土部門劃定地塊、城管部門劃定城管網格、公安部門劃定片警轄區……。

不同領域的空間業務單元劃分差異性很大,互不相容,不可能設計出一套適合所有行業的劃分規則;即使存在完美方案也難以推廣,會涉及業務規則調整和信息系統重建,統一的、唯一的編碼無從談起,將編碼作為數據關聯線索也就無法落實。

在「大數據局」模式下,各部門提交原始業務數據,必會由數據規格多樣而帶來數據融合困境,「煙囪」依舊;而制定一個統一空間標準,強制推廣到各個部門,業務規則衝突必然導致障礙重重;只有在所有業務的底層,設計一個共同的融合架構,才可能從根本上解決數據融合的問題。


有沒有一種方法,既不改動各領域的業務單元劃分,又能夠實現「通過編碼交換空間信息」的目標呢?

答案就是基於空間網格的地理實體定義和編碼方法。

第一步,設計一套全域覆蓋的多級基礎空間網格,並賦予唯一編碼。

設定最小網格尺寸,按四叉樹逐級向上合併生成上一級網格,網格編碼作為網格在計算機中的存儲形態。

第二步,用網格集合定義地理實體,網格集合編碼作為地理實體編碼。

不同行業,不同尺度的地理實體,選擇不同層次的網格集合來定義。例如:用1米網格記錄建築物信息,用2米網格記錄土地利用現狀,用100米網格記錄人口數量,用1公里網格記錄空氣質量,用5公里網格記錄氣象信息。

地理實體編碼由所覆蓋「基礎網格編碼」組合生成,最完整的編碼是把所有覆蓋網格的編碼連接在一起,也可進行編碼壓縮避免過長。這樣,解析編碼即可獲得地理對象的組成網格,進而獲得地理實體的覆蓋範圍。如下圖示意,可根據需要的空間精度選擇合適層次的網格,網格越小,編碼越長,也越接近原始精度。

事實上,在大數據應用中,並不需要原始精度的業務數據,也不需要原始數據的完整內容,而是根據應用分析和決策支持的需要進行抽取和簡化,而空間網格是空間簡化的適宜方式。如果需要原始數據,通過網格索引調用即可。

由於編碼只與地理實體的覆蓋網格有關,而與業務內容無關,此編碼可自動生成;同一領域的業務單元劃分在空間上不重疊,編碼的唯一性可以保證;當某一領域的空間業務單元調整時,數據共享融合系統無需改動。

如用戶的數據為GIS數據,解析圖形即可獲得編碼;如用戶數據為表格數據,解析其中地名地址信息即可生成編碼,只需提前生成標準的地名地址網格編碼;對於智能感知數據,也可選擇合適的網格級別進行空間化標定。

通過一個輕量化的數據抽取工具,對接到不同行業的業務系統中,即可以自動生成形式為「地理實體編碼+屬性數據」交換數據,由於所有地理實體基於相同的基礎空間網格生成,基礎網格是不同地理實體溝通的橋樑,各種空間分析可利用「編碼計算」完成,利用地理編碼進行多源異構數據的共享、交換、協同和融合得以實現。


在李德仁院士的論文《從數字地圖到空間信息網格——空間信息多級網格理論思考》(2003)中,明確指出:「空間數據種類繁多、數據格式各異、存在多種比例尺、多種空間參考系和多種投影類型。這給需要使用空間數據的用戶帶來了很大的困難,不利於空間信息的共享。究其原因,主要在於GIS是面向空間數據,特別是地圖數據的,而不是直接面向空間信息的。」 空間信息網格使空間應用直接面向空間信息,走出地圖的束縛。

智慧城市時空大數據平台需要建立基礎空間網格,作為空間基礎設施;將連續的時間離散化,形成多尺度基礎時間網格,是以時間為線索進行數據檢索和融合的基礎框架;還需建立標準的地名地址網格對象,是地名地址空間範圍的網格表達,是基於基礎空間網格的公共網格集合。「基礎時空網格+地名地址網格對象」組成了智慧城市「基礎時空框架」,是大數據時空融合的底層支撐。

基礎時空框架與具體數據無關,網格劃分是靜態的,不會因城市擴張、行政區劃合併、撤消、分割等情況而改變,不同時間的信息網格具有空間可比性,可方便地進行時序分析。同時,各種量化的統計指標都基於共同的基礎時空框架,也便於不同行業的統計數據進行時空對比分析。

從不同行業資料庫中抽取出來的網格數據彙集到一起,形成了「時空網格數據倉庫」。數據倉庫是面向決策過程的、面向主題的、集成的、穩定的、不同時間的時空網格數據集合,是實現時空決策分析的數據基礎和支撐環境。在數據倉庫之上,構建若干時空決策分析服務,形成支撐智慧城市時空大數據決策支持分析的完整架構。

在基礎時空框架的支撐下,時空大數據平台可提供基於網格的公用基礎數據資源;各行業之間在框架內基於網格交換信息;更重要的是,有共同基因的網格數據匯聚到一起後,智慧城市的各項時空決策得以高效務實地進行。


智慧城市時空大數據與雲平台建設中,數據類型和數據範圍擴展以及運行環境的雲平台升級,僅完成了「基礎信息資源提供」的目標,而利用時空網格體系構建基礎時空框架和數據倉庫,突破數據融合瓶頸,才能成為「交換共享與協同應用的載體」,實現「基於統一時空基礎下的規劃、布局、分析和決策」,才能稱得上智慧城市的「時空基礎設施」。

時空大數據系列二,未完待續

時空大數據系列一:

借著霍金離去,談談時空大數據與人工智慧

掃碼進入大會官網

精讀


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 泰伯網 的精彩文章:

年報解讀:天寶營收增長12%達26.5億美元,收購10起布局新興業務
北斗地圖APP,一場鬧劇!

TAG:泰伯網 |