我們有多少種方法預測未來以及我們有個什麼樣的未來
本文為北京城市象限科技有限公司創始人兼CEO、北京市城市規劃設計研究院雲平台創新中心秘書長茅明睿在中國城市規劃設計研究院學術信息中心首屆業務交流會上做的報告,感謝作者授權發布。
報告的名字是標題黨,我不知道怎麼預測未來,但我更想和大家分享的是作為一個城市數據的創業者在創業近兩年時間的心路歷程。報告名字中的「我們」是一個限定詞,指的是城市數據師,也是中規院在最近一年中大力推動的城市大數據的工作,在座各位都是在做和我相似的工作。那麼,我們說的第一個問題是我們到底有多少種方法預測未來?
一、有多少種方法預測未來
(一)靠讀心
當我們能揣摩每一個人大腦里、心裡在想什麼的時候,就能預測他們下一步要做什麼。很典型的例子如X博士具有讀心技能,這是簡單的預測人的行為的方法。當然我們也發現,現今的科技也在試圖通過人的微小行為去揣摩他的心理,比如眼動儀。我們可以通過觀測一個人眼睛在看什麼,去了解這個人對什麼感興趣,會被什麼所吸引,從而進一步了解人在什麼場景下會選擇什麼行為。事實上,這就是我們說的靠讀心行為預測未來。
但是我更想說的是心理史學。斯璀璘大學教授哈里謝頓發明了心理史學,它融合了數學、歷史學、社會學、統計學、社會心理學、氣象動力學等多個學科的知識,並認為如果我們可以積累社會歷史發展的所有數據,就可以像氣象動力學一樣去進行整個社會的推演。當然,教授表示對於微觀個體的行為無法預測,但對於人類社會的發展是可以在一個宏觀尺度上進行預測。這是阿西莫夫的著名小說《基地》的情節。
(二)靠試錯
假如我們能把人類的每一種選項都試驗一遍,那我們就知道自己應該選擇哪一項。有兩部很好的相關電影,其中《蝴蝶效應》有很多次穿越,主人公可以選擇很多人生;另一部電影比較小眾,叫做《無姓之人》,圖片是電影中經典一幕:小朋友的父母離婚後,他在爸爸的注視下望著媽媽乘坐的火車遠去,自己正在為以後的人生選擇一條什麼樣的道路做打算。電影中對小朋友的設定是他會記得他的前世,在這一刻,這個小朋友回顧自己所有的前世,做了一個今世的選擇。
(三)靠打造
預測未來的最好的方法,就是去打造未來。像康巴什這樣的新城,現在的任何大數據和演算法可能都無法預測未來會憑空產生這樣一個大型新城,但我們可以把它造出來。
(四)靠玄學
靠玄學是我最想敘述的一項,如水晶球、塔羅牌。玄學在中文中有占卜一詞可以表達。「占」原意為觀察,指我們在預測未來中的法則、圖譜,預測圖式和理論規則;「卜」是指實施方法,原意為用火灼燒龜殼;占卜就是指我使用什麼樣的工具、實施方法去實現知識圖譜。占卜有很多「卜」的方法,在西方有水晶球等;茶卜是中西通用的,是通過解讀茶漬的來占卜吉凶;在中國我們有龜殼、錢幣、求籤、還有風水羅盤,八卦圖、奇門遁甲。西方的占星術與中國的奇門遁甲的形式是很相近的,東西方都有關於星象的知識圖譜,通過星盤看事態的運勢吉凶。
當然占卜除了預測還能用於化解和運籌。比如香港屋頂上的這門炮,是以用「大炮」(升降機)化吉凶;台灣居民樓對著形狀如虎口的政府大門,所以在窗戶上架很多弓箭來化解。以上講到我們一直都有方法去預測未來和干預未來,由此得出以下結論:
結論一:統治階級自古以來都很重視預測並不是有了大數據、人工智慧我們才開始重視預測;
結論二:統治階級不是因為尊重科學了才對大數據、人工智慧趨之若鶩,他們歷來都很重視預測,原因是他們心虛,需要有個東西讓決策心安,這才是政府追求大數據、雲計算、人工智慧這些新概念的真實原因;
結論三:規劃師跟風水先生的差別在哪兒?領導聽後者的,不聽前者的。
所以做城市數據師的好處是,能讓我們從提線木偶變得有機會「向權力講述真理」,僅僅是有機會……
二、同樣是搞大數據為什麼他們和我們如此不同?
此處的「他們」是指同樣搞大數據的大多數智慧城市企業、互聯網企業、IT企業等。我創業1 年多以來一直對自己是不是在搞大數據感到很迷惑,因為我和他們說的話完全不同,似乎不是一個圈子的。
(一)話術體系
我總結了一下相互的區別:對於我們從規劃圈子出來的城市數據從業者來說,我們致力於把問題講清楚,靠解決問題賺錢是關鍵,不管我們有沒有能力把這個問題講清楚,最後我們總是會把問題解決掉。但對於那些IT、互聯網企業來說,他們是要把問題說複雜,靠讓人不明覺厲賺錢。這是兩種截然不同的創業方式。比如過去的風水先生,他們是怎麼忽悠客戶的呢?他們會對客戶講元亨利貞、奇門遁甲、六爻八卦、紫微斗數、他們有一些別人不會用的占卜工具,如龜殼,牛股,水晶球,風水羅盤等。現在,我們同樣發現會有一些體系,如城市大腦體系、城市神經系統、XX慧眼體系,他們首先會發明一個新穎的概念,包裝一些術語,比如貝葉斯、向量機、隨機森林、卷積神經網路等等。接著告訴客戶通過一些大數據的高級工具,比如Hadoop,Spark,Hive,Storm可以實現那些高級演算法的運算,從而解決預測問題。客戶會認為你很厲害,你會用我不會用的工具、你會用我不會用的演算法、你會講我不了解的名詞,所以客戶上鉤了……回顧歷史,當下的「他們」和過去的風水先生沒有區別,都是通過製造一套話術體系讓客戶蒙圈,不明覺厲掙錢。
但是這種話術掙錢的方式可持續性不強。他們走了一段時間掙了一些錢之後發現這條路並不好走:客戶發現自己付費後,問題並沒有被解決,交通該堵還是堵、人民的生活品質沒有顯著提升、外來勞動者還是沒有歸屬感、公共服務水平也沒有提高等等,於是一個新的要求出來了——要讓市民有更多「獲得感」。
(二)城市新名詞
我們的智慧城市從2008年以來已經走過了智慧城市1.0、智慧城市2.0,現在又想要發展新型智慧城市,為什麼?因為要和過去的「我」做切割,也就是「他們」要換一種概念繼續不明覺厲的掙錢。如此下去這條路會一直走放到9.0,以後還會發展成真新型智慧城市、超真新型智慧城市……為什麼有這麼多新名詞?因為他們不從內容出發,不從解決問題出發,而從概念出發、從讓人聽不懂出發、以販賣技術和硬體為目的,那麼所謂的「獲得感」或者真實的問題永遠也解決不了。
這就給了規劃師機遇,因為我們是解決問題的,而他們是兜售技術。同樣在大數據圈子創業一年多,我從來都試圖不用任何技術術語去告訴顧客怎樣解決問題,而是用邏輯推理去告訴客戶事情解決的步驟與預期。正是因為領導關注的是「預測」,所以我們對城市的理解,對數據的理解和對未來的塑造能力給了我們在產業鏈中的立足之地,這是我們的機遇。
三、規劃師該怎麼預測城市未來和塑造城市未來?
(一)規劃傳承
這是我們要解決的重要問題。我們是有傳統的,過去的傳統是經過反覆的實踐和經驗積累來實現的。過去,規劃師做了十年以上,基本拿捏問題都是八九不離十。所以,這種方式需要老師傅帶徒弟式的傳承和數十年如一日的匠人精神。這就是我們過去城市規劃的範式——基於經驗的城市規劃。如果一個規劃師在規劃院工作十年以上做到院長了,這個規劃師說出來的東西一般都不會差到哪兒去,可能梳理邏輯有點問題,但內容都沒有錯。
(二)潛在問題
但是這會出現一個問題:人的壽命是有限的。一個越有經驗、越成功的規劃師意味著他能服務的年份越來越少;可服務於工作的、壽命越長的規劃師,往往經驗很少,這意味著我們的知識很難傳承。所以規劃師的壽命限制了規劃學科和技術的發展,我們學科的發展依賴於人均壽命的提升。也因此規划行業的報告、文章喜歡擺老祖宗、講道統,比如考工記、霍華德、雅各布斯、花園城市、雅典憲章;而計算機學科是相反的,計算機學科是基於數理知識的,不依賴於師傅帶徒弟的傳承,而是顯性知識體系,所以我們很少看到計算機、人工智慧的研究報告和文章里擺出圖靈或者馮諾依曼來顯示自己的研究遵從了大師,繼承了正確的道統。
這也給了我們一個機遇,城市數據師能幹什麼?我們試圖去推動一個基於數據科學的城市規劃方法論,讓規劃知識顯性化、可量化、可沉澱、易評估、易修正、可持續、可跟蹤。這個新方法論也許會形成「觀測-認知-建模-應用-反饋-優化-前饋」的範式,首先要實現對世界的觀測從而形成新的認知體系,接著對這個體系進行建模,進而應用模型、形成反饋、完成優化,以及通過大量的公共政策和規劃項目的跟蹤與收集,最終實現城市規劃的前饋,也就是真正的模擬和預測。
(三)城市規劃與計算機的預測
在上述規划過程中常會提到一個詞——預測。規劃師與數據科學所做的預測存在較大區別。我們常說的預測在計算機學科中被叫做模擬或模擬,對方所做的預測實際上是我們的外界變數不發生變化時會怎麼樣。城市規劃所作的預測是當我們頒布了一個規劃措施或公共政策進行現實世界的調整時,城市會怎麼樣。其實我們說的更多的是公共政策的響應。
(四)沒有方法論 新區怎麼搞
那麼這當中就會有一個難點,其實我們並不存在這樣一個方法論。這個方法論中更大的難點就是新區怎麼做?新區規劃不僅沒有方法論還沒有數據。那麼對於新區,我們一般只有兩三種方法。
第一,案例研究。我們做的是A,但由於A沒有數據,我們去研究B、C、D,構建關於A體系的知識圖譜,去構建關於A體系的知識圖譜,去了解這個領域的問題如何發展,因此我們構建領域的模型去解決A的問題,這是我們講的通過案例分析來做。
第二,通過演算法黑箱。無論是小庫還是剛剛城室科技做出來的路網匹配的模型,我們都可以從中看到生成式對抗網路的痕迹,但它並沒有構建起關於城市規劃各種變數間的嚴謹模型關係,而是通過演算法黑箱去實現基因的注入。
第三,求助於傳統的城市模型。2016年我們做了通州城市總體規劃大數據與模型專題,在這個專題中我們首先使用大數據獲得通州的各類現實大數據畫像,包括人口分布、就業崗位分布、城市的通勤與職住關係等等。基於以上,引進了土地與交通的一體化(LUTI)模型,其中實現了空間均衡模型和迭代模型。能夠模擬在不同政策情景下,未來北京和北三線地區人口和就業崗位的分布以及職住空間聯繫情況,這是一個動態的空間均衡。模型最後輸出人口與就業崗位空間分布、職住聯繫。
我們進一步基於LUTI模型的輸出作為基於元胞自動機的城市空間發展模型的輸入,去研究這個城市的空間發展。我們設置了多種空間發展情景,看用地在不同情景下如何發展,最後會形成如何的用地布局。這是我們第一次結合了用地現狀數據、人口時空行為大數據,結合了土地交通一體化模型和元胞自動機模型,得到了通州與北三線的一張規劃圖。這張圖儘管不是規劃師畫的用地圖,但我們可以對比基於模型模擬不同情景的用地結果和規劃師所做用地方案圖的差別,從而進一步去看這樣的差別如何指導我們修正規劃、出台什麼樣的規劃措施。
四、傳統模型的問題與發展
(一)傳統模型範式與大數據範式
?傳統模型範式:
理論抽象——關鍵變數——調查採集——建立模型
傳統模型首先是對現實世界進行理論抽象,設定一些關鍵的變數,在圍繞這些變數通過調查收集數據,最後構建城市模型。
?大數據範式:
泛在感知——多源數據——多維變數——建立模型
但大數據時代與傳統模型構建的範式不同,大數據範式首先是廣泛的感知,現在我們的城市有越來越多的感測器和越來越多的智能應用和智能設備用戶,因此我們能感知世界的維度比以前多得多,因此當下是一個泛在感知基礎自動產生多源城市數據礦產的時代,基於此會產生不計其數的城市模型變數,模型的任務是理清這些變數間的關係。
(二)二者關聯與發展
二者的關鍵差異就是「城市知識圖譜」從何而來。第一種是我們先有了理論和知識圖譜,再去證明它;第二種是我們先有了數據和感知方法,去尋找它。那麼,為什麼傳統數據模型不能是泛在感知的基礎呢?調查的成本決定了傳統的數據模型必須先有理論。過去沒有感知辦法,沒有自動產生數據的數據礦產,每一個模型的每一個數據都需要人去調查收集。
所以我們一定會先簡化我們的世界,把它變成3、4個,最多20個變數的理論基礎。但是我們對城市感知能力的提升倒逼了我們需要重新認識城市,也就是說城市根本不是腦子裡或者任何理論里抽象的那麼一個樸素的模樣,我們要讓城市回到它複雜系統的本源。那麼我們突然有了比過去多得多的維度去理解這個城市,它充滿細節。
五、我們有多少種感知方法和認知維度?
(一)感知方法總結
探究一個城市到底有多少種維度,首先要從我們有多少種方法去感知城市說起。2016年下半年我們做了一個關於城市感知方法的總結,比如PSPL調研法、感測器法、社會感知,研究了每一種方法的研究對象是誰、幹什麼事情以及他們的成本是多少……綜合以上,我總結了哪些方法適合做哪些事情,分別針對人、行為、屬性等方面研究每一種方法的優勢,以及各種方法的性能。
對於這種方法我們也做了很多實踐,有感測器實踐、人肉大數據實踐等。2017年北京國際設計周做的楊梅竹斜街人肉觀察,這條街496米長,我們以每10米做一個格子,記錄每個人在什麼時間在哪個格子中發生什麼行為,就實現了微觀尺度人在街道上行為的觀測,比如行人購物、停留、興趣等等。
感知之後我們需要重新理解城市。城市到底有多少種認知維度?當以傳統認知維度去做居住小區、居住用地時,我們一般會從佔地面積、建築面積、容積率、高度、綠地、套數、戶型、棟數、物業費、房價、租金、入住率等方面入手;當我們有了大數據,我們會有多少種維度呢?僅從居民和居民行為視角,我們可以看看這個小區的上班族數量,加班族數量,夜生活人群比,共享單車用戶比,外賣用戶比例,高頻活動場所,通勤出行距離,休閑出行距離,加班頻次,生活時長,出國度,宅度,剁手度,群租度,文藝度……事實上一個城市有一萬種視角、十萬種視角,只要我們願意認識它,城市總會給我們不同的新鮮感,千萬不要被城市規划過去教給你的套路限制了想像力。
(二)環境行為學
所以我們要開腦洞。在這方面,環境行為學是一個很好的學科。引用葉宇老師的一篇文章,其中總結了環境行為學的空間感知、行為研究和設計範式,提出我們對於建成環境空間要素的抽象和提取、感知與行為特徵的抽象和提取,最後告訴我們怎樣歸納感知、行為和空間特徵的相互關係並輔助設計。
(三)架構新體系
但這裡會產生一個歧義,環境行為學中提到的感知並不是前面講的泛在感知,而是多指人對於環境的心理認知和感受,容易造成混淆。因此在城市象限內部,我重新架構了自己的研究體系,其中將城市數據分成兩類:一、行為空間數據,二、空間行為數據。通過實現空間的感知和行為的感知得到心理認知,進而完成空間認知和品質評估,最後研究空間形態、生活品質以及主觀感受間關係,我們把這一過程作為城市象限的人居環境科學的實現路徑。在這個框架里,感知一詞就不存在歧義了。
六、從感知來源和認知維度來看阿里與百度
城市大腦到目前為止還是叫做「城市大眼」更為適合,但這一點已經很了不起了。過去我們都有攝像頭,那時的圖像是連續的柵格圖像數據,不結構化,也不直接產生意義。城市大腦的計算視覺技術讓這些柵格圖像變成有意義的信號,比如能夠自動提取出人數、車輛、車速,並進一步識別出擁堵、排隊等高級信號。當我們能夠理解一個視頻作為有意義的信號時,是否就能夠讓一個城市變得更好呢?我們可以想想在天宮中誰是玉皇大帝的智庫?城市大腦現在充其量就是千里眼和順風耳的角色,它能給玉皇大帝傳遞信息,但它並不能告訴玉皇大帝怎麼讓天界和人界治理的更好。城市大眼要變成真正的城市大腦,就是要從千里眼順風耳變成太上老君,但我不認為他能依靠自己實現這種轉變。
數據公司都面臨一個問題,無論阿里巴巴、百度、騰訊、運營商……他們的核心問題是數據變現。他們很強大,在很多行業他們都成功跨界,甚至顛覆,當他們走到城市規劃面前,都會看到一個巨大的溝:城市的複雜性導致了厚數據需求,任何單一的數據源都無法應對城市問題,而更重要的是應用邏輯的缺失,城市規劃這個學科壓根不是用數據驅動的。這是個老師父帶徒弟的經驗驅動式的行業,相比起城市規劃,下游越平坦的行業(或者說數理邏輯越清晰的行業),越容易被入侵,比如交通、金融(風控)、精算等,方法是定量的、數據在別人手上,驅動模式是現成的。那麼,誰有資源誰就說了算。所以規划行業的落後和不科學形成了我們的護城河。
七、我們的機會在哪裡?
這也給了我們新的機會。一、業務轉型,城市空間正在走向城市更新運營,我們從空間生產轉向空間運營過程。二、就業需求,儘管我們在高校、或自學得到的數據師越來越多,但數據資源指數增長,或用數據的人呈線性增長,相關人才供不應求。三、市場機會,新概念的邊際效應快速衰退,凱文凱利也不夠用了,在政府和很多企業客戶那裡有一種對於智能和大數據的失望感正在蔓延,這時候誰能夠解決問題,誰就能贏得信任。四、行業保護,由於城市規划行業並不存在數據驅動的邏輯,因此這也成了互聯網公司不能入侵我們的護城河。當然我們都希望把這條河填掉,但也希望大家認真思考,填河之後我們的核心競爭力在哪。五、支付意願。 中規院對行業的支付意願推進起到很大作用,讓行業認知到這個事情不是歪門邪道,並需要為數據(和相關服務)付費。
八、如何尋找自己在城市數據產業的位置?
在上述5大機遇中我們要尋找自己在城市數據產業中的位置。城市數據師大概有三個選擇:一、數據工程——解決效率,架構師、數據工程師。二、數據科學——解決演算法:數據科學家、模型師。三、業務專家——解決問題:數據分析師、數據思維的規劃師。每一個從業者都要選擇自己的方向與職業。
數據會越來越廉價,城市數據師則會長期稀缺。所以,限制你的,不是數據;而是想像力:不要讓數據貧窮限制我們對城市和未來的想像。
最後再引用一下阿西莫夫來呼應一下開頭:「城市數據師的理想歸宿是『第二基地』」,城市象限,一個很接近「第二基地」的地方。
報告整理:呂佳文
基地資源


TAG:規劃中國 |