當前位置:
首頁 > 最新 > 人類行為預測:居住數據的分析和預測

人類行為預測:居住數據的分析和預測

你見過熄了燈的東方明珠嗎?

平日里流光溢彩的陸家嘴褪去華麗燈光,參與到一年一度的「地球一小時」中。而在全世界,有7000+城市、超過10億人共同參與到這場「熄燈接力」中。

地球一小時是由世界自然基金會發起,全球規模最大的環保公益運動。「地球一小時」活動首次於2007年3月31日在澳大利亞的悉尼展開,吸引超過220萬悉尼家庭和企業參加;隨後,該活動以驚人的速度迅速席捲全球,覆蓋現已超過180個國家與地區,7000多個城市,吸引了數億名支持者。地球一小時呼籲個人、社區、企業和政府在每年3月最後一個星期六20:30-21:30期間熄燈一小時,以此來激發人們對保護地球的責任感,以及對氣候變化等環境問題的思考,並用行動表達支持。

「地球一小時」從建築節能方面為環保做出了傑出貢獻。我國的建築能耗約佔全國總用能量的四分之一,高居能耗首位。近年來隨著建築業的不時開展,建造和運轉運用的能源數量越來越大。建築節能是改善和進步建築節約能源、促進環境維護、減少溫室氣體排放量的重要措施之一,意義重大。

居住者行為會顯著影響建築能耗,但與此相關的研究幾乎是空白。由於人類行為的隨機性和高度不確定性,人類行為研究一直是一個非常有挑戰的課題。上海交通大學國際與公共事務學院講師、學者梁昕博士的「居住數據的分析和預測」學術論文,使用數據挖掘和機器學習的方法識別樓宇動態人數,分析和預測樓宇內居民的行為模式,此研究對能耗管理等有一定啟示。

接下來,就讓我們一起走進梁昕老師的學術成果,感受社會科學與計算機科學交叉互補的別樣魅力。

數據挖掘方法

數據挖掘一般是指從大量的數據中通過演算法搜索隱藏於其中信息的過程,對於解釋數據背後隱藏的現狀有著顯著優勢。比如在梁昕老師的此次研究中,通過演算法計算來自美國能源部能源效率中心的大量實地數據,發現樓棟內人員出入的時間規律,從而推斷人員出入時間表。

作為一位將計算機科學與社會科學二者緊密結合的學者,這一次,梁昕老師運用數據挖掘方法對樓宇內居民的行為模式對建築能耗的影響進行了相關調查。

在此之前,學界已有針對居民行為影響建築能耗的研究,但如何對居民行為進行系統建模始終是個難題,制約了研究結果的準確性。先前研究輕真實數據,而重主觀假設,由於居民行為具有高度隨機性,因而在缺乏真實數據校驗的情況下,將居民簡單地劃分為「正常作息組、早起組與加班組」是不合適的。此外,數據來源僅為幾間獨立的辦公室,當將研究結果應用到整棟樓宇時,可能會產生偏差。另外,先前很少有研究通過數據分析預測未來的居民行為,因而研究結果缺乏實踐意義。

為彌補上述研究缺陷,梁昕老師採用數據挖掘方法分析和預測居民行為。數據挖掘方法在該研究課題上有著對數據種類要求低和操作簡單的優點。

(數據挖掘六大步驟)

此次採用的數據挖掘共包含以下六大步驟

Step 1. 搭建問題框架

本次研究問題為通過分析歷史數據以預測未來居民行為,研究範圍為工作日辦公樓的人員出入情況,衡量本研究是否具有實踐意義的關鍵因素是預測結果與觀察數據是否具備相似性。

Step 2.獲取並處理數據

剔除無效數據,並用統計方法(箱線圖和平均值)對數據進行預處理,尋找數據的特徵,以獲得有效數據。

Step 3. 選擇具體方法

數據挖掘方法囊括了多種子方法,不同子方法適用於不同研究,因而選擇合適的方法,可以使研究事半功倍。在本研究中,機器學習方法被用於分析居民行為,採用歸納法以歸納居民行為。

Step 4. 演算法運行

這一步目的在於發現並歸納居民行為的時間規律。聚類分析和決策樹演算法被分別用於認知行為和規則歸納。

*聚類分析:聚類分析是一組將研究對象分為相對同質的群組的統計分析技術。同一個群組中的對象有很大的相似性,而不同群組間的對象有很大的相異性。

*決策樹演算法:決策樹演算法是一種逼近離散函數值的方法。它是一種典型的分類方法,首先對數據進行處理,利用歸納演算法生成可讀的規則和決策樹,然後使用決策對新數據進行分析。本質上決策樹是通過一系列規則對數據進行分類的過程。

Step 5. 預測

數據被分為訓練集和測試集兩部分,訓練集中數據被用於大量運算以幫助建模,確定運算規則。基於經由運算得到的居民行為分析,居民行為時間規律表得以被預測。

Step 6. 校驗

將預測結果與先前測試集部分的數據進行比對,以校驗數據。兩部分數據越接近,表明所選用運行方法越得當。

(研究數據來源:美國能源部能源效率辦公樓 Building 101)

運算結果

人員出入樓宇情況的主要特徵

由於研究數據樣本為一辦公樓,因此周末及節假日,出入樓宇人數接近於零,因此,當分析人員出入情況的時間一覽表時,這部分情況被排除在外。工作日里,從早上七點至下午四點,出入人數波動較大,意味著出入人數具有動態性及隨機性,為根據傳統統計方法理解和預測出入人員的活動狀態造成困難。

(各工作日不同時間段人員出入情況)

根據圖表,可直觀地將樓宇內人員數量情況劃分為六個階段。

1.夜間(7pm-6am):樓內基本空無一人

2.上班高峰期(7am-9am):員工陸續前來上班,樓棟負荷率從10%上升至70%

3.上午工作時間(10am-12am):大量員工在樓內進行工作。樓棟負荷率達到80%

4.午休時間(12pm-1pm):一些員工外出就餐,樓棟負荷率略有下跌,低於80%

5.下午工作時間(2pm-3pm):員工重新開始工作,樓棟負荷率回升至80%以上,但略低於上午工作時間

6.下班時間(4pm-6pm):員工陸續下班,離開辦公樓,樓棟負荷率從70%下跌至10%。

備註:樓棟負荷率(the occupancy rate)=樓棟中實時居民數量/樓棟最大可容納居民數量

人員出入樓宇情況的模式分類

梁昕老師根據聚類分析,歸納了人員出入樓宇情況的四大模式。

模式一:工作時長短,員工上班晚、下班早,樓宇內人數在午休時間並未出現顯著變化。

模式二:工作時長長,員工上班早、下班晚,午休時間大約在中午12點左右

模式三:中等工作時長,樓棟負荷率在上午九點左右上升至50%,在下午六點前下降至50%,午休時間在下午兩點左右

模式四:近似模式三,但上下班時間及午休時間都比模式三提前一小時。

接著,梁老師採用聚類分析和決策樹演算法,基於上述四種行為模式,依次探尋了不同季節中居民出入的行為模式規律,進行預測,得到結果,並加以驗證。所有驗證標準都顯示在居民行為模式分析上,採用數據挖掘方法比傳統分析方法效果更好。

數據挖掘演算法在此次研究中發揮了三大優勢

1.發掘了數據背後隱藏的行為模式和特徵

2.只需要基礎的數據輸入

3.用相對簡單的演算法運算卻能更準確地進行預測

研究的意義

此次研究結果可被應用至不同領域,尤其能在預測能源使用情況方面做出貢獻。本研究得到的數據挖掘方法更利於分析居民行為的結論能夠幫助提升預測能源使用情況的準確性。此外,本研究能幫助改善能源利用效率,可根據所預測的居民行為不同模式來提前調整對應時間的樓棟光照、電器等設施,有效節約能源。

關於人類行為預測

梁昕老師的這一研究其實是一類關於人類行為的研究和預測,這一領域是現在非常有創新和極具潛力的一個研究方向,機器演算法也為更好地理解人類行為提供了分析工具。有興趣的同學可以加以持續關注。

老師寄語

對於人類行為的分析是是科學界一個新的熱點。這個領域開始被最前沿的科學研究者所關注,有人稱2017年是人類行為研究新時代的元年。

科學界也開始反思,隨著科技的發展,我們探索廣闊的宇宙空間、微觀的納米材料,我們使用雲計算、大數據,甚至關注人工智慧和機器人。然而,我們對人類自身行為又了解多少呢?我們的行為是如何形成的?它遵從什麼樣的規律和特徵?不同的行為會對外界會產生怎樣的影響?有些諷刺的是,人類現代科學中最無知的版塊恰恰就是對自身的認知,有太多的疑問和空白值得我們去追尋和探索。

(梁昕老師漫畫形象 作者:黃卉寧)

對人類行為的研究目前主要有兩個方向,一是通過大數據的方法觀察和理解人類行為的特徵、模式以及差異,並在此基礎上進行分析和預測;另一方面是通過腦科學、認知行為等方法去理解人類行為的成因以及背後的邏輯鏈。兩種方法一個是宏觀的認知一個是微觀的認知,相輔相成。好像自然科學中,我們對「水」這種物質的認知,有宏觀的溫度、密度、沸點、冰點等特徵,也有微觀的分子結構和化合反應等。

本文試圖通過第一種,即大數據的方法,對一座建築物中居住者的活動進行特徵描述,並基於此進行預測分析。這個小小的案例研究在整個人類行為研究中是微不足道的,但是正是許許多多學者在不同的領域,對不同的行為進行大量的分析,才可以有全面而深厚的積澱。也希望各位有興趣的學子能夠關注該領域的前沿研究,投身其中,我們一起積跬步以致千里,推動該領域的進步!

在此誠摯感謝梁昕老師的供稿分享和全程的耐心配合!

參考文獻:

*Xin Liang, Tianzhen Hong, Geoffrey Qiping Shen,Occupancy data analytics and prediction: A case study, Building and Environment 102(2016)179-192

*V.S.Subrahmanian and Srijan Kumar, Predicting human behavior: The next frontiers, Science 355(6324).489.

撰稿:葉智暘

編輯:葉智暘

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 果園之聲SJTU 的精彩文章:

TAG:果園之聲SJTU |