數據分析之北京年輕人苟活指南
作者 l 二胖
來源 l 大數據前沿(公眾號ID:bigdataqianyan)
轉載請關注公眾號後留言聯繫授權
很久之前二胖就抓了一波北京的房價信息,但因為比較懶,一直沒有做統計;加上很久沒有寫數據分析相關的文章了,正好最近爆出很多惡中介瞎炒房租的新聞,二胖就一併分析分析。
本文主要從兩個方面入手:
一是北京租房數據分析;
二是北京房價數據分析。
好,廢話不多說,直入正題。
一張圖看盡北京發展
下圖中每一點代表北京的一個小區。二胖根據小區的建設時間進行了一定的區分,即在一個確定的時間點下,如果該小區的建設年代早於設定的時間點,那麼它就會出現在該圖對應的亮點圖中。
GIF
1949年-2018年北京小區的建設情況
北京從1949年新中國成立之時的幾個小區發展到現在的上萬個小區,僅用了幾十年時間。【註:抓取的數據量有限,不代表北京小區個數的真實數量級】
北京樓房類型
除對小區建設的年代進行了統計外,二胖還整理了一下北京各個小區樓房的建築類型。
北京各個小區樓房的建築類型
相信大部分人和二胖一樣,對樓房的建築類型並不太了解,所以二胖查了一下相關的資料。
由於北京最多的是板樓和塔樓,所以二胖就只介紹這兩種類型的樓房。
板樓:像學校宿舍樓那樣一棟樓很多個單元。
板樓示意圖
而塔樓就是像塔那樣,獨棟且很高的樓房,如世貿大廈。
北京是一個很有年代感的城市,樓房多以板樓為主,和廣州、深圳等其他一線城市相比,高樓大廈並不算多。
北京房租到底有多貴?
二胖趁著周末抓取了租房平台上的數據,數據量並不是很大,只有幾千個小區。數據的更新信息截止到本周六,即2018年8月25日。
因為每次發文章都有小夥伴看得不認真,這裡再強調一下,這是小區的分布密集程度圖,而非租金的價位熱力圖。
截至18年8月25日北京小區分布的熱力圖
從上圖可知,本次抓取的數據樣本多集中在北京城區五環內,以及部分昌平回龍觀地區、通州區等地的數據。
只有樣本的分布當然看不出來租金到底有多貴,為了展示更多的數據,這裡二胖先用一個詞雲圖來展示——不考慮房屋面積的情況下,在北京租一間房大約需要多少錢。
下圖中的數字代表租一間房的月租金,數字的個頭越大,表示這個價格出現的次數越多。
北京租一間房的月租(尺寸越大代表價格越普遍)
北京的房租已經高到超乎二胖的想像,如果說租房一個月就要花掉幾千元甚至上萬元,那我們需要月掙多少才能在北京苟活下去呢?
只看月租金,而不看房屋面積的統計是在耍流氓。
下面來看更具體的數據,在北京租房平均每平米需要花費多少錢?
以下是二胖所抓取的數據中房租最高的10個小區,Top1的小區每月每平米需要花費622元的租金。
也就是說,如果你租一個10平米的小房間,你每月就需要支付6220元的房租。
北京每平米月租金最貴的十個小區
下圖是北京各區每平米每月需要花費的租金平均值。
北京各區租房每平米的平均價格
可以看到,海淀、西城、東城的房租都特別貴,一平米要100多元每月。
為了讓大家看得更直觀,二胖又做了個租金價格地理熱力圖,下圖的可視化參數仍是各個樣本的每平米租金價格。也就是說,每平米租金價格越高,該區域的熱力圖顏色越暖。
北京每平方米租金熱力分布圖
北京東城區和西城區的租金高毫無懸念,二胖也不過多解釋了。
海淀區租金高或許有部分同學不太了解:
海淀有很多互聯網企業,而程序猿們的收入較高,租金是硬生生被人給抬起來的;
海淀有很多牛逼的神級高中,有些家長為了能讓孩子在海淀念書,不惜花重金買下或者租下那些學校旁邊的小破樓。
總之,想在北京苟活下去,工資就一定得高。如果租不起房怎麼辦?
那就長痛不如短痛,買房吧。
北京房價到底有多貴?
我們再來看看北京買房要花多少錢。先來一張3D可視化圖來看看北京的房價分布吧。
北京房價分布圖(紅線越高代表房價越高)
可以看到,北京的房價分布十分不均勻。尤其中心城區的房價特別貴,並且二胖最好奇的是中間那兩個直飛衝天的小區是哪兩個,也許是四合院?
由於時間有限,房價部分二胖並沒有抓取最新的數據,使用的是去年5-12月的數據,但是鑒於北京今年的房價相對穩定,還有輕微的下降趨勢,所以直接用去年的數據也無妨。
下圖是北京各區2017年5月-12月的房價走勢,最上面那條線是西城區,平均房價已經妥妥過10萬了,而最下面的那條線是密雲區,房價也早已過兩萬。
哎,租不起房,更買不起房,買個100平米就得幾百上千萬,對拿工資的老百姓來說,買房幾乎是不可能的事情。
北京各區2017年5月-12月平均房價
下圖是北京2017年12月份各區的房價,具體到數字,大家隨意感受一下吧。
北京各區2017年12月平均房價
分析至此,以上觀點僅供參考。
話說回來,再怎麼分析,北京的房價就在那,不會改變。
作為在北京苟活的年輕人中的一員,如果哪天堅持不下去,二胖會選擇離開,畢竟北上廣留不住每一個年輕人。
二胖早在今年初就寫下了成都,我們還回得去么?這篇文章,希望在北京混不下去的時候,家鄉還能張開懷抱歡迎我。
年輕人,如果想在北京「苟活」,一定要堅強!
技術分解
數據抓取:scrapy+redis 分散式爬蟲
數據可視化:echarts,maptalk,ElasticSearch
存儲:MongoDB,ElasticSearch
其實ElasticSearch是一個特別好的數據分析工具,可以做搜索引擎、統計工具,也可以做數據可視化工具。
二胖之前也專門寫了兩篇文章來介紹它,一篇介紹它的作用,一篇介紹它的部署,不過大家似乎對其不是特別感興趣?
![](https://pic.pimg.tw/zzuyanan/1488615166-1259157397.png)
![](https://pic.pimg.tw/zzuyanan/1482887990-2595557020.jpg)
TAG:大數據前沿 |