當前位置:
首頁 > 最新 > 數據分析之北京年輕人苟活指南

數據分析之北京年輕人苟活指南

作者 l 二胖

來源 l 大數據前沿(公眾號ID:bigdataqianyan)

轉載請關注公眾號後留言聯繫授權

很久之前二胖就抓了一波北京的房價信息,但因為比較懶,一直沒有做統計;加上很久沒有寫數據分析相關的文章了,正好最近爆出很多惡中介瞎炒房租的新聞,二胖就一併分析分析。

本文主要從兩個方面入手:

一是北京租房數據分析;

二是北京房價數據分析。

好,廢話不多說,直入正題。

一張圖看盡北京發展

下圖中每一點代表北京的一個小區。二胖根據小區的建設時間進行了一定的區分,即在一個確定的時間點下,如果該小區的建設年代早於設定的時間點,那麼它就會出現在該圖對應的亮點圖中。

GIF

1949年-2018年北京小區的建設情況

北京從1949年新中國成立之時的幾個小區發展到現在的上萬個小區,僅用了幾十年時間。【註:抓取的數據量有限,不代表北京小區個數的真實數量級】

北京樓房類型

除對小區建設的年代進行了統計外,二胖還整理了一下北京各個小區樓房的建築類型。

北京各個小區樓房的建築類型

相信大部分人和二胖一樣,對樓房的建築類型並不太了解,所以二胖查了一下相關的資料。

由於北京最多的是板樓和塔樓,所以二胖就只介紹這兩種類型的樓房。

板樓:像學校宿舍樓那樣一棟樓很多個單元。

板樓示意圖

而塔樓就是像塔那樣,獨棟且很高的樓房,如世貿大廈。

北京是一個很有年代感的城市,樓房多以板樓為主,和廣州、深圳等其他一線城市相比,高樓大廈並不算多。

北京房租到底有多貴?

二胖趁著周末抓取了租房平台上的數據,數據量並不是很大,只有幾千個小區。數據的更新信息截止到本周六,即2018年8月25日。

因為每次發文章都有小夥伴看得不認真,這裡再強調一下,這是小區的分布密集程度圖,而非租金的價位熱力圖。

截至18年8月25日北京小區分布的熱力圖

從上圖可知,本次抓取的數據樣本多集中在北京城區五環內,以及部分昌平回龍觀地區、通州區等地的數據。

只有樣本的分布當然看不出來租金到底有多貴,為了展示更多的數據,這裡二胖先用一個詞雲圖來展示——不考慮房屋面積的情況下,在北京租一間房大約需要多少錢。

下圖中的數字代表租一間房的月租金,數字的個頭越大,表示這個價格出現的次數越多。

北京租一間房的月租(尺寸越大代表價格越普遍)

北京的房租已經高到超乎二胖的想像,如果說租房一個月就要花掉幾千元甚至上萬元,那我們需要月掙多少才能在北京苟活下去呢?

只看月租金,而不看房屋面積的統計是在耍流氓。

下面來看更具體的數據,在北京租房平均每平米需要花費多少錢?

以下是二胖所抓取的數據中房租最高的10個小區,Top1的小區每月每平米需要花費622元的租金。

也就是說,如果你租一個10平米的小房間,你每月就需要支付6220元的房租。

北京每平米月租金最貴的十個小區

下圖是北京各區每平米每月需要花費的租金平均值。

北京各區租房每平米的平均價格

可以看到,海淀、西城、東城的房租都特別貴,一平米要100多元每月。

為了讓大家看得更直觀,二胖又做了個租金價格地理熱力圖,下圖的可視化參數仍是各個樣本的每平米租金價格。也就是說,每平米租金價格越高,該區域的熱力圖顏色越暖。

北京每平方米租金熱力分布圖

北京東城區和西城區的租金高毫無懸念,二胖也不過多解釋了。

海淀區租金高或許有部分同學不太了解:

海淀有很多互聯網企業,而程序猿們的收入較高,租金是硬生生被人給抬起來的;

海淀有很多牛逼的神級高中,有些家長為了能讓孩子在海淀念書,不惜花重金買下或者租下那些學校旁邊的小破樓。

總之,想在北京苟活下去,工資就一定得高。如果租不起房怎麼辦?

那就長痛不如短痛,買房吧。

北京房價到底有多貴?

我們再來看看北京買房要花多少錢。先來一張3D可視化圖來看看北京的房價分布吧。

北京房價分布圖(紅線越高代表房價越高)

可以看到,北京的房價分布十分不均勻。尤其中心城區的房價特別貴,並且二胖最好奇的是中間那兩個直飛衝天的小區是哪兩個,也許是四合院?

由於時間有限,房價部分二胖並沒有抓取最新的數據,使用的是去年5-12月的數據,但是鑒於北京今年的房價相對穩定,還有輕微的下降趨勢,所以直接用去年的數據也無妨。

下圖是北京各區2017年5月-12月的房價走勢,最上面那條線是西城區,平均房價已經妥妥過10萬了,而最下面的那條線是密雲區,房價也早已過兩萬。

哎,租不起房,更買不起房,買個100平米就得幾百上千萬,對拿工資的老百姓來說,買房幾乎是不可能的事情。

北京各區2017年5月-12月平均房價

下圖是北京2017年12月份各區的房價,具體到數字,大家隨意感受一下吧。

北京各區2017年12月平均房價

分析至此,以上觀點僅供參考。

話說回來,再怎麼分析,北京的房價就在那,不會改變。

作為在北京苟活的年輕人中的一員,如果哪天堅持不下去,二胖會選擇離開,畢竟北上廣留不住每一個年輕人。

二胖早在今年初就寫下了成都,我們還回得去么?這篇文章,希望在北京混不下去的時候,家鄉還能張開懷抱歡迎我。

年輕人,如果想在北京「苟活」,一定要堅強!

技術分解

數據抓取:scrapy+redis 分散式爬蟲

數據可視化:echarts,maptalk,ElasticSearch

存儲:MongoDB,ElasticSearch

其實ElasticSearch是一個特別好的數據分析工具,可以做搜索引擎、統計工具,也可以做數據可視化工具。

二胖之前也專門寫了兩篇文章來介紹它,一篇介紹它的作用,一篇介紹它的部署,不過大家似乎對其不是特別感興趣?

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 大數據前沿 的精彩文章:

和刻苦學習相比,選擇一本好書更重要

TAG:大數據前沿 |