大數據發威 百度揪出50鬼城

北京大學和百度的研究人員根據百度網站的數據,發現了中國50個最「鬼」的「鬼城」。(AFP)
北京大學和百度的研究人員根據百度網站的數據,發現了中國50個最「鬼」的「鬼城」。(AFP)

【記者秦雨霏/報導】

北京大學和百度的研究人員根據百度網站的數據,發現了中國50個最「鬼」的「鬼城」。包括天津濱海、天津市津南區、山東東營、瀋陽市東陵區和內蒙古呼和浩特市賽罕區、內蒙古鄂爾多斯市東勝區等。

根據住房的高空屋率,百度/北京大學團隊發現,「鬼城」主要出現在中型城市的某些區域,特別是在中國東部省分。他們確定了50個「鬼城」,但是拒絕分享所有「鬼城」的名字或它們的空屋率,理由是這些訊息「非常敏感」,「甚至可能影響房地產的銷售」,不過他們還是公布了其中20個「鬼城」的名字。

「鬼城」就是一個住房遠遠超過人口的地方。《石英》雜誌報導說,由於全球金融危機之後的建築熱潮,中國出現了許許多多的「鬼城」。僅在2011和2012年,中國消耗的水泥就比美國整個20世紀消耗的還多。

空屋率被政府保密

《石英》報導說,自從2000年以來,媒體把鬼城作為中國盲目發展的象徵。但要界定鬼城並非易事。由於當局拒絕公布房屋空屋率,一些記者和對沖基金經理採用在晚上計算有開燈住宅的辦法。其他人則將每平方公里住宅開發區少於5千人作為鬼城的分界線。

但是百度團隊沒有採用這樣的辦法。因為這些數字不包含空房子的準確地點,它們只能反映每個城市的平均「鬼魅」水平,更不能找出「鬼城」背後的原因。

計算「鬼魅水平」

《石英》報導說,為了計算某個地方的「鬼魅水平」(空屋嚴重程度),研究者使用IP位址或其他位置數據統計每100平方公尺居民區使用百度搜索引擎的人數。研究者認為,在這個區域裡面如果百度用戶不到0.25人可以被視為「高空屋率」,也就是可以視為「鬼城」。

這些用來發現鬼城的數據是巨大的。它包含從2014年9月到2015年4月的7.7億百度用戶,令這個中國住房宏觀圖像具有史無前例的準確性。然而該數據也不是完美的,因為百度用戶不成比例的集中於年輕人和富人,並且居民區的認定也不是完美的。因此該研究可能漏掉了一些鬼城。

研究者謹慎指出,並非所有這50個地區都是典型的鬼城,也就是一年到頭空無一人的那種地方。比如其中一些地區可能是旅遊點,那裏的居民區大部分時間空置,除了假日和週末。如山東省乳山看起來更像是一個旅遊點而不是一個鬼城,因為人口會在中國新年期間飆升。◇

延伸閱讀
建三江事件惡化 取締610勢在必行
2015年11月02日 | 9年前
進出口慘 陸10月製造業PMI低於預期
2015年11月01日 | 9年前
取消