新用戶登錄后自動創建賬號
登錄假日辦撤了,“黃金周長假”到底意味著什么?官方數據可能太宏大,不妨借用新興社交媒體的大數據,觀察和記錄2014年“十一”黃金周。看看游客從哪里來,又到哪里去,哪些地方最具吸引力。可以為大家在2015的“十一”黃金周出行提供具有價值的參考。
2014年的“十一黃金周”,人們都去哪兒了?官方數據顯示,2014年“十一”黃金周期間全國共接待游客4.75億人次,實現旅游收入2453億元,分別比2013年增長了10.9%和15.7%。而納入國家旅游局直報的124個旅游景區(點)在國慶節期間共接待3169萬人次,門票收入超過16億元。
但這背后,是頻現媒體頭條的“看不起”、“擠怕了”等關鍵詞。在快速增長的公眾假期旅游市場中,“提升品質”似乎成了最具共鳴卻也最難實現的呼聲。
簡單依據官方格式化的通報和統計數字,難以探察越發成熟、訴求愈發多樣的旅游群體。擁有海量用戶的社交媒體也許為我們提供了一條考察途徑。
微博是國內最大的社交網絡平臺之一。隨著移動客戶端普及,游客所發的位置微博(基于LBS)比例相應提升。用戶在景區一次次拍照、簽到、發微博等行為,目的性異常明確,由此產生的位置微博可被認為是一種范圍與規模更大、也更精細的記錄手段,成為探察游客旅游行為的新脈絡。
那么,從微博的大數據來看,游客都去哪兒了?他們的感受如何?
數據概覽
通過新浪微博提供的開放平臺和應用程序編程接口(Application Programming Interface,API),我們基于全國地理信息網格,采集了“十一”黃金周及前一周(2014年9月24日至10月8日)共計14天公開的位置微博數據,空間范圍覆蓋整個大陸及港澳臺。
“十一”黃金周位置微博分布熱點
發微博和黃金周有啥關系?微博用戶對假期旅行經歷的分享,顯著推動了微博數量增長。從總數看,“十一”黃金周期間,全國位置微博約667萬條,最高日約102萬條,最低日約86萬條。相比節前一周的566萬條,總量增長約18%,尤其是照片數量增長明顯。在黃金周末期,微博數量逐步回落到節前水平。
那么,在哪里發微博的人最多?從分布看,全國尺度上微博數量與人口總量的分布非常相似,以愛輝-騰沖線為界,東部地區微博數量遠高于西部。其中北上廣、各省省會等一、二線城市普遍具有較強的聚集能力,假日期間顯著吸引了周邊乃至全國的移動人口。
但這一數據或許還不能完全說明旅游地的受歡迎程度。在進一步與當地常住人口(六普)及節前日常水平進行對比后,以人均微博密度為指標,我們發現,額濟納、稻城、麗江等非一線地區作為旅游熱點,在縣域尺度同樣表現出非同一般的吸引力。其中,四川省表現尤為突出,在前十位的熱點縣區中獨占五席。這與官方統計結論相吻合,國家旅游局通報顯示, 2014年“十一”黃金周四川省旅游總收入超過200億元,較前一年增長達到29.1%,是全國旅游收入增長最快的省份。
在微博中,我們還能探知哪里的景區可能更有趣。相關的考察角度,是每帖照片數:因拍照是游客分享旅行經歷中最重要的形式之一,每帖照片數從側面可體現游覽景區能在多大程度上激發用戶的拍照和分享,可將其視為當地旅游感染力強弱的綜合反映。
從整體統計的意義看,可認為每帖照片數較多的地區,其景觀資源品質也相對較高。
從結果看,西部地區社交網絡用戶數量雖少,但照片比例遠高于東部,與前述微博總量“東高西低”格局呈現出有趣的對稱現象。早有學者指出,西部地區是我國旅游資源最豐富的地區,自然景觀和人文景觀占了全國“半壁江山”,西部十省市也都無一例外地把旅游業當作支柱產業來培育和發展。從游客角度出發,拍照意愿的強弱程度也進一步佐證了這一結論。
從哪里來,到哪里去?
游客究竟從哪里來?哪些城市更具備全國的吸引力?通過分析每位用戶在假期前后不同的發帖位置,并參考其填寫的所在地等信息,我們定義了用戶在“十一”黃金周期間移動的起止點,在地級市尺度對用戶的活動規律進行統計分析,對用戶的達到、離開、城市間流量等情況在規模、比例和比值幾個維度上進行了研究。
到達量方面,北京、廣州、深圳、成都、上海總量居前五位,五地微博用戶到達量占全國總量13%,這與當地移動互聯網用戶基數較大有一定關系。我們將到達量與官方“十一”黃金周重點旅游城市排行比較,可發現,靠前的幾個城市排序相似性較高,但人口較少的城市(青島、煙臺)相似性偏弱,表明現階段微博數據與官方統計口徑之間依然存在一定差異。
官方統計與微博數據比較。
因此,我們進一步引入節前各地的用戶數為基數,分析到達量占基數的比重,以減少數據口徑偏差的影響。調整后發現,神農架、阿拉善、海南(青海)等地的排序靠前且均超過100%,對官方統計數據形成較好的補充。
到達量比重排序。
那么,“十一”黃金周期間的旅游者,又是從哪里來的?我們在離開量方面,主要考察從某地離開與到達該地的比值。該比值越大,當地用戶外出的傾向就越高。比值排行靠前的城市有烏魯木齊、蘭州、合肥、北京、澳門等地。將到達量與離開量繪制在一張圖上,平均值線上下兩部分的城市,可分別被劃分為長假人口“外出型”和“涌入型”的地區。
長假外出型城市和長假涌入型城市。
游客從哪里來,又到哪里去,哪些起訖點之間,游客流量最大?是短途游,還是長途游?
在城市間流量方面,將用戶離開與達到的單次數據通過空間分析進行聚合并分級統計,我們得到“十一”黃金周期間全國微博用戶流動的網絡圖。流量處于第一層級的城市對,包括北京-天津、成都-重慶、廣州-深圳等。第二層級前幾對的城市則包括廈門-漳州、南充-成都、渭南-西安等。這兩個層級的城市間流量合計占了全國總流量的16.6%。
圖上還能直觀看到一個由北京、上海、廣州、成都所構成的菱形結構,若再加上武漢、西安、山東半島及福建沿海城市帶(廈門-福州-漳州)的話,黃金周期間,微博用戶流動所刻畫出來的這個菱形,實質上與中國城市化水平最高的地區高度重合。
在第一和第二層級的城市對當中,除北京與上海、成都、廣州、西安之外,其余城市間的相互間距離均未超過300~400公里,用戶流動規模與移動距離呈明顯負相關關系。而北京則表現出了首都所具有的國家尺度吸引力水平。
在主要城市之外,我們還挑選了部分知名景區,研究其外地游客的主要來源。在這些景區中,烏鎮、青海湖和鼓浪嶼的主要外地客源,均來自自身所處的地域,而黃山、鳳凰和九寨溝的外地客源則具有更大的多樣性,景區影響力也更大。
部分景區客源分布。
游客在哪里會更多地談論“愛”和“美”
社交媒體最具價值的部分,依然是微博消息內容本身。
以烏鎮和九寨溝為例,在自然語言處理工具(Natural Language Processing,NLP)的幫助下,我們進一步對游客在黃金周第一天所發微博的內容進行了語義分析(Sentiment Analysis)。對比兩地的高頻詞后發現,在以周邊游為主的烏鎮景區內,游客留言相對具體,多次談及時間(“國慶”、“一天”)、事物(“水鄉”、“江南”、“旅游”)等,而九寨溝游客的留言則明顯趨向于情感化,以“愛”、“美”、“快樂”等詞語為主。
豐富的數據使我們可以回答諸如“某景區不同來源、不同類型游客在不同時間里都在贊美或吐槽什么”這樣的問題。
結語
2015年的“十一”黃金周,恰逢我國首部《旅游法》頒布實施兩周年。《旅游法》強調了以人為本的出發點,更注重保護旅游者的權力。其中明文規定,各地主管部門應建立旅游公共信息和咨詢平臺向旅游者提供必要信息和咨詢服務。
旅游作為典型的口碑經濟和體驗經濟,對行業和游客輿論應予關注。從購物到安全、從票價到擁擠,網絡輿情中各類關于景區的報道會對游客的消費決策產生明顯影響,公眾可以“用腳投票”選擇目的地。社交媒體上的公開數據進一步完善后,完全可以采集不同時間段、不同來源的游客反饋,進行提煉與分析,做出更有針對性的改善措施,這對旅游業的監管、運營及游客自身都意義重大。
目前全國納入旅游局直報系統的城市和景區僅有125處,而我國僅4A、5A級景區就有近千家,官方統計存在明顯不足。對整個旅游行業來說,社交媒體等網絡輿情信息經過挖掘能對官方數據形成補充,具有極大的科研、管理和商業價值,也是監管者、運營者與游客之間重要的即時互動橋梁。
故而,在傳統旅游公共信息平臺基礎上,各地還可以建立起一套囊括官方統計、新興媒體、物聯網監控等各類來源的旅游行業數據開放與治理體系,完善旅游開放數據的應用生態圈,集社會合力共同提升整個旅游行業的發展水平。