研究緣起
2016年,筆者出訪澳洲昆士蘭大學,在與澳洲學者、澳洲旅遊局和當地的導遊交流過程中,聽到澳方旅遊業界人士「抱怨」中國遊客對他們主打的旅遊產品貌似不欣賞,反而十分熱衷於購物和「走馬觀花」式的遊覽。當時對於這種評價並不陌生,因為中國遊客在全世界都有這種消費特徵傾向。但是,隨後筆者發現,經過官方調查和深度研究之後做出來的旅遊宣傳視頻依然對筆者和同行之人缺乏吸引力,於是筆者決定用有別於官方調查的方法來研究中國遊客與外國遊客之間的行為差異,最終促成此文。當時第一輪試算結果出來之後,筆者和廣大讀者一樣,都是大跌眼鏡,名不見經傳的「阿德萊德」居然排名第一,著實出乎意料,我們將此結果與澳洲同行交流,也讓他們甚為詫異,個別學者還激動地跟筆者展開爭論,質疑我們的數據和算法有問題。正是這些交流和爭議,讓筆者逐步完善此文,藉此機會為他們的貢獻表示感謝。同時,感謝趙創鈿、朱毅玲和許美燕為本研究數據收集和處理所做的貢獻。
當前中國日漸成為國際旅遊市場中重要的客源地,出境遊客數量不斷攀升,並在 2014年首次過億。在此背景下,如何更精確地解析中國遊客對海外旅遊地的偏好、興趣和評價等特徵,成為學術界、業界和政府關注的焦點。
當前國際學者們主要關注中國出境遊群體的需求動機、目的地形象感知、出行特徵等議題,並進一步依據滿意度影響因素來探究中國遊客群體的評價特徵。但是,這些研究尚不足以判斷並解釋中國遊客的旅遊偏好和情感特徵。
基於上述研究缺口,本研究藉助網絡大數據研究分析方法,基於遊客情感分析理論,以赴澳中國遊客發布在國內旅遊網站的評論為素材展開分析,發現中國遊客與國際遊客在旅遊偏好與情感特徵方面與國際遊客存在較大差異,深入分析其差異性,繼而解析主要影響因素。
我們在遊客偏好和評價方法方面做出了突破性和創新性貢獻,有助於更好地指導國際旅遊目的地改進針對中國遊客的營銷策略和方式,應用前景廣闊。
本次研究選擇澳大利亞作為研究區域,主要出於兩方面考慮。第一,澳大利亞城市較少,近年旅遊資源狀況變動不大,數據穩定,開展對比分析可行性較強。第二,中國是澳大利亞旅遊市場中極為重要且增長迅猛的國際市場,2015年中國赴澳遊客的人數達到102.36萬人,較上年增長21.94%,以澳大利亞為研究區域具有較好的現實指導意義。在此基礎上,我們選取了澳大利亞10個著名的旅遊城市為案例地,分別是:坎培拉、雪梨、墨爾本、布裡斯班、凱恩斯、黃金海岸、阿德萊德、珀斯、霍巴特和北領地。其中,北領地為澳大利亞北方的自治領地,該區域包含艾爾斯巖、愛麗斯泉、帝王谷等著名景點,分布較為分散,故以北領地統稱。
圖片來源:網絡
我們採集的數據來源於窮遊網、螞蜂窩網、攜程網3個當前中國知名度較高的旅遊社交網站,利用網絡爬蟲工具共抓取36148條旅遊在線評論,總字數超過247萬字。數據收集時間截至2016年3月,所獲得的評論主要來自於2012—2015年。
在數據處理上,本研究首先構建了基礎旅遊分析詞庫,在 HowNet(知網)詞典詞庫的基礎上,通過大量讀取和整理旅遊在線評論、遊記、旅遊文獻,提煉出旅遊專屬詞庫。內容覆蓋旅遊景區、餐飲、交通、住宿、娛樂、購物6個方面,共包含317個正面詞彙和185個負面詞彙。最終所構建的完整遊客情感評價詞庫共包含3507個正面詞彙和3365個負面詞彙。其次,考慮到中國遊客表達的語義邏輯特徵,筆者進一步對情感評價詞前的程度副詞、否定副詞、轉折詞的作用進行梳理和解析,對於不同的詞語賦予不同的係數,構建了一套情感得分計算規則。
表1:語義邏輯詞類和係數判定表
本次研究將採集到的評論,基於上述規則進行情感得分計算,當總得分中正面情感得分超過負面情感得分時,將此條評論判定為正面評論,反之亦然。在上述各種處理之後,我們藉助武漢大學瀋陽教授團隊開發的內容挖掘軟體ROST CM6中的「社會網絡與語義網絡分析」功能,對已區分的正負面評論進行量化處理,生成關鍵詞共現網絡圖,用於進一步分析正負面評價的結構與特徵。
經過上述方法處理,本研究總共提煉出96653個正面詞彙和14989個負面詞彙,正面詞彙約為負面詞彙的6.45倍;在設定規則的判斷下,正面、中性和負面評論分別為28 568條、4646條和2934條,以正面評論為主。其中,阿德萊德和凱恩斯是獲得正面評論比例較高的城市,均超過80%;而獲得負面評論較多的是霍巴特,比例超過10%;其它均保持較低水平;相對而言,坎培拉和布裡斯班獲得的評論比較中性。
表2:澳大利亞城市遊客情感評價中外比較排名
中國遊客最「愛」的城市主要是阿德萊德、雪梨和墨爾本。因為雪梨和墨爾本為綜合性旅遊城市,提供多樣的旅遊吸引物和完善的旅遊服務配套,滿足中國遊客觀光、休閒、度假等旅遊需求。相對而言,精緻小城市型的阿德萊德,雖然吸引點不夠豐富,但旅遊資源本底較好,沒有太多讓遊客產生負面情緒的資源和服務,因此它在中國遊客的情感排名中位居第一名,正面評論比例高達81.8%。
圖片來源:網絡
讓中國遊客最「怨」的城市主要是霍巴特和北領地,這些城市屬於邊緣型城市,旅遊吸引物以歷史遺址、土著文化、沙漠風光為主,區位較偏遠,不在主要遊線上,旅遊服務配套不夠完善,再加上不良天氣、惡劣環境和交通等要素的存在,更容易觸發中國遊客的負面情緒和厭惡情感。
圖片來源:網絡
以「愛怨交織」為特徵的城市主要是單一旅遊資源型城市,比如凱恩斯和黃金海岸。這些城市具有重要的吸引物,如大堡礁、衝浪者天堂,也提供受青睞的特色體驗活動。但由於缺乏多樣性,單一旅遊活動較為集中之後,容易產生擁擠、消費水平過高等負面印象,而且因為冒險類活動較多,容易讓中國遊客產生明顯的負面情緒。
圖片來源:網絡
最後,讓中國遊客較為「無感」的城市為布裡斯班和坎培拉,中性情感評論佔據較高比例。其主要原因是該類城市的旅遊吸引物不突出,城市的主要職能也不是旅遊。布裡斯班主要是東海岸等旅遊資源點的集散地,而坎培拉是首都,因此較難獲得遊客的青睞。
為比較中國遊客與國際遊客的偏好差異,我們選取了Tripadvisor上對澳大利亞旅遊景點的旅遊評論排名作為參照,截取同樣的時間段中2450條由國際遊客填寫的旅遊評論,構建國際遊客群體的評論語義網絡圖。通過對比發現,中外遊客對澳旅遊城市的偏好和情感特徵存在重大差異。中國遊客群體對澳的遊客情感特徵的特殊性十分明顯。
圖1:中國遊客總體評論語義網絡圖
圖2:外國遊客總體評論語義網絡圖
其次,通過對比中外遊客評論的語義網絡圖可以發現,中國遊客的網絡圖呈現多中心結構,分散組合成不同的網絡;相反,國際遊客群體的網絡圖以核心高頻詞「地方」作為單一中心節點,直接與多個要素關聯。
從要素內容上看,中國遊客關注建築、動植物、海濱等目的地要素,體現在「歌劇院、袋鼠、海灘」等高頻詞,同時也偏好觀光類、休閒度假類的旅遊活動,比如「欣賞、觀光、衝浪」。
圖片來源:網絡
相反,從「藝術、博物館、咖啡館、花園」等高頻詞看出外國遊客關注藝術類、當地文化類或生活類的吸引物,同時還傾向於參加社交活動類和知識教育類的旅遊活動,體現於「朋友、野餐、咖啡、放鬆」和「孩子、導遊、展覽、參觀、博物館」兩類詞。由此可見,中外遊客群體在吸引物類型和旅遊活動類型這兩個維度存在差異。
在識別出中國赴澳遊客總體評價關注點的基礎上,我們進一步提取10個城市的正、負面評論,分別進行語義分析,構建語義網絡圖,探索正負面評價產生的緣由。其中,節點代表高頻要素,節點之間的連線表示要素間的聯繫,線條的疏密代表共現頻率的高低。
從正面評論網絡圖的總體結構來看,雪梨和墨爾本這兩個城市在遊客評論中的關聯度最高,其它城市基本不可見。
圖3:正面評論語義網絡圖
負面評論所構建的語義網絡圖中,「雪梨、澳大利亞、建築、地方、時間」5個詞語構成了一級核心,表明這些核心吸引物同樣也是負面情緒的主要來源。
圖4:負面評論語義網絡圖
將正負面語義網絡中的關鍵詞進行分類,可以發現,遊客的正負面情緒雖然來源於相似的要素,但是內容卻有較大的差異。在目的地要素方面,正面情緒主要來源於餐飲、購物和中心區位;而負面情緒主要來源於唐人街、擁擠、天氣、排隊等因素。在吸引物類型方面,正面情緒主要來源於「濱海」、「動植物」和「建築」,相對而言,中國遊客對「土著文化」和部分澳大利亞的「歷史遺蹟」沒有好感。此外,澳大利亞的景觀特點容易致使中國遊客產生正面情緒,而冒險類的旅遊活動則容易觸發遊客的負面情緒。
第一,基於情感特徵的中外遊客旅遊偏好存在著重大差異,中國遊客給予正面評價的旅遊地與倍受國際遊客好評的旅遊地完全不一致,而且主要關注的要素比國際遊客更為多樣和分散,其內容也與國際遊客有一定的差異。我們認為這種差異可能是因為中國遊客和外國遊客處於旅行者職業生涯階梯的不同層級造成的,也可能是文化偏好差異所決定的。中國遊客主要為了滿足放鬆、觀光和安全的需求,而國際遊客更注重休閒度假和自我實現的需求。
第二,讓中國遊客產生正負面評價的因素略有不同,中國遊客儘管對某些旅遊服務或因素不滿意,但仍願意給予好評。中國遊客對澳大利亞的餐飲、建築、購物、自然環境、地標性景觀和多樣化旅遊資源都給予較多的好評,而對地方文化,例如土著和一些歷史遺蹟,以及冒險類旅遊活動均無好感。我們發現,中國遊客普遍對澳大利亞的旅遊購物給予好評,但對唐人街等中國元素給予差評,這與澳大利亞旅遊局所做的滿意度調查結果相反。通過進一步解讀評論內容,發現中國遊客對旅遊購物的好感來源於商品本身,而對中國元素不滿是因為唐人街的飲食體驗和購物信用狀況均較差。
第三,中國遊客對澳大利亞旅遊城市的情感喜好,與其旅遊資源的豐富程度和城市基本職能存在一定關聯。與單一型旅遊城市相比,綜合型旅遊城市更容易獲得遊客的好評。
基於上述發現,我們對旅遊目的地營銷和發展提出3點建議。
首先,旅遊目的地管理當局要充分認識到旅遊大數據的重要性,並掌握正確的數據挖掘方法。不能持續依靠小規模調查訪談反饋回來的局部情況,來制定整體性的戰略,建議善用當前已經可獲取的在線旅遊大數據來獲取全局評價和判斷。
第二,在使用大數據時,要注意使用正確的數據挖掘和分析方法。當前可用的在線旅遊大數據中,旅遊電子商務網(如Tripadvisor和攜程等)上酒店等預定類產品中,有兩類數據存在潛在的不準確性,星級評分和消費者商品評論。要注意使用科學的方法進行數據挖掘和清洗,進一步從遊記和評論中去分析真實的情感特徵,從而為旅遊目的地的發展提供更加科學的決策支持。
第三,具體到澳大利亞的旅遊目的地,我們建議其近期應該開展營銷策略調整,重新定位本國的旅遊城市體系,並確立相應資源營銷策略。
研究升華
在完成中文版本的研究後,我們使用了Co-occurence(共現)算法優化了我們的情感分析模型,對所有評論的高頻詞生成共現矩陣,再使用Gephi軟體,對共現矩陣進行可視化,更加精確地捕捉到遊客評論所映射出來的情感畫像(詳見圖1-圖4)。於此同時,我們藉助旅行者職業生涯階梯和文化差異這兩個理論框架對結果進行解釋,發現這兩個理論均未能很好的解釋中外遊客的情感差異。因此,我們在原來的結論上增加了重要的一條:不能籠統的認為中國遊客與國際遊客情感差異來源於文化與旅行經驗的差異,需要更多的數據和更為精確的方法來捕捉和解析這個動問題。這個優化後的成果最終於2019年發表在當前旅遊學界排名第一的期刊《Tourism Management》之上(2018 IF : 5.92),為本話題的研究畫上一個圓滿的句號。
引用文獻
劉逸, 保繼剛, 陳凱琪. 中國赴澳大利亞遊客的情感特徵研究——基於大數據的文本分析[J]. 旅遊學刊, 2017, 32(5): 46-58.
LIU Yi, HUANG Kaixuan, BAO Jigang, CHEN Kaiqi. 2019. Listen to the Voices from Home: An Analysis of Chinese Tourists' Sentiments regarding Australian Destinations. Tourism Management, 71, 337-347.
長按識別二維碼關注我們