《網(wǎng)絡(luò)信息搜索的旅游需求預測》由會員分享,可在線閱讀,更多相關(guān)《網(wǎng)絡(luò)信息搜索的旅游需求預測(5頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、網(wǎng)絡(luò)信息搜索的旅游需求預測
網(wǎng)絡(luò)信息搜索的旅游需求預測
2014/07/15
《系統(tǒng)管理學報雜志》2014年第三期
1文獻綜述
1.1旅游需求預測對于從事旅游業(yè)的各部門和機構(gòu)而言,準確預測旅游需求至關(guān)重要。由于旅游產(chǎn)品從本質(zhì)上講是“易逝”的(例如未賣出的航班座位、旅館房間等不能像其他產(chǎn)品一樣儲存),因此預測的準確性尤為關(guān)鍵,精確的短期預報能夠有助于更好地制定日程計劃、人員安排以及應急預案等。因此,旅游需求預測模型得到了學界和實務(wù)界共同關(guān)注。根據(jù)文獻中的評述,圍繞這一領(lǐng)
2、域國外旅游期刊上共發(fā)表了數(shù)百篇論文,利用各種定性和定量方法,對不同目的地的旅游業(yè)進行預測。定量預測研究大體上可以分為兩大類:時間序列模型和經(jīng)濟計量模型,時間序列模型用旅游需求的歷史量以及隨機擾動項進行預測,重點在于研究歷史變動趨勢和模式,而經(jīng)濟計量模型則研究各種經(jīng)濟指標對旅游需求的影響。對于經(jīng)濟計量模型,游客接待量是反映旅游需求最為通用的指標,而解釋變量則千差萬別,其中,游客收入、目的地旅游價格與來源國價格之比、其他目的地旅游價格以及匯率是影響旅游需求最重要的指標。從分析的粒度來看,大部分研究以國家和地區(qū)為研究對象,時間頻率多為年度、季度和月度,以長期預測為主,很少有研究以天為時間單位預測短期
3、旅游需求。近年來,國內(nèi)對旅游需求的研究發(fā)展很快,但多是對國外理論的引介,實證研究較少,特別是以景區(qū)為對象的微觀研究則更少。例外的是,文獻中分別以海南省天涯海角景區(qū)、四川九寨溝景區(qū)和重慶武隆景區(qū)為對象對旅游流量進行了預測。然而,該類研究大都以單一景區(qū)為研究樣本,從而在一定程度上影響了研究結(jié)論的外部效度??傮w而言,現(xiàn)有旅游需求預測研究對影響旅游需求的因素、旅游需求預測方法等領(lǐng)域有著較為扎實的基礎(chǔ)。然而,從實證研究的具體應用角度而言,數(shù)據(jù)的時間分辨率和空間分辨率較低(時間尺度多為月或年,空間分辨率多為國家或省市)。因此,盡管這些研究能夠為宏觀政策制定提供參考,但是在短期(例如以周/天為時間單位)、特
4、定景區(qū)的游客需求預測方面現(xiàn)有研究仍顯不足;同時,由于依賴于統(tǒng)計部門或市場調(diào)研機構(gòu)發(fā)布的數(shù)據(jù),現(xiàn)有研究一般都有時間滯后,無法做到實時預測。而在黃金周這類旅游需求集中釋放時期,及時的預測往往又是最為需要的。由于網(wǎng)絡(luò)信息搜索數(shù)據(jù)具有精度高、實時性強的特點,因此能夠?qū)鹘y(tǒng)時間序列模型和經(jīng)濟計量模型進行有效補充。
1.2網(wǎng)絡(luò)信息搜索在各種消費者行為模型當中,信息處理理論都占有重要地位[,這一理論認為消費者決策過程包含5大過程:問題認知、信息搜索、評價、選擇、購買后過程。旅游服務(wù)的特點決定了旅行決策通常伴有較高的風險,因此游客會采取各種策略降低風險,其中就包括進行廣泛的信息搜索。在旅游目的地選擇過程中,
5、游客會形成并逐漸縮小備選集并最終做出選擇,這一過程同時受到社會心理和非社會心理因素的影響,這些因素分為4類:內(nèi)部變量(態(tài)度、價值觀、生活方式、動機、意愿、人格特征等)、外部變量(預算限制、目的地的吸引力、營銷組合、家庭成員或熟人的影響、文化和亞文化等)、旅行本身的特點(規(guī)模、距離、時間等)以及旅行體驗(旅行中的情緒和感受、購買后評價等),而最終目的地的選擇取決于這些變量之間的相互作用。文獻中針對游客信息搜索行為提出了一個整合了心理、經(jīng)濟和信息處理視角的綜合理論模型,提出盡管有多種因素影響搜索行為,但是這些因素大都經(jīng)由對目的地的熟悉程度和經(jīng)驗2個中介變量產(chǎn)生影響。文獻[中利用實驗室環(huán)境下開展的現(xiàn)
6、場研究方法,對網(wǎng)絡(luò)用戶的旅行信息搜索行為進行了研究,結(jié)果發(fā)現(xiàn),搜索引擎在搜索過程當中發(fā)揮了重要作用。傳統(tǒng)上,游客常用的信息來源包括旅行社、旅游傳單/畫冊、廣告、游客中心等。與此不同的是,互聯(lián)網(wǎng)是一個由相互鏈接的網(wǎng)頁節(jié)點組成的大型超鏈接系統(tǒng),其優(yōu)點是有助于用戶快速獲取大量信息并進行自由組合,但是由于缺乏傳統(tǒng)信息的結(jié)構(gòu)化特點,因此,用戶要找到想要的信息需要花費更大的認知努力。而搜索引擎可以被看成是“互聯(lián)網(wǎng)上的哈勃望遠鏡”,能夠幫助游客從數(shù)以億計的網(wǎng)頁中定位所需要的旅游信息。有研究顯示,關(guān)鍵詞搜索是游客在線信息搜索時最常用的策略,平均八成以上游客在利用互聯(lián)網(wǎng)搜索信息時會使用搜索引擎的關(guān)鍵詞搜索功能。
7、因此,以搜索引擎關(guān)鍵詞搜索為指標的網(wǎng)絡(luò)信息搜索有可能反映游客的旅游意愿并用于旅游需求預測。遺憾的是,目前有關(guān)網(wǎng)絡(luò)信息搜索、特別是搜索引擎的研究大多集中于計算機科學和信息科學領(lǐng)域,盡管已經(jīng)開始出現(xiàn)少量研究探討了網(wǎng)絡(luò)信息搜索與經(jīng)濟行為的相關(guān)性[18-22],但這些研究大多以宏觀綜合經(jīng)濟指標為對象(例如失業(yè)率、CPI等),網(wǎng)絡(luò)信息搜索是否能夠?qū)ξ⒂^主體的市場表現(xiàn)產(chǎn)生預測作用仍不清楚。本研究將網(wǎng)絡(luò)搜索作為衡量游客信息搜索的直接指標,基于景區(qū)層次的面板數(shù)據(jù),利用搜索引擎數(shù)據(jù)的實時性特點,以天為時間尺度探討網(wǎng)絡(luò)信息搜索對旅游需求的影響。
2實證研究
2.1數(shù)據(jù)本研究使用的景區(qū)樣本為納入四川省假日旅游統(tǒng)
8、計系統(tǒng)的九寨溝、黃龍等21個景區(qū)1)。旅游數(shù)據(jù)來自于四川省旅游局(具體數(shù)據(jù)可從四川省旅游局網(wǎng)站直接獲得2)),分別采集2010~2011年2個“十一”黃金周期間各景區(qū)的日游客接待量作為反映旅游需求的指標。游客搜索行為是通過關(guān)鍵詞搜索反映的,搜索數(shù)據(jù)來自于百度指數(shù)。百度是全球最大的中文搜索引擎,截至2012年第三季度,百度在國內(nèi)的市場份額達到80.3%,遠遠超過其后的谷歌中國(14.6%)、搜狗(2.3%)和搜搜(1.5%)[23]。百度指數(shù)是以百度網(wǎng)頁搜索為基礎(chǔ)的免費海量數(shù)據(jù)分析服務(wù),用以反映不同關(guān)鍵詞在過去一段時間里的“用戶關(guān)注度”。用戶關(guān)注度是以數(shù)千萬網(wǎng)民在百度的搜索量為數(shù)據(jù)基礎(chǔ),以關(guān)鍵詞
9、為統(tǒng)計對象,表示各個關(guān)鍵詞在百度網(wǎng)頁搜索中搜索頻次。百度指數(shù)每天更新1次,并且提供自2006年6月至今任意時間段的用戶關(guān)注度數(shù)據(jù)。圖1為百度指數(shù)的一個應用示例,顯示的是2012年2個景點峨眉山和青城山的用戶關(guān)注度變化趨勢。由圖1可以看出,在2012年的大部分時間里,峨眉山受關(guān)注程度要高于青城山,其中在4~9月份旅游旺季期間兩景區(qū)的用戶關(guān)注度的差距較大(前者約為后者的3倍),而在1~3月以及10~12月旅游淡季期間兩景區(qū)的差距較?。ㄇ罢呒s為后者的2倍)。由于百度指數(shù)僅以圖形形式提供關(guān)鍵詞的用戶關(guān)注度變化情況,并無提供源數(shù)據(jù)導出的功能。因此,本研究采用了一種數(shù)據(jù)抓取軟件獲取數(shù)據(jù)。一般而言,本研究所
10、使用的關(guān)鍵詞來自于景區(qū)的正式名稱,同時對其全稱取其簡稱作為搜索關(guān)鍵個原因:①大部分景區(qū)的全稱對應的網(wǎng)絡(luò)搜索量不夠,無法獲取其百度指數(shù);②假定游客在出行前搜索景區(qū)相關(guān)信息時會選擇能夠代表景區(qū)(無歧義)的最簡關(guān)鍵詞(即簡稱)進行搜索。從百度提供的相關(guān)詞功能看,游客在搜索景區(qū)相關(guān)信息時,除了會直接關(guān)注景區(qū)信息,還會對其他相關(guān)信息進行搜索。排在前面幾位的關(guān)鍵詞為:天氣、門票、地圖、旅游攻略、住宿等(表示景區(qū)名稱),這也驗證了文獻[24]中的觀點,即搜索請求反映出用戶的目標并且信息目標占主導地位。需要說明的是,由于假定搜索關(guān)鍵詞反映的是游客的旅游意愿,因此最終的數(shù)據(jù)中刪除了有歧義的景點信息(僅包括黃龍景
11、區(qū),原因在于對關(guān)鍵詞“黃龍”的搜索可能指代游戲“黃龍騎士團”或“黃龍溪古鎮(zhèn)”)。此外,有2個景區(qū)由于搜索量不足無法獲取其搜索數(shù)據(jù)(華鎣山石林和梓潼七曲山)而被排除掉。因此,最終的面板數(shù)據(jù)包括了2010~2011年2個“十一”黃金周期間18個景區(qū)的日游客流量及相應的景區(qū)搜索量(具體景區(qū)為碧峰峽、都江堰、峨眉山、海螺溝、九寨溝、恐龍博物館、樂山大佛、青城山、三星堆、石象湖、蜀南竹海、四姑娘山、瓦屋山、西嶺雪山、小平故居、興文石海、中國死海以及閬中古城)。與現(xiàn)有旅游需求經(jīng)濟計量模型研究一致,本研究還收集了各景區(qū)的門票價格。表1列出了數(shù)據(jù)的統(tǒng)計描述情況。由表1可以看出,各景區(qū)的游客量和搜索量逐年增加,
12、游客量的偏度和峰度逐年減小,逐步趨向于正態(tài)分布,而搜索量在該指標上變化的方向相反。相關(guān)分析表明,搜索量和游客量之間的相關(guān)系數(shù)為0.35(P<0.01)。圖2反映了搜索量和游客量之間的相關(guān)性3)??梢钥吹?,大部分景區(qū)位于了線性擬合95%置信度區(qū)間以內(nèi)。就單個景區(qū)而言,小平故居和閬中古城在置信區(qū)間以上且偏移較遠,可能的原因是小平故居屬于紅色旅游景點,游客大多來自單位組織,而閬中古城屬于古鎮(zhèn)類旅游景點(區(qū)別于其他自然風光類景點),因此搜索量較少而游客量較多。在置信區(qū)間以下且偏移較遠的是四姑娘山和西嶺雪山,游客量與搜索量之比低于平均水平,說明部分旅游需求尚未滿足,景區(qū)有待進一步開發(fā)。
2.2模型估計
13、首先采用自回歸時間序列模型作為基準模型,然后在基準模型的基礎(chǔ)上加入搜索指標作為搜索模型,分別估計模型參數(shù)并進行比較。本研究所有的分析通過Stata11.0完成,盡管不同的計量軟件可能導致參數(shù)估計出現(xiàn)細微差別,但這不應在統(tǒng)計義上影響本研究的總體結(jié)論。利用廣義最小二乘法(GLS)對上述模型進行估計,結(jié)果顯示,基準模型可以解釋游客流量92.9%的方差,而搜索模型能夠解釋游客流量95.1%的方差,提高了2.2%。增量F檢驗顯示,這一差異在統(tǒng)計上是顯著的(WaldChi-Square(1)=440.08,P<0.001),這表明,網(wǎng)絡(luò)搜索指標能夠顯著提高模型的解釋能力。Rho值(不可觀測的景區(qū)異質(zhì)性導致
14、的方差所占比例)從基準模型的36.8%下降到搜索模型的10.7%,說明所增加的搜索增量指標能夠反映部分景區(qū)異質(zhì)性信息。就單個解釋變量而言,搜索增量與景區(qū)游客流量之間存在顯著的正相關(guān)關(guān)系(β=3.33,P<0.001),驗證了網(wǎng)絡(luò)信息搜索能夠反映旅游需求的假設(shè)。結(jié)果還顯示,上一年游客流量與當年游客流量顯著正相關(guān)(β=1.06,P<0.001),這與自回歸模型的假設(shè)是一致的。此外,景區(qū)價格對游客流量的影響在5%的水平下不顯著(β=-1.47,P=0.76),這表明,對于在黃金周集中出游期間,景區(qū)門票價格對游客旅游目的地決策不存在顯著影響。表2列出了基準模型和搜索模型的估計結(jié)果比較。2.3模型驗證下
15、面采用模型估計———樣本外預測的程序評估預測模型的外部效度。由于數(shù)據(jù)量限制,很難將據(jù)集隨機分為估計樣本和預測樣本,因此本研究采用如下輪轉(zhuǎn)方法進行處理:輪流將18個景區(qū)中的1個景區(qū)作為預測對象,利用其他17個景區(qū)的數(shù)據(jù)估計模型參數(shù)并進行樣本外預測,分別計算出基于基準模型和搜索模型的預測值,然后評估基準模型和搜索模型預測值與實際值之間的誤差。根據(jù)文獻[25]中提出的準則,本研究選擇平均絕對誤差(MAE)和均方根誤差(RMSE)作為反映預測準確性的指標:表3列出了旅游需求預測驗證結(jié)果??梢钥闯?,對于大部分景點而言,基于搜索模型的預測值誤差小于基于基準模型的預測值誤差。平均而言,在MAE和RMSE這2
16、個指標上,基于搜索模型的預測誤差分別比基于基準模型的預測誤差小約808(人次)和1179(人次),使預測精度分別提高了約41%和43%。盡管網(wǎng)絡(luò)搜索指標對預測誤差的改進取決于具體的預測模型和數(shù)據(jù)樣本,但是從以上的對比中還是能夠看出網(wǎng)絡(luò)搜索指標的價值。圖3以箱線圖的形式驗證了搜索數(shù)據(jù)的預測效度。由圖3可看出,不論是MAE指標還是RMSE指標,基于搜索模型的預測的誤差都低于基準模型的誤差。為了進一步驗證這一差異是否具有統(tǒng)計意義,首先計算出每組數(shù)據(jù)基于不同模型的預測值絕對誤差,然后進行配對T檢驗。結(jié)果顯示,在0.1%的顯著性水平上,基于搜索模型的預測誤差顯著低于基于基準模型的預測誤差(t=4.35,
17、P<0.001)。由此可見,基于網(wǎng)絡(luò)信息搜索的模型能夠顯著提高旅游需求預測的準確性。
3結(jié)語
本文從旅游需求預測和信息搜索理論出發(fā),重點討論了網(wǎng)絡(luò)信息搜索在旅游需求預測中的作用,并通過模型估計和驗證對所提出的搜索模型的預測準確性進行了評價。結(jié)果顯示,以搜索引擎關(guān)鍵詞搜索為基礎(chǔ)的旅游網(wǎng)絡(luò)信息搜索是反映游客出游意愿的有效指標,結(jié)合了網(wǎng)絡(luò)信息搜索的旅游需求預測模型能夠?qū)Χ唐?、景區(qū)層次的旅游需求進行及時、準確的預測,在MAE和RMSE這2個指標上相對于基準模型預測精度分別提高約41%和43%。從研究方法論層次看,本文的研究結(jié)果提出了一個新的、基于網(wǎng)絡(luò)信息搜索的預測指標,驗證了網(wǎng)絡(luò)搜索對需求預測的增
18、量解釋能力,從而表明,基于網(wǎng)絡(luò)信息搜索的預測是對傳統(tǒng)旅游需求預測方法的有效補充。從現(xiàn)實意義來看,隨著互聯(lián)網(wǎng)發(fā)展成為游客獲取信息并購買相關(guān)產(chǎn)品的途徑之一,各旅游部門、機構(gòu)和旅游從業(yè)者將能夠及時、便捷地通過搜索引擎等工具提前了解游客出游意愿,并且將網(wǎng)絡(luò)搜索信息整合到現(xiàn)有需求預測模型當中,提高旅游需求預測的準確性。特別是在黃金周這類旅游需求集中釋放時期,對各景區(qū)游客流量進行及時、準確的預測將為旅游有關(guān)部門和機構(gòu)提供可靠的決策依據(jù),例如提前發(fā)布流量預報、制定限流方案等,幫助實現(xiàn)從“被動應急”轉(zhuǎn)變?yōu)椤爸鲃诱{(diào)控”,促進旅游業(yè)實現(xiàn)可持續(xù)、生態(tài)友好型發(fā)展。由于數(shù)據(jù)可獲得性等原因,本研究只對“十一”黃金周的旅游
19、需求進行了驗證,模型是否適用于非假日旅游需求的預測還有待驗證。例如,本研究模型估計結(jié)果顯示,旅游目的地價格對旅游需求影響不顯著,這可能是我國特有的黃金周休假制度帶來的旅游需求集中釋放引起的,非假日情況下這種情況可能有所不同。由于旅游決策受到出行地和目的地之間的距離和交通等因素影響,在本研究模型基礎(chǔ)上,如果能區(qū)分本地和外地旅游需求并結(jié)合相應的網(wǎng)絡(luò)搜索數(shù)據(jù),將可能進一步提高模型的解釋和預測能力。
作者:王煉賈建民單位:西南交通大學經(jīng)濟管理學院香港中文大學工商管理學院
上一個文章: 汽車零部件制造商與再制造商的競爭下一個文章: 產(chǎn)能隨機下的零售商訂購策略