PAGE
PAGE3
基于Goooseeker软件的旅游文本数据分析案例综述
目录
TOC\o1-3\h\u1936基于Goooseeker软件的旅游文本数据分析案例综述 1
100681.1正定古城游客的基本特征和行为分析 1
157221.1.1正定古城游客的基本特征 1
29321.1.2旅游动机 2
243541.2正定古城旅游形象高频特征词及频次分析 4
78441.2.1高频特征词分析 4
52921.2.2频次分析 6
45241.3社交网络图和共词矩阵分析 7
60271.4正定古城旅游形象感知分析 9
296051.4.1旅游景点 9
155221.4.2旅游环境 10
57531.4.3旅游体验 11
175321.4.4设施服务 11
148631.4.5人文感知 12
10091.4.6购物和娱乐 13
271721.5正定古城形象情感态度分析 13
1.1正定古城游客的基本特征和行为分析
本文利用Goooseeker软件对分词后的文本进行词频分析,以词云图的形式将植物种类高频词可视化处理,凸显核心词汇,并用Excel、Goooseeker软件对高频词选择并进行分析。
1.1.1正定古城游客的基本特征
首先对客源地进行分析,根据表5-1显示,网络评论中出现频数最高的为石家庄当地游客,其次是河北省其他城市和临近的北京市,其他与河北临近的省份中,山西和山东游客也出现了一定的频数,其他客源地游客则较少。从样本表5-1数据地区分布可以看出,正定古城目前的客源依然以周边城市为主,后续应在重视临近客源地的同时,也需要探索如何将正定古城文旅品牌推广到全国各地。
表5-1古城游客特征
客源地
频数
石家庄
108
河北省
65
北京
44
山东省
5
天津
4
山西
8
河南
1
湖南
1
由于所选目的地的客源地几乎都在目的地附近或周边,根据图5-1得知公交车来古城旅游居于首位,频数为66,占比48.5%;火车(含高铁)来古城旅游的频数为57,占比41.9%;开车来古城旅游的频数为10,占比7.4%;自行车来古城旅游的频数为3,占比2.2%。
图5-1正定古城游客交通出行频次
1.1.2旅游动机
旅游动机在一定程度上会直接影响形象感知。例如,商务人士大多是因公务活动,时间紧促,无暇顾盼太多,感知度较为浅显,地域较为集中;因中转而来的游客,时间短暂,行程安排较少,因而感知度也会大打折扣。
通过数据搜集筛查发现有些评论没有明确提到来正定原因,有173条评论提到来正定原因,如说马蜂窝网站的游客写道:“每个旅行者都有自己的理由,有的人为了风景名胜,有的人为了品尝异国风情的美食!在我眼里,旅行更多的是放松和度假,慢游是我旅行的态度,这次自驾游,也是慢悠悠的写意旅程。”如图5-2所示,因为休闲度假而来正定古城旅游的旅游者最多,共47条占比25%;其次,京津冀也是重要旅游集散中心之一,因为去北京等地旅游而在正定中转的有26条,占比14%。如携程网网友写道:“其实正定只是本次旅程的中转站,顺便路过,也算来过石家庄市。”另外,因商务活动以及公司福利等出游的有39条,占总数21%,为了探寻美食而来正定古城旅游的有30条,占16%。也有旅游者来正定旅游仅仅是为了增加旅游足迹,共15条占8%,剩余为探亲访友11条、亲子教育5条。
图5-2来正定旅游动机分布图
1.2正定古城旅游形象高频特征词及频次分析
1.2.1高频特征词分析
图5-3高频词特征分析
用GooSeeker平台的“选词结果”功能,根据图5-3分析出与正定古城旅游目的地形象相关的高频特征词汇。选词后,GooSeeker将正定古城旅游形象样本数据调查中出现的高频特征词生成词云图像,以便更有效地观察游客对目的地形象的直接感受。通过前期对899个网络样本数据进行一个初步的处理,本次数据的分析共获得400个旅游形象属性高频词,之后通过使用GooSeeker平台中的“选词结果”功能选项,分析得出与正定古城旅游目的地形象相关的高频特征词汇。
旅游形象特征词根据表5-2得知主要由名词、动词、形容词和副词四种词性组成,其中数量最多的是名词,其次是动词和形容词。其中景点名称、专有名词、食物等对旅游目的地的描述主要是名词,如景点名称;专有名词如遗址、寺庙;美食。游客在旅游过程中的行为或状态多为动词,如“喜欢”等词语形容词多为描述游客对旅游形象特征感知的要素,如描述对景点、历史遗迹的评价如独特、气势磅礴等。通过整理前100高频标签词、结合高频词表中的形容词与副词我们可以看出,“老街”、“丰富”、“特色”等词语是对正定古城地理位置以及游客感受的描述;“到达”、“公交车