毕业论文
您现在的位置: 营销 >> 营销市场 >> 正文 >> 正文

常用的旅游大数据分析方法

来源:营销 时间:2022/10/22
生姜水能治白癜风吗 http://disease.39.net/yldt/bjzkbdfyy/6068509.html

大数据为旅游发展和旅游研究带来了巨大的机遇。随着数字技术、网络技术的飞速发展,大数据种类和规模的不断扩大,旅游大数据被应用于游客画像、游客满意度调查、舆情监测、客流统计、旅游推荐等场景中,而关于旅游大数据理论的探讨则主要集中在大数据下旅游管理模式、旅游流时空行为、游客情感体验和旅游舆情分析等领域的研究上。

无论是产业应用还是理论研究,都需要面对大数据数量,速度,多样性等不断增长的复杂性,并从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识。大数据的分析主要基于人工智能,机器学习,模式学习,统计学等。那么旅游大数据常用的分析方法有哪些呢?一起来看看吧!

1、Classification(分类)

分类是找出数据库中的一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别中。可以应用到涉及到应用分类、趋势预测中,如OTA根据用户在一段时间内的购买、评价等情况划分成不同的类,根据情况向用户推荐关联类的旅游线路、目的地或酒店,从而增加销量。

决策树是一种简单的机器学习算法,也是目前最流行的分类方法,决策树算法基于特征对样本进行分类,构成一棵包含一系列if-then规则的树,在数学上可以将这棵树解释为定义在特征空间与类空间上的条件概率分布。决策树的主要优点是分类速度快、健壮性好(训练数据可包含错误)、模型具有可读性,目前已被成功应用到旅行社CRM系统开发、旅游线路推荐等。

2、Regression(回归分析)

回归分析反映了数据库中数据的属性值的特性,通过函数表达数据映射的关系来发现属性值之间的依赖关系。它可以应用到对数据序列的预测及相关关系的研究中去。在旅游市场营销中,回归分析可以被应用到各个方面。如游客消费意愿;旅游消费及营销策划等。

分类和回归分析被称为有监督学习:

1)有标识;

2)通过模仿做出正确分类的已有数据,从而能够对新的数据做出比较准确的分类。这就像教小孩学习一样。

3、ClusterAnalysis(聚类分析)

聚类分析法也是常见的一种,简单来说,是自然的去分辨各种事物的组合,将类似的数据归类的一个集合的分析方法。但是,聚类分析是不可监控的方法,也就是说没有任何的因变量去判断测试每一个类别的内容是否正确,一个数据库应该有多少个类别,以及每个类别的定义也是无法确定的。

4、Associationrules(关联规则法)

关联规则是隐藏在数据项之间的关联或相互关系,即可以根据一个数据项的出现推导出其他数据项的出现。关联规则的挖掘过程主要包括两个阶段:第一阶段为从海量原始数据中找出所有的高频项目组;第二阶段为从这些高频项目组产生关联规则。关联规则分析最常见是在商业领域,商家可以使用此方法去鉴别购物中心每个商品的角色。比如著名的沃尔玛“啤酒与尿布”案例,理论上,这两种商品是毫无关联的,但是实际情况却是买尿布的多为男性,而男性在买尿布的同时30-40%的概率会同时选择自己心仪的啤酒。在金融行业企业中关联规则用以预测客户的需求,各银行在自己的ATM机上通过捆绑客户可能感兴趣的信息供用户了解并获取相应信息来改善自身的营销。

聚类和关联规则被称为无监督学习

1)无标识;

2)聚类:针对客户特征进行客户群划分。由此,可以对不同客户群采取差异化的促销方式;

3)关联规则:分析发现购买面包的顾客中有很大比例的人同时购买牛奶,由此我们可以将牛奶与面包放在同一个地方。

5、ANN(ArtificialNeuralNetworks)(人工神经网络)

神经网络作为一种先进的人工智能技术,因其自身自行处理、分布存储和高度容错等特性非常适合处理非线性的以及那些以模糊、不完整、不严密的知识或数据为特征的处理问题,它的这一特点十分适合解决数据挖掘的问题。人工神经网络的特点和优越性,主要表现在三个方面:第一,具有自学习功能。例如实现图像识别时,只在先把许多不同的图像样板和对应的应识别的结果输入人工神经网络,网络就会通过自学习功能,慢慢学会识别类似的图像。自学习功能对于预测有特别重要的意义。预期未来的人工神经网络计算机将为人类提供经济预测、市场预测、效益预测,其应用前途是很远大的。第二,具有联想存储功能。用人工神经网络的反馈网络就可以实现这种联想。第三,具有高速寻找优化解的能力。寻找一个复杂问题的优化解,往往需要很大的计算量,利用一个针对某问题而设计的反馈型人工神经网络,发挥计算机的高速运算能力,可能很快找到优化解人工神经网络的主要研究方向,同时ANN时常被定义为“黑匣子式”的解决方案,缺乏解释的定义,为什么神经网络会分类输出这样的结果,人们无法解释;输出结果不满意,也无法找到原因,只能不断尝试。

以上是最常见的大数据分析方法,业务场景不同,对数据分析的需求也会有所变化。有的业务类型只需用到其中一种分析方法就能得出结论,而有的业务需求则需要用到多种分析模型求解,方可挖掘出大数据的最大价值。

转载请注明:http://www.0431gb208.com/sjszlff/2236.html