毕业论文
您现在的位置: 营销 >> 营销市场 >> 正文 >> 正文

贝叶斯推理实践数据分析研学系列

来源:营销 时间:2024/8/9
作者:陈耀作为一个管理者你每天工作中最重要的事是什么?在你职业管理的生涯中感觉最难的是什么?你认为管理工作的核心是什么?众多参与调查者的答案是:决策“管理就是决策”———希尔伯特·西蒙(HerbertSimon)决策之所以难,在于影响决策的因素众多,要提升决策成功的概率,涉及的学科繁多,很多人对于数据、信息缺乏运用科学工具有效处理的能力。通俗的说决策有以下三种:完全理性的决策(最优决策);有限理性决策(最满意的决策);博弈论决策(随机决策)。数据化决策使最优决策成为可能!聚焦到旅游服务业、酒店业、餐饮业的日常管理和决策,还普遍停留在对数据、信息做被动性的描述分析,这和主动性的预测分析之间存在着一道学界称之为“布德罗之墙”的阻隔,一墙之隔很难理解主动性预测分析的神奇和强大,跨越这道阻隔称之为顿悟应该不为过。当代有志于拥有强大竞争力的企业和职业经理人,科学的数据化思维是必须的,破解的前提是理解和掌握数据分析方法所必须的技能。数据化分析工具众多,我们就从贝叶斯推理开始谈起,贝叶斯算法主要是利用已知来估算未知,无论在生活还是工作中都在普遍运用,只是很多人不知道该法则的存在。行业专家,优秀的职业经理人不少属于具有相对纯粹的贝叶斯思考能力的管理者。贝叶斯较符合人们循序渐进的思考习惯,且很多决策无法获得真实数据,依托现代计算机的大量运用,如能熟练的掌握该法则,对于管理决策意义重大。两大学派21世纪已经进入数据化决策时代,可以预见,不远的将来不懂得基于数据化分析和决策的企业定会处于极其不利的竞争地位。数据化决策的基础是统计决策理论,统计学中最著名的两大派系是“频率学派”和“贝叶斯学派”。数据决策所需的数据信息主要有三种,总体信息,样本信息和先验信息。总体信息:是指所研究的问题的分布情况,是所涉及的问题的信息总和。样本信息:总体信息中抽取的有限信息,来分析关于总体的一些特征和规律。先验信息:在抽样之前基于人们经验或历史资料得到的关于总体的参数信息。“频率学派”运用总体信息和样本信息来进行分析和研究,是迄今占据科学研究统治地位的学派,管理应用中也已经十分普遍,有‘上帝视角’之称,认为一切事情都是确定的,只是我们暂时还不知道,需要建模去计算。而“贝叶斯学派”是和先验信息有关的统计方法,主要从‘个人视角’出发,个人视角无法了解到全貌,只能根据经验和不断的观察,不断完善认知。两种学派近二十年一直没有停止过争论,虽然学术研究中融合的可能性依旧较小(学术论文不太可能凭借主观估计的值去得出结论),但两个学派在各行业尤其是商业决策和运用中都发挥着重要作用,作为精准决策和区间决策的融合完全有必要加以实践和研究,为我所用。贝叶斯定律贝叶斯定律的发明者托马斯.贝叶斯(ThomasBayes)是18世纪英国的数学家,是一位专职的神父,年在他去世两年后被发表的一篇论文中首先提出了这个定理。贝叶斯统计推断需要大量的计算,在计算机诞生之前一直无法得到广泛应用,随着社会和经济的发展,面临的问题不断复杂化,人们发现许多统计量是无法事先进行客观判断的,而互联网时代出现的大数据,大型数据集,计算机拥有的高速运算能力为验证这些统计量提供了便利,也为应用贝叶斯推断创造了条件,也在如今的人工智能应用领域发挥着重要作用。表1.贝叶斯定理贝叶斯决策是统计决策中的一个重要部分,其内涵是传统的重要决策工具。该观点认为,概率是一个人对于一个事件发生的信心,即认为一个事件有多大的可能性会发生。如果认为一定会发生,概率就是1;认为一定不会发生,概率就是0;有可能发生,概率就介于0-1之间。这种概率会随着观测数据的变化而变化。一开始我们没有数据,只能根据原有经验猜测一个大概的概率,称为先验概率。随着观测数据的积累,我们会逐渐修正我们的先验概率,修正后的概率称为后验概率。数据越多,我们的后验概率就越接近于真实的情况。贝叶斯公式及推理释义P(A

B)=P(A)*P(B

A)/P(B)在实际应用中,我们把A称为假设,把B称为“证据”或“数据”。公式分析:(1)左边的P(A

B)指在证据B的情况下假设A发生的概率,称为“后验概率”。(2)右边的P(A)是在没有任何证据的情况下H发生的概率,称“先验概率”。(3)右边的P(B

A)是在该假设发生的情况下,出现该证据的概率,称“似然度”。(4)右边的P(B)也可以解释为一个归一化因子,保证所有概率之和等于1。数值上来说,它等于所有假设下“先验概率”与“似然度”乘积的和,即所有假设下因子的和。其中“后验概率”是我们要求证的,“先验概率”是已知或预估的,“似然度”也可以根据已知的数据去算得。这里解释一下什么是假设(A)。假设是一个随机变量的所有可能发生的情况,比如酒驾的后果:出事故或不出事故;考试结果:及格或不及格,所预估或选择的答案都是一种假设。假设要满足两个条件:(1)互斥性:即所有假设中最多只有一个假设会发生。(2)完备性:假设必须包含所有情况,且至少有一个假设会发生。贝叶斯推断的步骤:贝叶斯的典型应用是求某一个特定假设的“后验概率”。第一步:找出所有可能的“假设”。第二步:求出所有假设的“先验概率”。第三步:求出所有假设的“似然度”。第四步:对于各种假设,用“先验概率”乘以“似然度”,然后归一化,根据贝叶斯公式求出“后验概率”。公式运用案例推理案例1.桔子来自于某个果盘的概率为了对贝叶斯推断有初步的理解,我们先举个相对简单的例子。两个一模一样的果盘,一号果盘装着12个桔子和6个苹果,二号果盘有桔子和苹果各9个。现在随机选择一个果盘,从中拿出一个桔子。请问这个桔子来自二号果盘的概率有多大?表2.案例1数据列表利用贝叶斯公式加以推理,可得到概率。P(A

B)=P(A)*P(B

A)/P(B)设H1表示一号果盘,H2表示二号果盘。由于这两个果盘是一样的,所以两个盘的概率P(H1)=P(H2),也就是说,在拿到桔子之前,这两个果盘被选中的概率是一样的。因此,P(H2)=0.5,我们把这个概率叫做“先验概率”,即没有做实验之前,来自二号盘的概率是50%。再假定,T表示桔子,所以问题就变成了在已知T的情况下,来自二号盘的概率有多少?即求P(H2

T)。我们把这个概率叫做“后验概率”,即在事件T发生之后,对P(H2)的修正。根据贝叶斯公式:P(A

B)=P(A)*P(B

A)/P(B)公式调整符号为:P(H2

T)=P(H2)*P(T

H2)/P(T)数值代入公式求得:P(H2

T)=0.5*(6/15)/(18/36)=0.5*0.8=40%式中已知P(H2)等于0.5,P(T

H2)为二号盘中取出桔子的概率等于0.4,那么求出P(T)就可以得到答案。根据全概率公式,将数字代入原方程,得到数值0.5,最后计算出从二号盘子拿出桔子的概率为40%。(由于这些数值较客观,实际数据拿来推理就可以了,有些问题的数值只能凭经验估计,比如在管理决策的推理中则需要收集各种信息和数据,全面加以分析才能得出先验信息,似然值”等。案例2.基于贝叶斯的酒店娱乐服务场所火灾发生概率推演已知某市火灾事故每年在酒店等各类娱乐场所发生的概率为1/,现在发明了一种检测方法用于测评各类场所发生火灾的概率。消防部门用这种方法测评了历年家发生火灾的场所,结果显示测评结果不合格(某个阙值)的高达87家,合格的仅为13家;工作人员又随机测评了家未发生过火灾的场所,其中合格的75家,不合格的25家。请问:对于一家服务场所,当检测结果为不合格时,发生火灾的概率是多少?消防检测合格的场所发生火灾的概率又是多少?表3.案例2数据列表顺便计算该检测方法的敏感性=87/=0.,特异性=75/=0.,不合格预测值=87/(87+25)=0.,合格预测值=75/(75+13)=0.从该方法的检测效果来看,敏感性、特异性都较好。贝叶斯公式和问题回顾:P(A

B)=P(A)*P(B

A)/P(B)消防检测不合格的场所发生火灾的概率是多少?消防检测合格的场所发生火灾的概率是多少?通过贝叶斯公式梳理题目各项数据:P(A)=0.,为“先验概率”,即每年的火灾事故概率。P(B

A)=0.87,抽取该市历年家火灾事故场所“A”的前提下,B的概率,条件概率B表示这些场所检测出的不合格率,也叫似然度。P(B

~A)=0.25,表示抽取的家未发生火灾过的场所中,检测不合格的概率。P(B)=P(A)*P(B

A)+P(B

~A)*P(~A)=0.*0.87+0.25*0.=0.+0.25=0.以上各项代入贝叶斯公式:P(A

B)=P(A)*P(B

A)/P(B)=0.*0.87/0.=0.35%消防检测合格的场所发生火灾的概率?此处“后验信息”用P(A

~B)表示,“似然度”用P(~B

A)表示,归一化因子P(B)为0.,则它的另一部分P(~B)=1-0.=0.P(A

~B)=P(A)*P(~B

A)/P(~B)=0.*0.13/0.=0.%从数据结果看,消防检测不合格的场所发生火灾的概率是检测合格场所的20倍。案例3:酒店推出新产品成功率测算分析某度假酒店白癜风显示推出的新产品成功率为40%左右,我们把它写成:P(A)=40%;该酒店在全面推出某项新产品前通常会对目标市场进行抽样调查,调查结果接受度在某个阙值(比如80%)才能推向市场,假设成功的新产品中顾客接受度达到阙值的产品数量占到75%,我们把它写成P(B

A)=75%,我们假设此次调查接受度达到了阙值,求推向市场后成功的概率?这里写成P(A

B)=?。假设所有推出的新产品在问卷调查中达到顾客接受度阙值的比例为55%,我们写成P(B)=55%。本例符号说明:P(A

B)顾客接受度达到阙值(此处假设为80%)的前提下,产品推向市场成功的概率。P(A)该酒店往年推出的新产品成功率。P(B

A)成功的新产品,市场调研接受度达到阙值(80%)的比率为75%P(B)调查问卷结果在80%以上的概率运用贝叶斯公式根据本例给定条件计算:P(A

B)=P(A)*P(B

A)/P(B)=40%*75%/55%=54.54%也即此次调查接受度达到了预估阙值的条件下,根据酒店白癜风分析,新产品推向市场的成功率为54.54%,成功率稍低,为了提供成功率,有必要进一步对顾客需求和建议进行进一步挖掘,并加以改进;分析数据库中更高阙值的成功率,重复以上步骤,直到达到理论上较高的成功率,最大限度的避免亏损或失败。我国酒店业“管理运营”中产生的无形数据的有效储存还处于起步阶段,在没有客观数据积累的酒店,则上例客观数据无从获得,也可通过专家法,头脑风暴法等方法获得,同样可以随着信息的增多加以多轮调整,以达到较高的成功率。案例3(续)某酒店推出新产品的失败率测算以上案例分析3我们预测了顾客接受度达到某个阙值时酒店推出新产品的成功率,我们也可以预测接受度未达到特定的阙值时,产品推向市场不成功的概率是多少。上面案例所示既然成功的新产品中顾客接受度达到阙值的数量占到75%,那么不成功的概率就是25%,我们写成P(~B

A)=25%,符号“~”表示“不”,同理,达到顾客接受度阙值的比例为55%,则未达到特定阙值的为45%,我们写成P(~B)=45%,代入如下公式:P(A

~B)=P(A)*P(~B

A)/P(~B)=40%*25%/45%=22.22%结果接受度的阙值低于80%的前提下,凭感觉推出新产品的成功概率只有22.22%,其中的关键变量还在于阙值的变化,也是酒店提升新产品成功率的关键。纯粹的贝叶斯算法在企业管理中的运用越来越广,配合各种工具威力巨大,如蒙特卡洛模型能使推理丝丝入微,无限接近最佳方案。现代管理日新月异,都说人才是核心竞争力,如今说数据是核心竞争力一点不为过,数据是流动的,今天的关键管理数据没有记录,在企业的生命周期中将是永远失去的价值。当今我国旅游服务业在数据化决策所呈现出来的水准,已远远落后于其他众多行业,究其原因行业仍然缺乏管理变革,鱼而不渔,追求短期效益盛行,也是酒店等服务企业把握关键绩效的能力欠缺有关,管理产出率相对低。高效管理量化,系统性过程绩效测评,数据化决策体系建设,能够结合传统酒店服务、品牌、营销等成熟体系的优势必将有精彩的实践,学习型组织可以是突破点,产学研一体创新现代酒店管理模式有着光明的期待。数据化管理和决策已经不是什么新鲜的说辞,但要有效掌握并运用到行业绝非易事,需要提升职业经理人的综合素质,要抱有学习强国般的使命感;创新酒店旅游院校行业人才培养模式,综合和利用拓宽行业管理深度的理论模型组合;酒店业主的投资理念更是决定了民族酒店由大变强的关键因素,众多国内酒店管理公司的专业管理能力提升也是改变业主和其他利益相关者对于行业管理认知的重要方面。如此我国酒店业由大变强将不是奢望。哲理小故事:有一只小老鼠被猫追得很紧,恰好途中遇到一位师傅,便向其求救:“师傅,后面有猫追我,怎么办?”,答曰:“你学两声狗叫,就可以把猫吓跑了。”小老鼠大喜,回身等猫追到,一张嘴,却急到哭了。因为它发现自己根本不会学狗叫声,师傅也没说怎么学狗叫。请根据所学的贝叶斯公式尝试解决您在工作中碰到的决策、预测问题,如有疑问可以给本号留言,我们很乐意一起研学!

转载请注明:http://www.0431gb208.com/sjszlff/7404.html