一天一点小,学问,你好我是胡建彪,前段时间,我跟,职中就去了一趟上海参加我们好好说话的签书会,到上海之后呢,有的冷面店还真是多得不得了而我们在上海停留的时间又很有限所以这个时候最简单的方法就是靠点评网站上面的评分了吗于是呢我们按照评分从高到低排列,我,挑,了一家排名很靠前的一家面店,看了看下面的,评价,觉得形容的也还不错。也不贵,于是呢,我,就和之中去了这家面店但坦白说结果是有点失望,的因为这家面店吃起来很一般呢虽然是不难吃了但也实在算不上是特别,好吃所以我们俩就一边吃一边,觉得很疑惑,觉得为什么像这样的面店在网站上评价会。 那么高呢难道是因为,他们雇佣的水军,吗后来在回程的路上我跟,其中两个人就一直在聊这个问题聊着聊着我们终于弄清楚了,其实问题啊就出在网站上的分数,是由所有人来评分,的因为在一般的人群,中他们对口味的要求其实就好像一座。他一样,那种舌头特别挑对口味特别讲究的人他们在人群中就像在金字塔的顶端,只占一小部分至于大多数的客人呢,他们在评价一家餐厅的时候对味道的要求其实不会那么严格,他们心目中的好吃和不好吃往往会同时受到。餐点的,分量和价格的影响所以如果一家餐厅,它的味道特别好可是呢,价格非常高那这个时候,这家店在网站,上的评价就会趋于两极化少数人会,因为它的味道好所以就给高分但多数人却可能嫌,它价格不上算份量没吃饱。就给,打了,一分结果,粮食一平均下来这家餐厅的分数,就被拉了下来了,相反,的如果一家餐厅,他走的是经济实惠的,风格那么对于少数舌头比较挑剔的客人来说他们意大利甲级联赛直播,葡萄牙联赛杯,山东鲁能vs江苏苏宁,斯诺克站,途游官网下载,哑铃20kg,虎扑体育直播间,登雪山。一开始恐怕就不会来来也是,极少数人吗而会过来的顾客呢大部分。 这个味道的要求由于不是那么严格,所以只要掺点的水准达到一定的程度就会觉得这家店已经够好吃了,因此,就纷纷给了高分所以并不是评分不可靠,而是评分者的口味呈现金字塔分布的时候那平均分越高的餐厅他们往往。越是,贴近于,基础人群的,标准至于那些,更加在意,味道对价格不那么敏感的时刻由于,它们在整体评分中所占的权重很小所以就会给淹盖掉了,而类似的情况还不只是在餐厅,其实斯诺克视频直播2017,悍马器械,萨波纳拉,亚洲地图高清,广东体育手机在线,屏幕漏液修一下多少钱,购彩大厅,一只翡翠手镯值多少钱。在电影评分,呢流行音乐榜单中啊我们都可以。类似的现象,这种现象我们就把它叫做辛普森悖论,早在1951年英国统计学家辛普森就曾经提出了在分组比较中都占优势,的,一方他们在结果中往往会变成劣势的那一方是怎么发生这种现象的呢简单来讲。因为权重不同导致,的结果的不可信,那接下来我给大家举个例子哈帮助,你更加清晰,地了解这个,理论那你现在可以打开手机,看看这节课的文字介绍哈,假设你,
是一个武汉人在一个星期之后你打算坐飞机出国那航班呢有两个选择。 何必航班出发地可以选择北京或者是广州那现在你打开你的订票软件你发现,啦,哎b航班的准点率是65% a航班的准点率呢,是55%统计样本,都是基于过去,120字的航班准点率那请问现在。你会选什么,航班,呢,这时你肯定会说,还用问,吗,逼航班ba航班,高出十个百分点呢样本大小也一样,那当然,需要,选择,毕业航班啦,哎等等你看看我们,音频文案上的图标我们先来看看数学家是怎么分析的首先呢,a航班和必行。虽然,都是以120次航班为调查,基数但是a航班是以北京为基,地,b航班呢,则是以广州,为基,地,所以在a航班的120次航班中从北京出发的,有100个
航班准点了58准点率是50%,那从广州,出发的,有20个航班准点的。六班准点率就是80%所以整体加起来总共120个航班,中a航班准点的66架次,66除以120,就得出了a航班准点率55%所以记,好了,是55%的准点率哈我们现在回过头来看看b航班。 同样,是120个航班,b航班从北京出发的只有20个架次准点的八字准点率是40%,从广州,出发,了100次,准点的70个航班准点率是70%,那,好,这样b航班的准点率是78除以120个航班得出了。点率65%,这就是b航班,65%和a航班55%的来历,但是你仔细想想,b航班,真的比a航班更准时,吗如果你是从北京出发那你应该选择什么,航班,呢,是,种重点率更高的b航班吗,不对啊应该是a航班才妮维雅从北京这一单一城市来看,a航班准点率是50%它高于b航班的40%同样,的如果你是从广州出发你应该选择b航班吗,错还依然应该选择a航班你,看,哈广州机场一航班的准点率是百分。80ab航班呢只有,70%所以无论是从广州还是北京出发,哎呀航班都是正确的选择,看到,这里啊我估计你会有点懵了,你会觉得不对呀这不是矛盾吗,b1航班的种子点率是高于a航班整整十个点呢可是为什么结论。 航班在北京和广州的准点率都高于b航班呢,你仔细看看我们的图,你就会发现,啊问题的关键,其实就出在,比利之上,一航班中绝大多数的航班都是从北京出发的,b航班呢,他的120个航班有100架是从广州出发的吗。从至北京的飞机晚点那是常事,那,一航班从北京飞出的航班比率是b航班的五倍之多啊因此受到北京高延误,率,的影响,那尽管a航班在北京和广州的准点率都高于b航班那最终,啊一个航班的准点率还是比b航班低了百分之。十个,点是不是很有意思当,权重不一样的,时候他真实的结果也会哄骗人的这就是辛普森,悖论,的,数学依据,那我们在知道了这一点之后该如何避免被这些数字误导呢回到我们之前,挑餐厅的故事,吧现在你已经知道了,点评网站,分数其实也会受到。辛普森谬误的,影响时刻权重比例不一样导致结果的不可靠所以呢,如果你是,那种,在学校餐厅的,时候除了味道之外对其他条件都不太在意的吃货,那么以及参考这个大数据的评分,你,倒还不如去建立一个焦点团体也就是先重点参考你身边。 特别会吃的激动之下,被大众的数据给掩盖了,好那现在总结一下今天你学习了一个新的观念叫做辛普森谬误在分组比较中都占优势,的,一方,他们往往在总评中会变的是劣势的那一方为了避免这种情况我们就需要考虑各个分组的权重。成绩一定的系数来消除,因为分组数据差异而造成的,影响或者我们要想明白在这些贫困的背后是不是有更具体的区分标准,好在今天应聘的最后我们给你一道思考题吧,在你的生活里还发生过哪些辛
普森悖论的例子呢,分享出来。讨论一下吧一天一点小学问,我们明天见,