收藏!看懂这12个日常数据理论,你也能一眼看透事物本质

这个数据为王的时代,我们缺乏的不是数据、工具、算法,而是数据思维 。 最近在学习「数据分析思维」,这里总结了12个常见数据分析的理论/悖论,分享给你 。 1、辛普森悖论2、大数定律3、小数陷阱4、墨菲定律5、幸存者偏差6、帕累托法则7、马太效应8、正太分布9、拉普拉斯分布10、德克萨斯神枪手谬误11、因果倒置12、柏克松悖论 看完后,希望你能多一个数据思维,去诠释生活中的现象 。 让数据,给你一双看透本质的眼睛 。 1、辛普森悖论辛普森悖论是指,在分组比较中都占优势的一方,在总评中有时反而是失势的一方 。 比如这个表中,两分球和三分球投中率都比球员A高的球员 B,整体的命中率反比球员A低 。

收藏!看懂这12个日常数据理论,你也能一眼看透事物本质

文章插图

收藏!看懂这12个日常数据理论,你也能一眼看透事物本质

文章插图
也就是说,“质”(命中率)与“量”(投球数)是两个维度的数据,如果全部合并成“质”(命中率)这个维度的数据,那就会出错 。 2、大数定律大数定律是指,当随机事件发生的次数足够多时,发生的频率才会趋近于预期的概率 。 随机抛硬币,出现正面和反面的概率均为 50%,也就是一半正面一半反面 。 但如果你抛10次,可能7次正面3次反面,或者8次正面2次反面,并不是5次正面5次反面 。 只有你当你抛几千次、几万次时,正面和反面的概率,才趋近于50% 。 3、小数陷阱小数陷阱,也叫赌徒谬误,比如去赌场玩俄罗斯轮盘,连续 10 次开小了,你心里可能会觉得连续 10 次小了,下一次开大的概率更高一些,然后就去押大 。 这是典型的“赌徒谬误”,是错误的 。 每次开大还是开小,是独立且随机的,并不是前面都是“大”,后面开“小”的概率就会高 。 大数定律里面,最重要的是“大数”,也就是说你得出现足够多的次数,才能够趋近于它的期望概率 。 一般的赌徒都没有赌到足够多的时候就已经输成穷光蛋了 。 赌场其实是在利用大数定律赚钱,一般的赌博机都会被设计成为 51% 比 49% 的这种预期概率,赌场其实只赢 2%,而你却会输 100% 。 4、墨菲定律总之你越不希望某件事情发生,这件事情往往就会发生,怕什么来什么 。 这就是墨菲定律 。 紧急赶时间,恰好每个路口都遇到红灯 。 上班时工作较少,下班时恰好来活 。 不打车时街上到处都是空出租车,但等你需要打车时发现全是满员的 。 … 其实墨菲定律不是一个数学规律,而是一种选择性记忆的心理学现象 。 顺利的事情,不会令人记忆深刻,只有那些让人感到愤怒、挫败和痛苦的记忆,最难磨灭 。 如果用数据分析的思维去看墨菲定律,这是一个期望值的问题,是我们对于好事情和坏事情的期望值差异造成的 。 5、幸存者偏差幸存者偏差是指,当取得资讯的渠道仅来自幸存者时,我们得出的结论可能会与实际情况存在巨大偏差 。 幸存者偏差这个概念来源于二战时期,战争中,战机机身上几乎所有地方都可能中弹,因此需要用统计学研究战机被击中的部位,从而确定哪个部分需要额外加强装甲 。 人们对返航的战机进行弹痕分析后发现,飞机机翼和尾部被打穿的弹孔较多,由此得出应该是加强机翼的装甲防护会更好 。 但对返航的飞机样本来说,其实是说明即使机翼中弹,飞机也有很大的几率能够返航 。 对于那些弹孔不多的部位来说(比如驾驶舱、油箱和机尾),当这些部位中弹的时候,飞机很可能连飞回来的机会都没有了,而这并没有统计出来,这就是所谓的“看不见的弹痕最为致命” 。 最后事实也证明,加强弹孔较少部位的装甲防护是正确的 。 6、帕累托法则 帕累托法则,也叫做二八法则,简单来说,就是 20% 的人占了 80% 的资源,剩下 80% 的人分最后 20% 的资源 。 这个法则诞生于帕累托的花园 。 有一天帕累托偶然发现,自己园子里绝大部分的豌豆是由园子里极少部分豌豆荚产生 。 这样的规律其实无处不在 。 语言中常用词只有500-1000个,剩余的更多词汇使用很少 。 20%的员工,为公司做出了80%的业绩 。 20%的人,掌握了全世界80%以上的财富 。 … 那么这种现象是怎么产生的呢? 病毒、树种和语言其实都有一个共性——传播性 。 比如在亚马逊雨林里,两株植物长在了一块,那么每天这两株植物就要为阳光和土壤中的养分去竞争 。 如果其中一株能比另外一株植物每天稍微长快一点,那么它就能长得更高,从而获得更多的阳光、吸收更多的养分 。 如果每天都有这些额外的能量,这株植物就更加有能力把种子给传播出去,然后复制这种模式 。 一直持续下去,这种植物就会积累出得天独厚的优势 。 开始的微妙的优势会随着时间逐步加强,最后就能占领绝对优势,就像滚雪球一样,越滚越大 。 7、马太效应马太效应是指,大者恒大,赢家通吃 。 马太效应来源于圣经《新约·马太福音》,文中是这样描述的:“ 凡有的,还要加给他,叫他多余 。 没有的,连他所有的也要夺过来 ” 。 比如电商平台,用户越多,入驻的商家就越多;商家越多,提供的商品越丰富,用户就越多 。 原来属于小电商平台的用户和商家,都都会逐步来来到大的电商平台 。 马太效应告诉我们,我们身处的世界是赢者通吃的世界,开始时细微优势最终将带来无穷多的回报 。 反之,最初的细微劣势也将导致最终一无所有 。 8、正太分布正态分布也叫高斯分布,就是你在课本里曾经学过的那个两头低、中间高然后左右轴对称的钟形曲线 。

推荐阅读