介绍一个通用的数据分析方法论数据分析五步法 如何做运营 数据分析?( 三 )


那么我们如何拆解呢?这个问题就是下一个步骤【归因】了 。
1.1.4 归因
这个步骤其实就是得出结论并进行决策的”最后一公里“了 , 也就是我们常说的剖析“为什么”的过程 。
在前面的步骤中 , 通过案例能清楚地看到我们已经得到了一些可以直接对比的量化指标了 。 在这种情况下 , 其实我们不需要在【归因】的步骤中做什么特殊的操作 , 可以通过数值的比较直接下结论 。 但是如果我们遇到了多个环节或者方法之间 , 无法进行明确地细分时 , 应当怎么办呢?在日常的数据分析中有几种常用的归因思路 。
比如 , 我们以前一个例子中 , 用户依次点击了ABCD四个位置才产生了GMV为例——

  • 首次互动归因模型:也就是用户第一次做某件事 , 在数据中通常表现为时间最早、顺序号最小等等 , 那么在我们给A记100% , B、C和D记0% 。 最终互动归因模型:也就是用户最后一次做某件事 , 对应的在数据中就表现为时间最近、顺序号最大等等 。 那么我们给D记100% , A、B和C记0%
  • 线性归因模型:也就是平均分 , 那么我们给ABCD分别记25% 。
  • 加权归因模型:也就是给多个促成因素分配一定的权重 , 例如A和B各记30% , C和D各记20% 。 正因为多出来一个权重的维度 , 需要一定的设计 , 并且也可以作为一种分析的过程 。 关于权重也有几种常见的设置办法 , 比如首末两项最重要其它向中间递减 , 或者按照时间递减等等 。
当然 , 在选择归因方式的时候 , 也会结合具体业务的特征 , 来考虑行为的先后顺序、停留时间长短等情况对于分析目标的影响 。
1.1.5 决策
最后就可以决策了 , 但经过前面几个步骤逐渐消除不确定性 , 决策反而是最简单的一步了——就是找出那个表现最好的版本、表现最好的位置、表现最好的拉新手段而已 。
而当我们有一些新的idea时 , 同样可以作为A/B Test中的一个版本 , 加入到这套评价体系中 , 进行综合评价 。
1.2 应用案例这套方法论不仅针对日常工作中的专项分析 , 在一些已经固化成型的方法论中 , 也可以找到这套基础方法论的影子 。
我们来看几个已经成型方法论案例:
1.2.1 A/B Test实验
首先我们要看的案例就是A/B Test 。 在A/B Test的过程中 , 首先我们要确定实验的目的 , 也就是我们要通过实验提高和优化的是哪个指标 。 之后 , 我们以实验中的不同版本作为细分维度 , 以指标是否实现来作为评价标准进行评价 。 如果在实验的过程中确实遇到了需要归因的问题 , 则还需要考虑如何进行归因 。
当然 , 随着业务的复杂度不断发展 , A/B Test的难点已经不在比较和得出结论的过程 , 而在于如何设计实验才能在更短的时间内、耗费更少的用户流量、进行更多的实验并得到有效的结论 。 这也是所有这方面的平台的起点——Google的著名论文《Overlapping Experiment Infrastructure》论述的核心内容 。
1.2.2 用户分群
用户分群是一个常见的运营手段 , 但如何确定分群的准确度以及如何在后续持续的维持准确度 , 确是一个数据分析问题 。 在基于特征的用户分群过程中 , 我们首先要确认我们希望获得具备怎样特征的用户群体 。
当我们已经进行了分群 , 并想要研究这个群体具备怎样的特征时 , 就可以以TGI(Target Group Index , 目标群体指数)作为目标 , 以TGI的大小来衡量分群对各种特征的倾向性 。
反过来说 , 如果我们想找到喜欢搞笑短视频的用户 , 并且以点赞行为作为“喜欢”的定义 , 同样可以使用TGI来衡量分群的准确程度 。 这样我们就可以通过各种手段来对用户进行分群了 , 不同的分群方式就对应了不同的TGI值 , 我们需要的就是那个TGI值最大的分群方式 。
1.2.3 经典管理模型:BCG矩阵
在经典的BCG矩阵中 , 隐含的一个关注目标是整体利益 , 而手段是资源的优化配置——也就是要将企业中有限的资源 , 投给更具潜力的业务 , 已获得企业层面的整体利益最大化 。

推荐阅读