分享写数据分析报告的教程 如何写数据分析报告?( 二 )


再进一步 , 观察各个类别11月的销售情况:
从图中可以明显看到 , 主要销量来源于类别50014815 , 查询具体数据发现 , 11月13日总销量10138 , 类别50014815就占了10030(99.7%) 。
④ 分析类别50014815在11月13日销量暴增的原因
把类别50014815历史所有的数据调出来看:
从类别50014815的历史销售数据可以发现 , 之前销售一直维持在一个比较平稳的水平 , 只是在2014年11月13日这天出现了暴增 。
回到分析表 , 筛选出2014年11月13日类别50014815的销售明细查看 。
从销售明细可以看出 , 该类别的商品由用户2288344467单次购买了10000件 , 占了99.7%(当天共10030) , 由此可得出以下结论:

  • 不是双十一活动活动导致的 。 因为如果是双十一活动 , 必然很多用户购买导致销售量暴增 , 而不是只有一个用户购买大量商品;
  • 需要找工程师确认数据源是否记录有误;
  • 如果数据无误 , 则要将情况反馈给运营人员 , 跟踪该用户是否存在可疑行为(刷单 , 或者利用网站漏洞薅羊毛) 。
⑤ 排除异常值 , 重新再观察销售趋势
经过上述分析 , 用户2288344467购买的这条记录属于异常值 , 记录为“异常数据1” , 应该删除 , 再重新分析销量随时间变化的规律 。
把删除“异常数据1”后新的数据表再用折线图展示:
从图中可以看出类别38、类别50014815、类别50022520、类别122650008的销售情况都趋于平稳 , 类别28的销量起伏较大 , 类别50008168出现一个极端高峰点 。
⑥ 分析类别50008168的销售出现极端高峰点的原因
通过同样的方法可以分析出类别50008168在2014年9月20日由用户173701616购入2748件 , 将此数据记录为“异常数据2” , 处理方法参照异常数据1 。
⑦ 分析类别28销量波动大的原因
同样地把“异常数据2”删除后 , 得到折线图:
观察发现类别28的波动比较大 , 查找到类别28的销售明细 , 按照销量倒序排序:
从表中发现类别28并没有明显的异常数据 , 不过前三项较其他项差距较大 , 应该标记为“关注数据” , 结合更多的其他数据来分析原因 。
⑧ 小结
  • 类别50014815、类别50008168均出现异常值 , 分别标记为“异常数据1”、“异常数据2” , 排除是营销活动导致的 。 因为如果是营销活动 , 必然很多用户购买导致销售量暴增 , 而不是只有一个用户购买大量商品;
  • 类别50014815、类别50008168这两项异常数据需要找工程师确认数据源是否记录有误;如果数据无误 , 则要将情况反馈给运营人员 , 跟踪该用户是否存在刷单情况(网站可能会存在漏洞 , 被黑客利用进行刷单薅羊毛) , 后续分析排除这两项数据;
  • 类别28标记出三项“关注数据” , 目前没有其他数据结合分析 , 暂时保留 。
(2)分析哪些是热销产品 , 哪些是滞销产品 , 它们有什么特征
“热销”和“滞销”应该根据购买人数来判断 。
① 找出热销和滞销商品
可以看出类别50008168商品最热销 , 而类别38商品的购买人数最少 , 结合之前的购买数量图可以看出类别38的销量也相对较少 , 因此类别38商品是滞销商品 。
② 分析热销商品和滞销商品的购买人数变化
a. 先按【年份】来看
2015年只取到2月6日 , 数据不全 , 整体上可以看出所有类别的购买人数都是逐年增加 。
b. 再按【季度】来看
整体上表现为第一季度下滑 , 第二季度上升 , 第三季度下滑 , 第四季度上升 。
c. 最后按【月份】来看
从图中可以看出 , 滞销商品类别38的人数表现平稳 , 一直维持在较低的水平 , 由此可判断该类商品基本是靠自然流量 , 或者是冷门类别 。
除类别38外 , 其他五类商品都有一些共同特征(第一季度下滑 , 第二季度上升 , 第三季度下滑 , 第四季度上升) , 而热销商品类别50008168的波动较大 。
③ 分析热销商品类别50008168购买人数波动的原因

推荐阅读