一、数据背景及理解数据
1、数据背景
随着增量数据的增长,我们可以根据有限的数据进行趋势和本质分析,观察在当下的运营模式下,是否有问题存在,并找到原因,给出解决问题的办法和建议。
本数据集名称《淘宝和天猫婴儿用品》,数据来自阿里巴巴天池, 淘宝和天猫上购买婴儿用品的用户
2、数据集的字段理解
3、数据清洗
1)选择子集
表一中,因为目前的分析不会涉及到具体商品的品名和商品属性,所以可以将这俩列隐藏。利用vlookup函数,将表一淘宝市场数据分析,表二连接。
2)字段重命名,由于列名表述的很清楚,可以理解,所以不需要重命名。
3)删除重复值,在表二的用户信息表中,按照用户编码这一唯一标识删除重复值,发现没有重复。
4)缺失值处理
对表中的数据进行查找缺失值,发现表中没有缺失值出现。
5)一致化处理
6)数据排序
对于有顺序要求的数据,可以按某字段进行排序,本实例暂时不需要
7)对异常值进行处理
根据结果,可以看到,最大值和中位数差距很大,需要去向业务部门核实异常订单正确性。在这里,此笔订单对分析影响较大,删除。
最后清洗的效果如图:
二、分析目的
根据2012年到2015年的数据,分析销量的变化受哪些因素影响,找出导致销量下降的原因并给出合理的建议,以提高销量。
三、分析思路
1、提出问题
1)产品销量随时间是如何变化的?
下图是销量随时间变化的折线图:
下图是销量季度折线图:
2)产品复购率受哪些因素影响?
3)性别对销量的影响?
4)孩子年龄对销量的影响?
根据以上问题,整理出相关分析思路:
四、构建模型、分析数据
1)产品销量随时间是如何变化的?
收集证据:
2012年只有7-12月份的数据,2015年只有1、2月份数据,可以环比看一下1、2月份数据,看一下1、2月份销量如何
2015年的1月份相比于上俩年份,销量高了很高,2月份有所下降,将2月份明晰剖出来看下:
可以看到,15年2月的数据只留存到5日,不是完整数据
结论:2015年销量下降并不是因为经营问题,而是因为数据留存到2月5日,而且从1月份完整数据对比,2015年的一月份比其他年份销量都高。
假设:由于1、2月份是春节月份,快递停运,所以会影响销量
收集证据:
2013年的春节在2月10日,14年的春节在1月30日。在春节期间,由于快递停运,影响货物邮寄,销量低至0,之后销量有回暖。而且在春节前七天,销量都有下降,后七天,销量平稳上升。
结论:假设成立,由于春节假期的快递停运影响,线上的商品销量下降。
假设:5月份的节日较多,举办了一些促销活动,促使销量上升。
收集证据:
从图可知:5月份销量增长波动大致有4个点,在5月12-15日,5月19-23日,5月27-29日销量都有所增长,经查,13年5月12日和14年5月11日是母亲节,520现在也是营销点,本商品是婴幼儿商品,在6月1日儿童节前的促销也是少不了的,这样就可以找到销量上涨的原因了
结论:5月份业绩增高的原因是因为有节日促销。
假设:每年11月份都有双十一促销大活动,由于做营销活动,而使销量增长
收集证据:
在双十一当天的销量有猛增式的发展,并且随着年份的增加,双十一当天的销售量不断增加,说明营销活动和品牌认知度都有提高,不断向好发展。具体哪种大类商品销量更好?可以剖开看一下:
可以看到是50008168商品的销量最好,占了每年双十一业绩的近50%,我们可以进一步看一下,是购买人数多促使的销量增长还是因为有多件购买性价比高而促使的销量增长?
从2012年到2014年的交易量可以看到,大多数人都是购买1件,最大值只有4,只是交易量增加了,导致的销量增加。可能是营销活动的预热的时间更长了,品牌知名度更高了。
结论:11月份的销量大幅增长是由于双十一的促销活动促使的,并且50008166的商品卖的最好,最畅销
2)产品复购率受如何,哪些因素影响?
复购率中位数是1,说明顾客多数购买次数是1,说明回购率不高,用户粘性不太大。
具体什么原因影响回购低,这个暂时无从论证,猜测可能的原因:产品问题,包括产品质量不好,服务体验不好,后续的服务体验不好,后续营销力度弱;具体原因需要了解业务进行下一步分析。
3)性别对销量的影响
上图可知:男女购买人数基本持平,女宝的购买人数能稍微占一点优势,多了5.8%
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。