首席数据官

Hi, 请登录

数据分析方法实践-母婴商品销售数据的进一步分析

1. 项目背景与目的

营销数据是互联网和零售行业最为重要的资产组成之一,具有巨大的商业价值。通过对这些数据进行挖掘、分析和应用,能帮助企业改进业务、增强竞争力、扩大商业规模。

本文将分析淘宝天猫一家婴儿用品店铺的销售数据,从不同角度进行拆解和解读,找到潜在的问题并给出相应建议,有助于商家改善销售表现,提升业绩。

2. 数据处理2.1 理解数据

数据来源:/dataset/dataDetail?dataId=45

对表格字段信息含义如下:

双11数据_2013双11 数据分析_2013年双11销售数据

2.2 数据清洗

2013双11 数据分析_2013年双11销售数据_双11数据

对表格数据进行检查,未发现重复值和缺失值。

对于日期数据需要用left、mid和right函数处理得到规范的日期格式。

对于婴儿信息用查找和替换功能分别把0、1替换成女婴、男婴,剩下的标记未知。

婴儿年龄异常:用datedif函数计算发现部分数据现实出生时间比购买时间还大,可能是因为有的顾客给尚未出生的孩子做准备2013双11 数据分析,而有的不打算提供真实信息,所以随意填写了出生日期。

2013年双11销售数据_双11数据_2013双11 数据分析

对于这些异常值,再次用datedif函数计算从现在的购买时间到孩子出生还有几个月,暂时定义给3个月后出生的宝宝买东西是比较合理的,把年龄记录为02013双11 数据分析,因为尚未出生的和0~1岁的宝宝,所用到的必需品是一样的。而超出3个月的可能是虚假数据,把它们剔除在外。

另外,发现有一条数据的年龄为28,不适合与婴幼儿一起分析,也要把它删除。

婴儿性别异常:未知性别的婴儿都带有出生日期的字段,无法直接用男或者女来代替,而且数量只占整体的2.7%,因此在实际分析的时候可忽略。

3. 数据分析销量随时间变化规律

2013双11 数据分析_双11数据_2013年双11销售数据

虽然2012年缺少1~6月数据,2015年缺少3~12月数据,但还是可以从图中可以看出每年的第四季度都有一波销量大增,尤其是11月最亮眼。那么,到底是什么原因导致的呢?

每年11月销量增长原因分析

分析思路:根据购买商品表格给出的字段,可以把销量分解为用户数量和平均用户购买数量。分别对这2项数据进行可视化,找到其中的亮点或者异常点,再进一步拆解挖掘深层原因,通过假设检验方法找到销量增长原因。

根据购买商品表格给出的字段,可以把销量分解为用户数量和平均用户购买数量。

从图中可以看到每年11月,用户数量都会有一波增长。

双11数据_2013双11 数据分析_2013年双11销售数据

但是考察这段时间用户的平均购买数量,发现2014年11月的平均购买数量最大,但其它年份11月的平均购买量并没有特别亮眼。

双11数据_2013双11 数据分析_2013年双11销售数据

根据上面2张图可以提出以下假设:

假设1: 每年11月的双11活动吸引了大量用户。

双11数据_2013年双11销售数据_2013双11 数据分析

双11数据_2013双11 数据分析_2013年双11销售数据

2013年双11销售数据_2013双11 数据分析_双11数据

从2012~2014年11月的日销售情况来看,双11前后确实出现了销量大增,同时还发现2012年11月19日、2013年11月29日、2014年11月13日出现异常销量。也就是说除了双11活动,还有其它因素导致11月销量增加。

假设2: 存在大单交易,进一步增加了11月的销售额。

对2012年11月19日、2013年11月29日、2014年11月13日的销售数据进行检查后发现,这些异常销量都是由不同用户贡献的大订单。考虑到所有成交数据都由电脑自动记录,不大会出现人为错误,只要是真实记录,就不应该剔除。由于大订单会拉高平均用户购买数量,所以2012~2015的平均用户购买图中平均购买量的波动,不一定能准确反映普通用户的购买情况。

假设3: 平均用户购买量大增的月份,都存在大单成交。

与假设2同样,检查了2013年2月、2013年7月、2013年12月、2014年9月的销售数据,发现这些月份分别出现了600、1000、2800、2748这样的超大单。而用户购买数量的中位数、25%和75%分位数都是1,也就是说是这些大单带动了人均购买量。通过这个假设验证,同时也回答了为什么其它年份在双11后,12月的销量会有个下滑,而2013年12月销量不降反增的原因。

每年1~2月销量下降原因分析

分析思路:对1~2月每日销售量变化情况进行可视化,分析销量滑坡具体出现在哪个时间节点,根据这些时间节点的具体情况提出可能的原因。

在这里,先把购买量大于100的订单剔除,以免影响到数据观察。

每年1月~2月都是销售低谷期。在1月15附近销量达到一个小峰值,可能是因为大家要在过年回家之前采购一波。到了2月6日~2月14日,销售情况走出了一个U字型底部,可能是因为过年不管客服还是物流都要放假,线上消费者数量也在减少。

双11数据_2013年双11销售数据_2013双11 数据分析

销量与商品之间的关系

分析思路:按照商品一级和二级分类对销量进行排序,找到哪些分类的商品对销量贡献最大,以此为依据判断是否需要对商品结构进行调整。

对商品按照一级分类进行划分,经过排序后发现最受欢迎的一级商品分类是28、50014815和5008168,占了总销量的88%。

2013年双11销售数据_双11数据_2013双11 数据分析

同样把商品按照二级分类排序,得到下图排名前10畅销榜。从图中可以看出,最受欢迎的50018831在表格中占37.33%,第二名仅占10.64%。但是50018831在一级分类中属于50014815,排名第二。既然这类商品如此受欢迎,如果能提高利润率,那么通过改变商品结构,可能是一个提高销售额的方法。

2013年双11销售数据_双11数据_2013双11 数据分析

商品复购率情况

分析思路:对每个用户ID进行购买次数汇总,得到复购率,并且与行业平均水平进行比较。

双11数据_2013年双11销售数据_2013双11 数据分析

检查用户的复购情况发现用户总数为29944,其中25个用户有复购行为,复购率是0.08%,而搜索引擎检索结果发现淘宝平均复购率可达50%,也就是说这家店的复购率远低于同行,需要进一步分析原因。

婴儿年龄与销量的关系

分析思路:考察不同年龄段用户对销量的贡献情况,以及他们对不同商品种类的消费偏好,可以看出该商店的主要客户群体和商品是否能满足不同年龄段用户需求。

从年龄段分布来看,0~2岁家长购买最多,占69.66%。

2013双11 数据分析_双11数据_2013年双11销售数据

将一级商品按照不同年龄段用户进行划分,可以看出0~2岁用户对50014815需求最多,2~4岁和4~6岁是50008168,而6岁以上的客户就很少了。

试看结束,如继续查看请付费↓↓↓↓
打赏0.5元才能查看本内容,立即打赏

来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

评论

  • 昵称 (必填)
  • 邮箱
  • 网址
二维码
评论