进入数据分析从使用Excel开始
Excel是数据统计和分析中日常工作中最常用的分析工具,如果不考虑性能和数据量,它可以应付绝大部分的分析工作。对于任何人来讲,从Excel开始熟悉数据分析不可避免的一条道路。
一、数据分析的步骤是什么?明确问题理解数据清洗数据数据分析/构建模型数据可视化二、Excel的数据类型有哪些?
Excel的数据类型三、Excel中常用的函数
find,midvba数据分析 excel,left,right,vlookup,count,sum,average
四、如何使用Exce清洗数据?选择数据子集(需要的数据)列表重命名删除重复值处理缺失值格式一致化处理数据排序异常值处理五、如何使用Excel进行分析?
数据透视表,对数据进行对应的格式整理、计算、排序以及可视化
实战项目:电商母婴产品数据清洗
1、明确目的:了解该店铺的热销产品,对应的销量以及用户画像
2、列表重命名,将英文字段名改为中文方便查看
表一字段名
表二字段名
3、选择数据子集(需要的数据)
表一:购买时间=LEFT(G2,4)&"年"&MID(G2,5,2)&"月"&RIGHT(G2,2)&"日"
表一
表二:性别=IF(C2=2,"未知",IF(C2=1,"男","女"))
出生日期=LEFT(B2,4)&"年"&MID(B2,5,2)&"月"&RIGHT(B2,2)&"日"
购买时间=VLOOKUP(A2,[表1购买商品.xls]表1购买商品!$A$1:$K$29972,8,FALSE)
用户年龄(购买时婴儿的年龄)=(I2-G2)/365
购买数量=VLOOKUP(A2,[表1购买商品.xls]表1购买商品!$A$1:$K$29972,6,FALSE)
表二
4、检查并处理重复值和缺失值
5、运用描述统计工具时发现一个异常值,最大值用户年龄出现28岁,核实后确认不应为婴儿年龄的需要剔除该数据
描述统计分析
6、格式一致化处理
7、数据排序,订单以时间顺序排列
练习:招聘网站分析
1、明确目的:了解当前目标岗位在不同城市的市场需求,发展前途,薪资等
2、爬取招聘网站的数据,整理到excel,熟悉字段名并确认主键为“职位ID”
招聘网站字段信息
3、利用“删除重复值”删除重复出现的“职位ID”的行
4、从列表的计数值中查看是否出现空值,查询和选择-定位条件-空值,找到空值,此处可以发现缺失值均为上海,输入“上海”并按Ctrl+Enter键,一次填充完成
5、观察数据,有两个地方需要修改,公司所属领域有包含1个以上的领域(将其分为两列),工资显示为范围(可改为两列,分别为最低工资与最高工资,便于观察这里可以用到平均值)
最低工资使用函数=LEFT(M4,FIND("k",M
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。