首席数据官

Hi, 请登录

数据分析实战——基于R(学习篇)

荐语:数据分析竞争那么大,我们还投吗?还需要学数据分析吗?

数据分析,一个新晋“卷王"职位。一个站在大数据风口上,岗位需求不断增加却仍就不好找工作的岗位。网上流传这这样一句话”2015年,你会Excel和SQL数据库查询你就能找到一份好工作;2017年,你要会做数据可视化,会SPSS携程数据分析,最好还要会一点Python/R;到了现在你还要懂统计,数据清洗,算法等等才能展露头角“。岗位要求不断提高,和你一起竞争的往往也是更专业的人才。数据分析门槛是很低,但如果不继续钻研数据分析相关知识,懂得如何将数据分析成功灵活运用于业务,往往你只能做一个”数据搬运工“,工资低不说,随时还会被替代,前途堪忧。对于那些不是真心喜欢并愿意为之付出努力,而是因为热门而选择数分的友友们,我这里有一份”劝退警告“还望查收。

其实我们可以换一个角度去思考,”数分+其他“也许才是一条更好的出路。求职互联网产品或运营等岗位时,会发现很多岗位JD都要求有数据分析能力,所以数分还是很重要的。这会是一个不错的加分项,毕竟拿数据说话才更有说服力。必备技能SQL和EXCEL就不赘述了,而Python和R都是很友好的可视化工具,可以去网上搜索教程,边看视频边动手实践。

今天周周想分享一份自己最近在学习的一个基于T语言的数据分析实训,附带有完整教程,包括软件安装、实验手册、实验数据和可视化代码等等,让我们一起动手完成一份完整的可视化分析报告吧。

在这里插入图片描述

数据预处理

本实训以携程出境旅游产品的可视化分析为案例,给出爬取到的携程数据分析,已经经过清洗的数据库文件。先将数据库文件连接Navicat for SQLite,按照需求选择必要的字段导入到R。

描述性统计

使用ggpolt2绘制柱状图、饼图和桑基图等。

在这里插入图片描述

产品供给热力图

按照产品的目的地城市划分,将目的地城市相同的在售产品量进行汇总,再通过ggmap获取各个目的地城市的经纬度,最后用remMap进行绘图得到的目的地区域热力分布图。

在这里插入图片描述

4.产品供给结构特征

按照分析产品供给结构特征需要将相邻区域融合,16个目的地融合成为7个目的地,按区域分析产品供给结构特征。需要构建两个参数值:目的地热度值(Hot_Destination)和产品线的热度(Hot_Tags)。

最后,也是最重要的部分,针对可视化图像简述数据特点,并结合实际情况进行合理分析。以上,携程的可视化分析都已给出,资料中还附有一份途牛网境外出游数据库文件,可以先学习携程实训,再根据自己学到的知识自制一份途牛的可视化分析报告。

试看结束,如继续查看请付费↓↓↓↓
打赏0.5元才能查看本内容,立即打赏

来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

评论

  • 昵称 (必填)
  • 邮箱
  • 网址
二维码
评论