首席数据官

Hi, 请登录

建议收藏丨如何理解数据分析与可视化?

在广泛的数据应用社区的日常用语中,数据分析和数据可视化这两个术语似乎已成为同义词。

许多招聘广告关注的是数据可视化技能,而不一定具体说明数据分析技能的重要性。其实整个行业的职称已经显示了这一趋势,「数据艺术家」、「数据可视化专家」和「数据说书人」等新角色纷纷出现。但企业仍在寻找能够从数据中获取价值的人,这不能仅仅局限于数据可视化,因此这些新角色又必须学会分析技能。

01 数据分析与数据可视化

数据分析是一个探索性的过程数据分析和数据可视化,通常从特定的问题开始。它需要好奇心、寻找答案的欲望和很好的韧性,因为这些答案并不总是容易得到的。

数据可视化涉及到数据的可视化展示,从单个图表到全面的仪表盘。有效的可视化显著减少了受众处理信息和获取有价值见解所需的时间。但是有效的可视化需要满足几个条件,而且理想中的可视化总和现实有很多差距。

02 数据分析过程中的视觉呈现

从上面的讲述来看,数据分析和数据可视化存在着天然的差别。但这并不是说两者永远不会和谐共处或者离和谐很远。在实际处理数据时,分析应该先于可视化输出,而可视化分析可能是呈现有效分析结果的一种好方法,两者在应用中存在着关联。

数据可视化

可视化分析涉及到用数据构建不同图表的过程数据分析和数据可视化,以提供不同的视角。这有助于确定需要进一步调查的异常值、差距、趋势和有趣的数据点,比如门店的异常销售值、生产车间的产量波动等。

其实可视化分析就如同下图,它是一个化繁为简的过程,将通过算法运算出的数据结果以清晰的方式展现出来。

数据可视化

在左边,你有分析、研究和视觉探索的过程,当你向右边移动时,这些过程会变得更加清晰,对数据的理解和洞察的发现。只有在这个过程结束时,仪表盘才会出现,它将所有的东西都打包成一个整齐的输出。

03 仪表盘的作用是什么?

在数据分析师或企业信息部门的工作中,可能会涉及到创建仪表盘。不过,仪表盘在整个分析过程中的作用是什么?许多人认为它是最终的可交付成果,有了它就万事大吉,并且可以回答他们所有的问题。不过,我建议仪表盘只是进一步讨论和分析的起点。

仪表盘、信息图表或数据故事是交流见解的极好且非常有效的方法。但它不应该停在那里,冷冰冰的等待别人去发掘想要的数据点。当客户使用他们的季度销量总结时,等待他们的应该是根据仪表盘显示的数据点进行讨论与下一步的决策,而不是将仪表盘放在那里,只是单纯的显示数据。换句话说,它不应该是终点,而是讨论和决策的起点。

看看下面由 Ann Jackson 创建的销售和盈利能力仪表盘。它是一个直观、清晰设计的数据摘要,显示了随时间的变化、地理差异、某些产品类别的损失,并将关键性能指标汇总为数字。

数据可视化

Ann 会把这个仪表盘交给她的利益相关者并称之为完成吗?不,因为现在真正的讨论才刚刚开始。Ann 可以和她的听众坐在一起,深入了解更多的细节,以探索为什么会出现某些结果,并找出提高业务绩效的机会。对数据的进一步调查,与读者一起探讨,这是作为分析师所增加的价值,而不仅仅是生成仪表盘。

04 不要停留在视觉上

我给许多分析师分享的一条建议是,不仅要可视化数据,而且要展示洞察力和分析技能。

现在市面上有很多工具,它们使快速构建可视化结果非常容易。作为使用工具的分析师,职责不是做出想要的仪表盘,而是是确保他们提供的信息是可访问的、易于理解和清晰的。数据分析师的分析结果应该放入实际的句子、注释、标题和副标题中,以引导读者浏览即成的报告或仪表盘,并使信息可访问。

可以问自己一个问题:对于不使用这个数据集进行相同的分析和研究过程的人来说,数据分析的结论容易理解吗?

看看贾斯汀·戴维斯的这幅图像。Justin 创建了两个图表,并通过在文本中陈述他的发现来支持这些图表。

数据可视化

他本可以停止使用每张图表的标题,但包含三个句子可以确保他的听众不必先做他们自己的分析,而是可以快速理解数据显示的内容。然后,他们可以根据一张图表自己调研更多的问题,这样一张仪表盘或图表的价值就达到了。

另一个很好的例子来自 JennaDevries,她创造了一个大联盟棒球啤酒价格的简单可视化。

在可视化过程中添加便于理解的注解,可以使她的读者更好的理解关键数据和使用信息,也表明她不只是创建一个图表,而是通过可视化她的分析过程使结论更好的呈现。

数据可视化

05 数据分析与可视化在商业中的作用

想象一下,你现在是一家零售连锁店的店长,在营业过程中,会在与外部供应商、客户的互动中产生大量的数据,比如入库记录、出库记录、销售记录带来的库存数据、销售额数据等等,而数据分析将庞大而且杂乱的数据进行清洗、挖掘、分析后,依靠算法生成了一系列数值,而这些数值要与具体的业务场景联系起来,就需要可视化的帮助。

使用数据分析和可视化技术,你可以透过数据识别客户购买行为模式,了解客户购买习惯,例如他们购物的时间是什么时候和购买的产品以什么为主,同时你可以看到行为趋势如何逐月变化,以及每个季度的变化,这些就是所谓的业务场景。有了这些业务场景数据,你就可以开始对下一个月、下一个季度的门店情况做出详细、准确的预测,包括哪些产品最畅销,以及何时会迎来门店最忙的高峰期。

在数据可视化和基于此的调研之后,就是具体的业务决策了。根据产品的销售预测情况,你可以规划产品的「进销存」,或者在门店销售高峰期之前,提前安排好人手,或是应对市场的波动。

06 显示您的分析

数据分析和数据可视化可能是不同的活动,但它们本质上是相互关联的,一个活动通常可以支持另一个活动。

当您处理数据并构建下一个仪表盘时,我鼓励您考虑如何更有效地合并您的发现。你如何才能以最容易接近的方式向观众展示关键的洞察力?

一个有效的、设计良好的可视化是很好的,但是如果信息隐藏在数据艺术中,并且利益相关者无法对其采取行动,那么您就有可能失去受众。

AQF:量化金融分析师(简称AQF ,Analyst of Quantitative Finance)由量化金融标准委员会(Standard Committee of Quantitative Finance,SCQF)主考并颁证,是代表量化金融领域的专业水平证书。>>>点击咨询AQF含金量

AQF量化金融分析师实训项目学习大纲>>>点击咨询AQF课程相关问题

1.1.1. 第一部分:前导及课程介绍

1.AQF核心课程

2.量化策略的Python实现和回测

3.整体代码介绍

1.1.2. 第二部分:量化投资基础

1.量化投资背景及决策流程

2.量化择时

3.动量及反转策略

4.基金结构套利

5.行业轮动与相对价值

6.市场中性和多因子

7.事件驱动

8.CTA_1(TD模型)

9.统计套利_低风险套利

10.大数据和舆情分析

11.机器学习

12.高频交易和期权交易

13.其他策略和策略注意点

1.1.3. 第三部分:Python编程知识

Python语言环境搭建

1.Python语言环境搭建

Python编程基础

1.python数字运算和Jupyter notebook介绍

2.字符串

3.Python运算符

4.Tuple和List

5.字典

6.字符串格式化

7.控制结构_1.For循环

8.函数

9.全局和局部变量

10.模块

11.Python当中的重要函数

Python编程进阶

1.Numpy数据分析精讲

2.Pandas数据分析详解

数据可视化

1.Pandas内置数据可视化

2.Matplotlib基础

3.Seaborn

金融数据处理实战

1.数据获取_1.本地数据读取

1.数据获取_2.网络数据读取_1

1.数据获取_2.网络数据读取_2.tushare

1.数据获取_2_网络数据读取_3.文件存储

2.金融数据处理_1.同时获取多只股票

2.金融数据处理_2.金融计算

2.金融数据处理_3.检验分布和相关性

3.金融时间序列分析_1.Python下的时间处理

3.金融时间序列分析_2.Pandas时间格式

3.金融时间序列分析_3.金融数据频率的转换

4.金融数据处理分析实战案例_案例1

4.金融数据处理分析实战案例_案例2_多指标条件选股分析_1

4.金融数据处理分析实战案例_案例2_多指标条件选股分析_2

1.1.4. 第四部分:量化交易策略模块

三大经典策略

1.三大经典策略_1.SMA

1.三大经典策略_2.动量Momentum

1.三大经典策略_3.均值回归

配对交易策略

2.配对交易

技术分析相关策略

3.量化投资与技术分析_1.技术分析理论

3.量化投资与技术分析_2.CCI策略的Python实现

3.量化投资与技术分析_3.布林带策略的Python实现_1

3.量化投资与技术分析_4.SMA和CCI双指标交易系统

3.量化投资与技术分析_5.形态识别和移动止损策略

大数据舆情分析策略

4.大数据舆情分析策略_基于谷歌搜索的大数据舆情分析

CTA交易策略

5.CTA交易策略_Aberration趋势跟踪系统

量化投资与机器学习

6.量化投资与机器学习_1_机器学习算法原理_2_逻辑回归原理

6.量化投资与机器学习_1_机器学习算法原理_3_SVM算法原理

6.量化投资与机器学习_1_机器学习算法原理_4_决策树算法原理

6.量化投资与机器学习_1_机器学习算法原理_5_KNN算法原理

6.量化投资与机器学习_1_机器学习算法原理_6_神经网络算法了解

6.量化投资与机器学习_1_机器学习算法原理_7_K-means算法原理和算法总结

6.量化投资与机器学习_2_机器学习算法实现_1_数据集生成原理

6.量化投资与机器学习_2_机器学习算法实现_2_数据集可视化

6.量化投资与机器学习_2_机器学习算法实现_3_逻辑回归算法的python实现

6.量化投资与机器学习_2_机器学习算法实现_4_DT_KNN_NB算法的python实现

6.量化投资与机器学习_2_机器学习算法实现_5_SVM算法的python实现

6.量化投资与机器学习_3_机器学习算法实战_6_基于逻辑回归和SVM的股市趋势预测

1.1.5. 第五部分:面向对象和实盘交易

1.模块内容整体介绍

2.面向对象、类、实例、属性和方法

3.创建类、实例、方法

4._init_初始化方法

5.面向对象程序实例

6.继承的概念及代码实现

7.面向对象继承的实战案例

8.多继承和量化交易平台的面向对象开发思路

9.用面向对象方法实现股

试看结束,如继续查看请付费↓↓↓↓
打赏0.5元才能查看本内容,立即打赏

来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

二维码
评论