图表是处理数据的重要组成部分,因为它们是将大量数据压缩为易于理解的格式的一种方式。数据的可视化可以向第一次查看数据的人带来见解,也可以将发现传达给看不到原始数据的其他人。有无数的图表类型,每种都有不同的用例。通常,创建数据可视化效果最困难的部分是确定哪种图表类型最适合手头的任务。
您选择的图表类型将取决于多种因素。您计划绘制的指标、要素或其他变量的类型是什么?您计划向谁展示 - 这只是对自己的初步探索,还是您正在向更广泛的受众展示?您希望读者得出什么样的结论?
在本文中,我们将概述可视化工具最常提供的基本图表类型。通过这些图表,您将拥有一个广泛的工具包,能够处理您的数据可视化需求。
基础四大
通过条形图、线、点和方框来表示位置值。因此,我们将从四种基本图表类型开始,每种类型对应于这些值编码方式。
条形图
在条形图中,值由条形的长度表示,每个条形对应于一个测量组。条形图可以垂直或水平定向;竖线图有时称为柱形图。当您要绘制大量条形图,或者其上的标签需要额外的空间才能清晰可辨时,水平条形图是一个不错的选择。
折线图
折线图显示连续测量值的变化,例如随时间推移所做的测量值。向上或向下移动线有助于分别带来积极和消极的变化。它还可以揭示整体趋势,以帮助读者对未来结果进行预测或预测。多折线图还可以生成其他相关图表,如迷你图或脊线图。
散布图
散布图使用位于两个轴上的点显示两个数值变量的值:每个轴对应一个变量。散点图是绘制变量之间关系的通用演示 - 无论该相关性是强还是弱,正还是负,线性还是非线性。散点图也非常适合识别数据中的异常值点和可能的间隙。
箱形图
箱形图使用箱形图和晶须来汇总测量组内值的分布。盒子和晶须末端的位置显示了大部分数据所在的区域。当我们有多个组相互比较时,我们最常看到箱形图;当我们只有一组要绘制时,首选其他具有更多详细信息的图表。
表和单个值
在继续讨论其他图表类型之前,值得花点时间欣赏仅显示原始数字的选项。特别是,当您只有一个数字要显示时,仅显示值是描述数据的明智方法。当分析中涉及确切值时,可以将它们包含在随附表中,也可以通过图形可视化效果上的注释来包含这些值。
常见变体
其他图表类型可能来自更改编码的使用方式,或者通过包含其他编码来实现。辅助编码(如面积、形状和颜色)可用于向更基本的图表类型添加其他变量。
直方图
如果条形图中描述的组实际上是连续的数字范围,我们可以将条形推到一起以生成直方图。直方图中的条形长度通常对应于数据点的计数可视化数据图表,其模式显示了数据中变量的分布。当垂直值不是频率计数时,倾向于使用其他图表类型(如折线图)。
堆叠条形图
标准条形图的一个修改是根据第二个分组变量(称为堆叠条形图)的值将每个条形划分为多个较小的条形图。这样,您不仅可以像在常规条形图中那样比较主要组值,还可以说明每个组的整体到其组成部分的相对细分。
分组条形图
另一方面,如果将子条形并排放置到集群中而不是保留在它们的堆栈中可视化数据图表,我们将获得分组条形图。分组条形图不允许比较主要组总计,但在允许比较子组方面做得更好。
点阵图
点阵图类似于条形图,因为它指示不同分类分组的值,但根据点的位置而不是条形的长度对值进行编码。当您需要跨类别进行比较时,点图很有用,但零基线没有信息或有用。您还可以将点图视为删除了线的线图,以便它可以与具有无序类别的变量一起使用,而不仅仅是连续或有序变量。
面积图
面积图开始时与折线图具有相同的基础 (由线段连接的值点 ), 但从条形图中添加了一个概念,在折线和基线之间有阴影。当与堆叠的概念相结合时,最常看到此图表,以显示总计如何随时间变化,以及其组件的贡献如何变化。
双轴图表
双轴图表将两个不同的图表与共享的水平轴叠加在一起,但垂直轴刻度可能不同(每个分量图表一个)。这可用于显示两组垂直值之间的直接比较,同时还包括水平轴变量的上下文。通常使用不同的基图类型(如条形图和折线图组合),以减少每个分量图的不同轴刻度的混淆。
气泡图
显示三个变量之间关系的另一种方法是通过修改散点图。当第三个变量是分类变量时,点可以使用不同的形状或颜色来指示组成员身份。如果数据点以某种方式排序,则还可以将点与线段连接以显示值的顺序。当第三个变量本质上是数字时,这就是气泡图的用武之地。气泡图通过让第三个变量的值确定每个点的大小,在基础散点图的基础上构建。
密度曲线
密度曲线或核密度估计是显示数据分布而不是直方图的另一种方法。不是将数据点收集到频率箱中,而是每个数据点提供少量数据,其收集的整体成为密度曲线。虽然密度曲线可能意味着一些不存在的数据值,但它们可能是平滑数据中的噪声以了解分布信号的好方法。
小提琴图
比方框图比较组间价值分布的方法的替代方法是小提琴图。在小提琴图中,每组盒子和胡须都被围绕中心基线构建的密度曲线所取代。这可以更好地比较组之间的数据形状,尽管这确实会丢失精确统计值的比较。小提琴图的一个常见变化是在小提琴图的顶部包含盒式标记,以获得两全其美。
热图
热图显示基于两个感兴趣变量的值网格。轴变量可以是数字变量,也可以是分类变量;网格是通过将每个变量划分为范围或级别(如直方图或条形图)而创建的。网格单元格根据值进行着色,通常使用较深的颜色与较高的值对应。当有大量数据点要绘制时,热图可能是散点图的有趣替代方法,但点密度使得很难看到变量之间的真实关系。
专家图表
还有很多额外的图表可以针对特定用例以其他方式对数据进行编码。Xenographics包括一些由非常特殊的目的驱动的奇特图表的集合。尽管如此,其中一些图表的用例非常普遍,可
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。