可视化对于掌握数据集非常有用,但有时数据对于某种可视化技术来说太大了。每种类型的可视化对于其在仍然有用的情况下可以显示的内容量都有限制。这些限制不仅仅是由于可视化,还来自我们大脑感知和解释眼睛所见内容的能力。不同的可视化类型依赖于我们视觉系统的不同功能,因此它们各自都有不同的限制。让我们看几个例子。
在下面输入您的电子邮件即可下载此帖子
在此输入您的电子邮件
请不要担心,我们不会发送垃圾邮件。
饼图
饼图是百分比数据最流行的可视化方法之一,但不适合显示超过七个类别的数据。这是因为我们的大脑并不擅长区分不同的角度,更不擅长区分不同角度之间的距离。如果您的饼图包含超过七个类别,请考虑将其 加拿大移动数据库 转换为条形图。部分与整体的关系不再明显,但通常情况下,查看不同类别之间的差异更为重要。下面饼图的数据取自最近提交给Visual.ly 的信息图中的饼图。它包含的类别太多,不太实用,但经过排序肯定会大有帮助。条形图显示相同的数据,但看不到部分与整体的关系。不过,在这种情况下,这种关系并不重要。更重要的是不仅要看到哪些类别领先于其他类别,还要看到它们领先多少(在这种情况下,唯一显著的差异似乎在前两个类别中)。将轴保持在 0-100% 之间还可以显示值的上下文。
颜色
您会在上面的图表中注意到颜色重复。原始饼图中也有相同的重复,只是颜色不同。颜色是许多分类数据可视化中的另一个限制因素。我们能够轻松区分和记住的颜色(具有相似亮度值)的最大数量约为 12。下面的 12 种颜色取自Colorbrewer2.org,这是一个关于分类和连续颜色标度的丰富资源。
条形图和柱形图
分类数据的条形图和柱形图也对条形的适当数量有上限。该数量受多种因素限制。假设,屏幕空间很重要。毕竟,如果您不能一次看到整个图表,那么您将依靠内存而不是可视化来查看屏幕外的部分。如今,屏幕分辨率通常足够高,像素数不再是限制因素。因此,限制因素有点复杂,取决于几个问题。首先,数据中什么更重要?是否存在重要的总体趋势,还是关注各个类别之间的差异?如果总体趋势是重要因素,您可能能够使用 50 个或更多的条形图。如果个体差异很重要,您可能希望将条形图总数保持在 12 个以下。您添加的每个条形图都会成倍增加比较可能性的数量。这并不是说人们在查看条形图时实际上会进行所有这些比较,他们可能会发现重要的或大的差异并只进行这些比较。下图说明如何使用过多的条形图来比较个体差异,但总体趋势仍然清晰可见。
折线图
折线图是另一种对元素数量有限制的可视化类型。线上的点数仅受屏幕空间的限制,而线数则受感知问题的限制。线条太多会导致人们难以看清和追踪每条线,这取决于线条的交叉。下图取自最近提交给Visual.ly的一张图表。它只有七条线,但底部的线交叉很多,而且彼此以低角度相交(试着追踪紫线)。这对于这张特定的图表来说不是什么大问题,因为带有巨大尖峰的红线是故事所在,但并非所有数据都有相同的故事。
散点图
散点图可以轻松显示比任何其他表格数据可视化更多的元素(亚军是平行坐标)。数字较高有几个原因。第一个原因非常简单:点不占用太多空间。其次,由于散点图擅长显示维度之间的相关性,因此信息实际上来自于聚合组,而不是个体。因此,许多散点图不需要其他图表上所需的占用空间的标签。在下面的例子中,很容易看到两个分组,以及每个组内的一些轻微相关性。通过一些颜色变化、轴标签和解释性文字,此视觉效果可以将数百个元素转化为一小部分见解。