敲黑板!科学家们,你们真的会数据可视化吗

2021-04-11 15:11:11 9点赞 64收藏 0评论

敲黑板!科学家们,你们真的会数据可视化吗

不论是心理学还是神经科学,数据分析方法都变得越来越复杂了。因此,了解如何更准确地将数据以图示的方式表达,不仅可以降低读者的理解门槛,还可以使文献更大范围地传播。然而,研究者们在大学或研究机构中并没有获得足够多的数据可视化训练。本篇文章介绍了如何合理地运用可视化表现不同的数据类型。

试着想象一本没有任何图像的科学教科书。没有表格,没有图表,没有插图,也没有标有箭头和标签的示意图。科学将变得更难理解。

这是因为人类本质上是视觉动物,人们用图像的形式汲取他们难以理解的文字信息。图像对所有叙述都很有用,用图像解释科学界常常发生的复杂故事尤为有效。科学可视化对数据分析,实验结果交流,甚至完成惊人的科学发现都是必不可少的。

可视化可以展现数据中很难或几乎不可能用其他方式找到的模式、趋势和联系,麻省理工学院博得研究院(Broad Institute)的创意主管王邦(Bang Wong,音译)说:“可视化的数据能让我们看到表格无法呈现的数据隐含的结构。

然而只有极少一部分科学家在对待数据可视化时像他们在收集或解读数据时那样小心。大部分科学出版物中,添加图像和示意图常常是研究者们最后做的事,数据可视化研究者肖恩·奥多诺修(Seán O’Donoghue)说道:“可视化被看作是做蛋糕时最后挂上的一点糖霜一样不重要。”

敲黑板!科学家们,你们真的会数据可视化吗

- fondant au chocolat -

因此,科学界充斥着的拙劣的数据可视化,它们不仅迷惑读者,有时候甚至会误导制作这些可视化的科学家们。有缺陷的数据可视化会削弱科学研究的质量,并阻碍研究的进展。除此之外,由于越来越多科学领域的图像进入新闻和社交媒体等公众领域,用于解释从气候变化到疾病爆发的所有事件,糟糕的可视化很可能会损害公众对科学的理解。

随着科学数据的数量和复杂度的增长,数据可视化的问题也变得更加严峻。可视化这些数据,理解并共享它们,在如今变得更加重要。然而科学家们只接受过非常少的可视化训练。“科学家群体还没有在大范围上认识到可视化训练是十分必要的。”新南威尔士大学(University of New South Wales)的奥多诺修说,他同时也是2018年《生物医学数据科学年鉴》(Annual Review of Biomedical Data Science)中一篇关于生物医学数据可视化论文的第一作者。

虽然目前学界的形势严峻,我们还是能看到一些进步征兆的。在过去的十年涌现了至少两个致力于科学数据可视化的年度学术会议。此外,期刊《自然-方法》(Nature Methods)在2010到2016年间,开设专栏指导科学家们创建更好的图表。这个专栏的内容随后被改编成了该期刊的论文提交指南。但到目前为止,只有少数的科学家关注这个问题。

改善科学数据可视化要求我们对人类大脑感知世界的机制的优劣与偏见有进一步的了解。幸运的是,研究已经开始揭示,人们是如何理解或误解不同的可视化,以及哪一种图表能最有效地传达信息并最容易被理解。运用这些知识将使科学界的可视化交流变得更加顺畅。

哪些可视化的方法有效,哪些效果不好?关于这个问题,我们已有非常多的可实践答案。犹他大学计算机科学家米莉亚·梅耶(Miriah Meyer)说。“有许多原理经得住时间的检验,并一次次被证明有效。”

图表的选择


人类视觉系统的进化并不是为了让人们能读明白图表,而是为了帮助人们在自然界中生存繁衍。我们的大脑对眼睛看到的东西进行解读,从而帮助我们区分可食用的和有毒的植物,辅助我们发现猎物,并让我们无论在白天还是在夜晚都能看得清楚。通过分析眼睛接收到的信息来达成这些目的,大脑给予我们了一份为世界定制的知觉。

1980年代初,贝尔实验室的统计学家威廉·克利夫兰(William Cleveland)和罗伯特·麦吉尔(Robert McGill)开始研究人类的感知具体如何影响我们辨识数据的图像式呈现。他们开始探索哪些类型的图表能让我们很快理解,而哪些类型会让我们头疼。1984年,克利夫兰和麦吉尔在《美国统计学会期刊》(the Journal of the American Statistical Association)发表了一篇开创性的论文,依据阅读时的易读性和准确性,他们提出了视觉元素排行榜

敲黑板!科学家们,你们真的会数据可视化吗

人们更容易辨识某些种类的视觉元素的细微差别,譬如两条线的长短或一条线的方向会比不同的灰度和不同的色彩强度更易于分辨。研究显示,在图表中,使用榜单上排名更靠前的视觉元素会让图像更易懂,也更有效。

W.S. CLEVELAND AND R.McGILL/ JOURNAL OF THE AMERICAN STATISTICAL ASSOCIATION 1984; S.I. O'DONOGHUE ET AL/ AR BIOMEDICAL DATA SCIENCE 2018
5W INFOGRAPHIC / KNOWABLE

他们的研究证明人们更善于读取基于条形或线的长度的图表,譬如一个标准的条形图。这些类型的可视化在准确分辨不同数值之间的微小差异时是最好的选择。

研究参与者在判断方向、角度与面积的区别时更加为难,而对运用体积、曲度或灰度来表现数据的图表则更是摸不着头脑。所有方法中最难区分差异的则是色彩饱和度。

敲黑板!科学家们,你们真的会数据可视化吗敲黑板!科学家们,你们真的会数据可视化吗敲黑板!科学家们,你们真的会数据可视化吗敲黑板!科学家们,你们真的会数据可视化吗敲黑板!科学家们,你们真的会数据可视化吗敲黑板!科学家们,你们真的会数据可视化吗敲黑板!科学家们,你们真的会数据可视化吗敲黑板!科学家们,你们真的会数据可视化吗敲黑板!科学家们,你们真的会数据可视化吗敲黑板!科学家们,你们真的会数据可视化吗敲黑板!科学家们,你们真的会数据可视化吗

SOURCE: EPA. GOV 5W INFOGRAPHIC / KNOWABLE

在这个排行榜排名越靠后的视觉元素,大众感知其细微差别的能力越弱。 华盛顿大学西雅图分校(University of Washington in Seattle)的计算机科学家杰弗里·希尔(Jeffrey Heer)说。总体来说,使用列表中排名最高的元素会是最好的,它将满足不同类型数据的需求。

比如,如果我们现在需要证明某一种特定的疾病远远比其他疾病更致命,那么使用圆的大小去表示死亡人数的图解或许就足够了。但如果我们需要强调的是死亡率更小的疾病间微小的死亡人数的区别,使用条形图或许更加有效。

2010年,希尔使用电商平台亚马逊(Amazon)的网上众包平台Mechanical Turk,确认了克利夫兰和麦吉尔的排行榜在现代数字环境中仍然奏效。从那以后,希尔、奥多诺修和其他的研究者开始使用众包服务*来测试很多其他方面的可视化,尝试找到最有效的可视化方式。“我们做的事对整个领域的前进有非常大的推动作用,并且给予可视化研究一个稳固的工程学基础。”奥多诺修说。

*译者注

众包服务是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的(而且通常是大型的)大众网络的做法。定义来自于杰夫·豪(Jeff Howe)2006年于《连线》杂志Wired)发表的文章“众包服务的兴起”(The Rise of Crowdsourcing)。

有毒的饼状图

克利夫兰和麦吉尔的图形排行榜强调了一些流行图表效果不好的原因。一个很好的例子是一直都十分受欢迎的饼状图,它也是数据可视化专家们如爱德华·塔夫特(Edward Tufte)的鄙视对象。在他1983年发表的那篇影响深远的论文“量化信息的可视化呈现”(The Visual Display of Quantitative Information) 中, 塔夫特写道,“世上唯一比一个饼状图更糟糕的设计,就是几个饼状图。”

饼状图往往被用来比较一个整体中的不同部分,这是一个在认知上十分具有挑战性的视觉任务。读者需要判断几个扇形的面积差异,或是饼状图中心角度的差别。这两种类型的判断都比辨别条形图中条形的长度差别更难。所以,在大部分情况下,条形图都是更为理想的选择。

敲黑板!科学家们,你们真的会数据可视化吗

饼状图更适用于表现局部与整体的关系。在这张图中,饼状图有效地展现了每一个经济领域对整体的温室气体排放量的贡献大小,但我们很难比较不同经济领域间的关系。条形图让经济领域间的比较变得便捷,但我们很难从中看出每一部分跟整体的关系。

EPA. GOV 5W INFOGRAPHIC / KNOWABLE

人们热衷于饼状图的原因有很多:它们往往比条形图更吸引人,可以轻易地用不同的颜色填充,制作过程也十分简单。但它们只有在很少的情况下是可用的,并且在更少的情况下是最理想的图表选择。如果我们的目标是表现整体是部分的总和,或比较局部和整体(而不是进行局部间的比较),只要精确度不重要,一个精心制作的饼状图就足够了。

比如,描述不同经济领域对温室气体排放影响的饼状图能很好地展现大概一半的温室气体排放来自“电热生产”和“农业、林业及其他土地利用”这两个领域。常常被大众关注得最多的“运输”,在饼状图中的占比与前两者相比小很多。在这种情况下,把六个条形并排摆放在一起,并不能立刻体现所有的局部加起来等于百分之百,抑或是每一个条形所代表的比例。

在一些科学领域里,用饼状图来呈现某种特定数据类型是标准操作,想要违背传统是很难的。“在表观遗传学的一些特定领域里,我们必须使用饼状图。”王邦说。在博得研究院,王邦和生物医学家们合作,研究如何创造更好的可视化。“我知道饼状图的缺点,但在过去,每一篇论文的发表中都会用到饼状图,所以领域内的研究者一直延续着这个习惯。”

而在其他情况下,饼状图要求人们做额外的脑力劳动,这使它们无法传达准确的信息或连贯的故事。

条形图背后

尽管条形图易于阅读和理解,这并不意味着它们在所有的情况下都是最好的选择。在某些领域,例如心理学、医学和生理学,条形图常常会歪曲数据,并且隐藏一些重要的细节。

如果你想要可视化计数与比例,应该用条形图。”明尼苏达州罗切斯特梅奥诊所(Mayo Clinic)的生理学家特雷西·魏斯格贝尔(Tracey Weissgerber)说。她的研究方向是理解科学家如何完成与汇报科学研究。“但要想可视化连续数据(continuous data),使用条形图并不是十分有效的策略。”

2015年,魏斯格贝尔调查了一些顶级的生理学期刊。她发现,85%的论文都使用了至少一个条形图来表示连续数据。对于血压或温度这样的连续数据,每一个样本的取值都可能是一个相关区间内的任何数值。如果用条形图来表示连续的数据,可能无法呈现一些重要的信息,比如,条形图的某一组中有多少样本,或者在某一组中是否有更细的分组。

敲黑板!科学家们,你们真的会数据可视化吗

右侧的每一组数据都可以被左侧的条形图准确表达。这说明条形图会模糊很多数据中的细节,甚至误导读者。

T.L. WEISSGERBER ET AL / PLOS BIOLOGY 2015 5W INFOGRAPHIC / KNOWABLE

比如,魏斯格贝尔指出妊娠并发症先兆子痫(pregnancy complication preeclampsia)的来源可能是孕妇、婴儿或胎盘的问题,但即使是在这些不同的患者群体中,也有通过不同途径产生相同症状的更小的群体。“我们正专注于尝试了解并辨识不同种类的先兆子痫的女性,”魏斯格贝尔说,“这其中的一个问题是,如果我们用条形图来呈现我们所有的数据,条形图并没有子群的表现方式来表明不同种类的发病机制。

把条形图用于样本量非常小的研究会导致很大的问题,而样本量小的研究在基础生物医学中十分常见。条形并不会展现样本量有多小,并且离群值对条形高度表示的平均值有很大的影响。

“目前面临的一个挑战是,在很多生物医学领域,条形图就是……我们呈现连续数据的约定俗成的形式。”魏斯格贝尔说道。

敲黑板!科学家们,你们真的会数据可视化吗

很多其他类型的图标都比条形图更适合展现连续数据。散点图(上)给予读者更多数据的细节,展现样本量,以及数据中是否有离群值或数群。箱线图(中)易于展现数据的变异性(variability)。直方图(下)让读者能够评估数据的分布。

5W INFOGRAPHIC / KNOWABLE

对于样本量小的连续数据,有很多其他可供选择的图表。散点图、箱线图和直方图都能表现数据的分布,但魏斯格贝尔分析的论文很少使用这些可视化方式。为帮助大家纠正这个问题,她开发了一些工具,用于创建简单的散点图和不同种类的交互式图表。

毁灭性的彩虹色标

色彩在突出数据的不同方面,以及为科学图表增添一点活力时十分有效。但这也是人们最容易出错的地方之一。人们对颜色的感知并不直接,并且大部分科学家在选择呈现他们的数据的颜色时,并不会将视觉系统的特性考虑在内。

其中一种最常见的错误操作是使用彩虹色标。从地质学、气候学到分子生物学,研究者们倾向于用彩虹的颜色来映射他们的数据。但实际上彩虹色标有一些非常严重的缺陷,所以通常不推荐使用。

敲黑板!科学家们,你们真的会数据可视化吗

本图使用了彩虹色标来展现月球上引力的差异。看这张图的第一眼(或许即使到第二眼第三眼),这张图都很难读懂。蓝色代表着更高还是更低的引力呢?红色呢?

NASA'S GODDARD SPACE FLIGHT CENTER SCIENTIFIC VISUALIZATION STUDIO.

尽管彩虹的颜色来源于自然光的光谱,它的颜色的顺序并不直观,王邦说。“你在读图的时候可能需要花时间去思考,蓝色比绿色代表的值更大吗?黄色与红色怎么比呢?”

更严峻的问题是,人脑对不同颜色的感知是不均匀的。人们用色调(譬如红或蓝),饱和度(颜色的强度)和明度(多少的白或黑参杂其间)来感知色彩。人脑在很大程度上依据明度来理解形状和深度,因而人们更倾向于将明亮的颜色视作峰值,而把更深的颜色看作谷值。彩虹色中最明亮的颜色是黄色,但它在色彩值域中往往处于中间位置,这将导致读者更容易把错误的地方当作高点。

敲黑板!科学家们,你们真的会数据可视化吗

灰度可能看起来很无聊,但它十分直观。不同灰度之间的差异很好辨认,但彩虹色标并没有这个特质,这就是地图绘制员与数据可视化专家规避它的原因。

5W INFOGRAPHIC / KNOWABLE

让问题更复杂的是,一些颜色间的转换是缓慢的,另一些颜色间的转换看上去更突然。然而,隐含数据的变化速率往往稳定一致,这与感知到的彩虹色的不规则性并不匹配。“即使数据中并没有界限,你可能会有感知上的界限,抑或是彩虹色会隐藏数据中真实存在的界限。”英国雷丁大学(University of Reading)的气候科学家埃德·霍金斯(Ed Hawkins)说。甚至科学家在解释自己的数据时也会陷于这种假象中。

为了避免彩虹色问题,一些研究者想到了基于数学的色组,使颜色的感观变化与相应的数据变化更好地匹配。其中也有一些较新的色标专门面向红绿色盲人群。据估计,红绿色盲困扰着大约8%的男性以及极少部分女性。

尽管几十年来,地图绘制员和类似霍金斯这样的科学家持续反对使用彩虹色标,但在科学文献中, 彩虹色标仍然无孔不入。一些科学领域大概从彩色打印发明以来一直在使用彩虹色标。并且,由于很多科学家并未意识到彩虹色标的问题,他们没有对抗传统的理由。“人们已经习惯使用彩虹色标了,所以他们喜欢它,并觉得用得很舒服。” 霍金斯说。

敲黑板!科学家们,你们真的会数据可视化吗

用不同色标呈现的酵母菌细胞的显微镜图凸显了彩虹色标反直观的本质。cividis色标(右二)和viridis色标(右一)都能更好地呈现数据并更容易读懂。cividis色标同时也是专门为色盲人士设计的。

J. R. NUÑEZ ET AL / PLOS ONE 2018
KNOWABLE MAGAZINE

这种对彩虹色标的执着也受到了某种形式的鼓励——彩虹色标是许多科学家创建数据可视化的软件的默认设定。霍金斯和其他人一直在推动软件制造商改变其默认设定,并获得了一定程度上的成功。

2014年,MathWorks将MATLAB程序的默认颜色改为一种名为“parula”的改进型颜色体系。2015年,一位认知科学家与一位数据科学家开发了一种新的名为“viridis”的默认色彩体系,用于在流行的编程语言Python中制图。一种新的基于数学的名为“cividis”的色彩体系已经被添加到十几个软件库中,但它目前还并不是其中任何一个软件的默认设置。

危险的热力图

人类视觉系统中最有趣的怪象,同时也是数据可视化中最让人恼怒的点之一,是我们对同一种颜色的感知受到周围其他颜色的影响。在某些情况下,这种影响十分显著,并导致了各种各样的视错觉。

无论何时,当在同个可视化中有几种不同颜色,或是同种颜色的不同色度摆放在一起,它们会用意想不到的方式相互作用。同一种颜色会因为被更深或更浅的色度包围而显得完全不同,这种现象被称作同步对比(simultaneous contrast)。一个众所周知的例子是棋盘阴影错觉(checker shadow illusion),该错觉是由影子投射到棋盘的网格时,大脑对颜色的“脑补”导致的。

敲黑板!科学家们,你们真的会数据可视化吗

图中的所有长方形都拥有相同色度的灰,但根据它们周围的颜色,它们看起来完全不同。这种现象被叫做同步对比(simultaneous contrast),可能会导致读者误解在同一张图中用颜色代表的数值。

5W INFOGRAPHIC / KNOWABLE

“色彩间的相互作用带来了巨大的问题。”王邦说。在生命科学领域,一个普遍的例子是热力图。热力图经常被用来表现两组数据之间的关系。“如果你随意翻阅一本学术期刊,会发现三分之一的图表都是热力图。”他说,“这是一种非常流行的数据可视化模式,而它实际上带来了数据偏差。”

热力图是一个二维矩阵,本质上就是用网格中每个方块的颜色来代表隐含数据的数值大小。不同的色度或明度代表了数值的高低。热力图在呈现基因活动的数据分析中大受欢迎。它帮助研究者们探寻在不同情况下基因的表达模式。

敲黑板!科学家们,你们真的会数据可视化吗

标星号的两个方块是同等色度的橙色,表示它们有相同程度的基因活动。但这两个标星方块周围颜色的差异让它们看起来并不相同,某种程度上这可能会误导读者。

H. E. GRECCO ET AL / NATURE METHODS 2010
5W INFOGRAPHIC / KNOWABLE

热力图善于把数量庞大的数据囊括为一个简单明了的可视化呈现,但把不同色度的颜色直接放在彼此周围可能会导致同步亮度对比错觉。比如,比较方格中每一个方块的颜色时,科学家通常会受到目标方块周围颜色的影响。

“在热力图中,你需要依赖一大堆彼此毗邻的色块来理解数据,而这将会导致巨大的问题。”王邦说,“这种无意的偏见几乎在每一张热力图中都很常见。”

在基因活性数据中,绿色与红色经常被用来标识基因的活跃度。一种特定色度的绿在被更浅色度的绿色环绕时,与它被更深色度的绿色、红色或黑色环绕相比,会显得非常不同。这种绿色的色度所代表的值在不同情况下都是相同的,但由于它周围的方块的影响,它的值看起来会更高或更低。

敲黑板!科学家们,你们真的会数据可视化吗

热力图用颜色来追踪不同样本间的相对基因活性。绿色表示活性高,亮度更高的绿色表示更高的活性,而红色表示基因不活跃。在这张图中,大部分的亮绿色集中在图表的左上角。图表中间一个亮绿色方块可能标识着重要的活动,但这个方块只是因为在周围的黑色方块的映衬下显得很亮,它其实与左上角的那组方块中(看起来)不是特别亮的方块颜色相同。

MIGUEL ANDRADE / WIKIMEDIA COMMONS
KNOWABLE MAGAZINE

如果用细菌打比方,方格图中的某个部分的一大块亮绿色区或许意味着,该基因在一组密切相关的亚种中高度活跃。同时,在方格图的另一位置,一个单独的黯绿色方块可能在周围黑方块的映衬下显得很亮,仿佛显得这个基因在一群不相干的细菌种类中也高度活跃,而事实是它仅有微弱的活跃度。

王邦说,改善这个问题的方法之一是在方格图中间加入一些白色的空间。这或许可以区分相关种类的组、样本组或相关联基因的组。将方格区分开来会减少邻近颜色的干扰。另一种方式是使用一种完全不同的视觉呈现,譬如说使用线来连接高度活跃的基因,或用一系列的图来表示基因活动随时间,或在两种实验情境下的变化。

混乱的信息

虽然在分享科学成果时,确保可视化不会错误地表现数据或误导读者是至关重要的,但我们同样需要考虑我们所用的图表是否能吸引读者对最相关信息的关注,而不是分散他们的注意力。

举个例子,很多数据在被绘制成线性图或直方图时,它们的分布都是大量数据集中于中间的钟形。“但往往我们关注的是数据分布尾部的信息。”王邦说。对观看者来说,“尾部的信息常常被中间这坨庞大笨重的东西淹没了。”

解决方法可以是使用高度以外的形式来表现数据分布。选择之一是条形码图,它将每个数值标记为一条线。在这种类型的图中,更容易看到低频度区域的细节,而这些细节在钟形图上往往会全部消失。

敲黑板!科学家们,你们真的会数据可视化吗

钟形图能引起人们对数据集中部分的注意,但有时候真正重要的信息是数据边缘的信息。在这种情况下,条形码图或许是更好的选择。上图展现了细胞系对FOXA1基因的依赖性,负1参考线左边的细胞系需要该基因才能存活。这些细胞系在钟形图上很难被察觉,但在条形码图上却很突出。

BANG WONG/ BROAD INSTITUTE
5W INFOGRAPHIC / KNOWABLE

经过深思熟虑后再选用的色彩可以增强和阐明图表想传达的信息。例如,在散点图上,使用不同颜色来区分数据类别。最重要的信息应该由最突出的颜色来表现。制图程序可能只是因为对照组是数据的第一列,就随机地把红色分配给它,而对研究结果至关重要的有趣的基因突变组,最终却被标成灰色。

“纯色在自然界中并不常见,所以应该把纯色用于突出图表中重要的信息,把柔和的色调用于不太重要的信息。”数据可视化记者阿尔贝托·开罗(Albert Cairo)在他2013年出版的《功能性的艺术》(The Functional Art)一书中写道。

除了彩虹色标和同步对比之外,色彩使用在很多其他地方也会出现问题。使用过多的颜色可能会让人从可视化传递的主要信息中分心。颜色之间太过相似或与图像的背景色太过相似会让人难以解读

违背文化预期的颜色也会影响读者对图表的理解程度。例如,在显示地形的地图上,人们会期待植被是绿色的,干旱地区是棕色的,海拔较高的地方是白色的,城市是灰色的,水是蓝色的。一张地图如果不遵守这些既定的配色方案,就会让人很难读懂。想象一下,在一张美国的选举地图上,如果用红色表示民主党地区,用蓝色表示共和党地区,或者条形图用鲜艳活泼的颜色表示不同的死因,这种不和谐的感觉只会让人更难汲取它们的信息。

敲黑板!科学家们,你们真的会数据可视化吗

受文化影响,读者们对不同颜色的含义有不同的预期。违背这样的期待会使图表、地图或其他的图解更难被人理解,就像这幅变色浮雕图所展示的那样。

TOM PATTERSON
KNOWABLE MAGAZINE

如果色彩并不是必须的,有时候用不同色度的灰是最为安全的。正如塔夫特在他1990年出版的名为《展望信息》(Envisioning Information)一书中写的那样,“用色彩传递信息的第一原则应是避免灾难,最重要的是,不要因为使用色彩,而影响信息的准确传递。”

可视化未来

很多数据可视化问题一直没有被解决的原因是科学家们并未意识到这些问题,抑或是他们并不相信更好的图示值得他们额外的努力,奥多诺修说道。

奥多诺修一直在努力改变这种现状。他发起并主持了致力于生物科学可视化的年度学术会议Vizbi,讲授面向科学家的可视化研讨会,梳理文献,整理最优和最差可视化的证据,并将这些证据编入他2018年的年度综述论文中。但他说,总体而言,这项工作还未受到很多关注。“我认为我们还有很长的路要走。”

缺乏认识的原因之一是大多数科学家没有得到任何数据可视化的训练。科学领域的硕博生很少被要求接受数据可视化训练,大多数学术机构也没有开设科学数据的可视化课程。对于许多,尤其是在生物医学领域的学生来说,他们唯一接触到数据可视化的机会是在并不符合他们需求的统计学课程中,魏斯格贝尔说。

科学家们在决定如何呈现数据时,也往往遵循惯例,使不良做法长期存在。

对抗传统力量的方法之一是将更好的设计原则融入到科学家绘制数据的工具中(比如已经从彩虹色标默认值切换到感知上更均匀的色标的软件工具)。大多数科学家不会去学习更好的可视化操作,奥多诺修说,“但他们会使用工具。而如果这些工具中有更好的标准,那么他们会自然而然地采用这些。”

敲黑板!科学家们,你们真的会数据可视化吗

常用的数据可视化形式包括饼图、箱形图和散点图。根据数据的不同,有些人在沟通方面比其他人更成功。

KNOWABLE MAGAZINE

科学出版商也可以提供帮助,他说。“我认为期刊可以通过制定标准来发挥作用。” 职业生涯早期的科学家会从更有经验的同事和发表的论文中得到启发。一些期刊,包括《公共科学图书馆-生物学》(PLoS Biology)、《eLife》和《自然-生物医学工程》(Nature Biomedical Engineering)已经对魏斯格贝尔2015年关于条形图的研究做出了回应。“在论文发表后的这段时间里,一些期刊已经改变了他们的政策,禁止或不鼓励用条形图来呈现连续数据,特别是对于样本量小的数据。”她说。

随着科学数据变得越来越复杂,科学家们需要继续开发新型的可视化工具来处理这种复杂性。为了使这些可视化对科学家和公众都有效,数据可视化的设计者必须结合人类视觉处理最前沿的研究结果,以顺应大脑的加工方式进行数据可视化,而不应与之背离。

作者:Betsy Mason | 封面:El Diablo

译者:久里 | 校对:苏木弯

编辑:山鸡 | 排版:平原

未经授权,不得转载
展开 收起

《矮大紧指北》音频节目

《矮大紧指北》音频节目

100元起

《改善两性关系的秘密第二季》音频节目

《改善两性关系的秘密第二季》音频节目

88元起

《局座讲风云人物》音频节目

《局座讲风云人物》音频节目

99.5元起

《老梁的四大名著情商课》 音频节目

《老梁的四大名著情商课》 音频节目

99.5元起

《蒋勋细说红楼梦》音频节目

《蒋勋细说红楼梦》音频节目

90元起

《涂梦珊:最美声音课堂》音频节目

《涂梦珊:最美声音课堂》音频节目

99元起

《蒋勋:不焦虑的慢生活指南》音频节目

《蒋勋:不焦虑的慢生活指南》音频节目

249元起

《精读中小学必读名著100本》音频节目

《精读中小学必读名著100本》音频节目

49元起

《乐乐课堂:小学语文知识点大全》

《乐乐课堂:小学语文知识点大全》

119.4元起

《李小牧深喉日本》音频节目

《李小牧深喉日本》音频节目

69元起

《小猪佩奇全集:给宝贝的听觉盛宴》音频节目

《小猪佩奇全集:给宝贝的听觉盛宴》音频节目

199元起

《林老师讲日语:零基础定制版》音频节目

《林老师讲日语:零基础定制版》音频节目

192元起

《精读全球好书100本【第一季】》音频节目

《精读全球好书100本【第一季】》音频节目

49.5元起

《舒克贝塔历险记》(上部/下部)音频节目

《舒克贝塔历险记》(上部/下部)音频节目

49.5元起

《河森堡:血脉偾张的人类简史》音频节目

《河森堡:血脉偾张的人类简史》音频节目

121元起

《康震品读古诗词》音频节目

《康震品读古诗词》音频节目

98.5元起
0评论

发表评论请 登录
评论举报

请选择举报理由

相关好价推荐
查看更多好价

相关文章推荐

更多精彩文章
更多精彩文章
最新文章 热门文章
64
扫一下,分享更方便,购买更轻松