一个令人印象深刻的大圆圈说明了美国

Learn, share, and connect around europe dataset solutions.
Post Reply
suchona.kani.z
Posts: 272
Joined: Sat Dec 21, 2024 5:42 am

一个令人印象深刻的大圆圈说明了美国

Post by suchona.kani.z »

“隐蔽地”传达其意图的可视化的一个很好的例子是下面对2016年各国国民生产总值的说明(官方实际上就是这样使用的)。


经济相对于其他三个国家的实力。他似乎在喊:“你可以忽略具体的价值观!你可能仍然能够比较不同的圈子。”

是的,我可以!但不幸的是,没有那么聪明,我可以立即看到不同的圆圈是如何缩放的。在这种情况下,每个圆的半径根据经济产出进行缩放。这是重要信息,如下图所示。因为当缩放圆的面积而不是其半径时,相同的数字会产生不同的图像。


现在,圆圈的大小更加接近,国家之间的差异似乎更小。当然,使用不同的属性(例如半径或面积)进行缩放并没有什么问题。它很好地说明了我们的第一印象是多么容易由表示而不是实际数字塑造,因为快速系统试图尽可能地为我们提供支持。

从主要关注数据的可理解和清晰传达的纯粹主义者的角度来看,出现了一个合理的问题:为什么数据应该表示为圆圈?正如我们在上一部分中看到的,无论是在估计角度还是将表面用作值的比较框架时,圆都 邮件营销给医生 不是我们最大的优势。正如经常发生的情况一样,答案是:“谷歌……”不,“条形图是你的朋友。”

#显示你的数据
条形图也有其局限性。特别是如果它们不代表纯值,而是代表测量值(例如中位数或平均值)并且带有误差线。然后每个条形代表数据点的基本分布,这可能是有问题的,正如科学文章中的下图所示:


面板 A 中两个条形的高度显示了各自分布的平均值。然而,B 到 E 部分非常清楚地表明,这些平均值(以及相关的误差线)可以由非常不同的数据云生成。各个数据点可以 B) 围绕平均值对称分布,C) 包含对平均值有强烈影响的离群值,D) 在定义的值范围内双峰(或多峰)出现,或者 E) 数量变化很大比较分布之间存在差异。

所有这些方面在解释数据时都发挥着核心作用,但在显示为条形时是不可见的。关于分布的基本事实对于观察者来说仍然是隐藏的,观察者只有部分图像 A 可用;相反,“两种均值都显示出显着差异”的说法会增加分量。

基本规则是:只要有可能,您就应该查看所有数据点!它可以让您在任何酒吧启动您自己的“解释机器”之前得出自己的结论。

结论
良好的表示不是给定的,因此不应假设。无论是通过有意识还是无意识的决定,可视化都可以影响对所显示数据的判断,从而产生深远的影响。尤其是观众,往往没有意识到这种表征的责任,他们会消费所提供的信息,而不是真正有意识地对其进行分类。但鉴于数据在我们社会中发挥的核心作用,我们在解释数据时应该花时间激活我们缓慢的系统。

当然,数据可视化只是其解读的一方面。我们所采取的示例路径直接导致了统计的不便。如果您仍然想让自己感到舒服,您可以使用辛普森悖论来发现实际上简单聚合的惊人结果,或者让泰勒·维根(Tyler Vigen)令人印象深刻地向您展示人造黄油的消耗可以解释离婚率- 如果您只愿意使用相关性和因果关系等同。正如您所看到的,本文的结尾只是我们更好地理解如何解释数据的工作的开始。但如果我们能够保持警惕,我们就已经掌握了最重要的一步。

您可以立即在其他地方使用这种警惕性。在下一篇文章中,我想解决现代人工智能方法的问题,这些方法需要大量的输入数据,以至于不可能以结构化的方式对其进行管理 - 因此并不总是清楚算法实际上正在接受什么训练。

您想了解更多关于 adesso 世界中令人兴奋的话题吗?那么请看一下我们之前发布的博客文章。
Post Reply