您现在的位置: 方言大全网 >> 方言英语 >> 正文
相 关 文 章
普通方言英语 315|可视化打假:商家…
普通方言英语 “单词不用背看完自然…
普通方言英语 各地方言歌最近很火陕…
普通方言英语 方言加英文的歌曲
普通方言英语 把英文歌翻译成方言后…
普通方言英语 如果把这些英文歌翻译…
普通方言英语 要恰饭的嘛什么意思什…
普通方言英语 恼羞成怒的全能神群殴…
普通方言英语 如果现代普通话是胡语…
普通方言英语 宋楚瑜抵长沙:“楚瑜…
普通方言英语 qq聊天时经常看到对方…
普通方言英语 湖南“恩么”方言什么…
普通方言英语 恩么表示没有的意思这…
普通方言英语 恩啊哪里方言
普通方言英语 恩的音韻方言
普通方言英语 复联4星爵跳舞背景音乐…
普通方言英语 湖南邮电职业技术学院…
普通方言英语 英语学习视频 七年级英…
普通方言英语 陕南湘方言词汇与湖湘…
普通方言英语 湖南土话—湖南方言词…
普通方言英语 17个英语趣味小知识
普通方言英语 在这家酒吧唱过歌的草…
普通方言英语 英语趣味小知识
普通方言英语 爆笑趣味英语小知识10…
普通方言英语 趣味英语小知识你知道…
普通方言英语 抖音神曲“前看其详上…
普通方言英语 抖音哎咿呀哎咿呀有点…
普通方言英语 b站经常用的小黄歌英语…
普通方言英语 我要笑疯了鹿晗《Lu》…
普通方言英语 龚琳娜新歌《帝江混沌…
普通方言英语 6-12岁怎么选英语班?…
普通方言英语 郑州规模大的幼儿英语…
普通方言英语 聚焦PX项目:风险不大…
普通方言英语 成熙英语——让我有勇…
普通方言英语 史上最完整的英语口音…
普通方言英语 方言的消亡无可避免
普通方言英语 英语其实就是汉语里的…
普通方言英语 英语也有方言吗?
普通方言英语 天学英语:让智慧化教…
普通方言英语 上海市英语教育教学研…
  315|可视化打假:商家如何利用图表欺骗我们?           ★★★
315|可视化打假:商家如何利用图表欺骗我们?
作者:佚名 文章来源:本站原创 点击数: 更新时间:2021/5/29 7:59:38

  出格是比拟文字,图表在传布中更有劣势,所谓一图胜千言。都雅的图表、专业的图表,可托度似乎也更高。

  而阿尔贝托·开罗(Alberto Cairo)的《数据可视化圈套》(How Charts Lie)一书则告诉我们并非如斯,它揭穿了良多美国政客、公司操纵图表来棍骗的幻术。本应帮读者更好地舆解数据的图表,却常常成为忽悠人的东西。

  好比书中提到的这幅曾挂在白宫西翼的 2016 年美国大选投票成果地图,就很具有误导性。一眼望去仿佛 80% 都是投特朗普的红色,但现实上他和希拉里得票率都不足50%。

  “若是说图表的焦点就在于:在尽可能忠诚于数据的根本上通过各类体例来编码数据,那么我要告诉你:打破这个焦点准绳将无一破例埠导致视觉棍骗。”——《数据可视化圈套》第 59 页

  Cairo 在书的起头就指出了可视化的最焦点准绳,即忠诚于数据去做可视化。这一点要做到仿佛简单,随便用个 Powerpoint 或 Keynote 里的图表东西一键生成,不就是最精确、最忠诚于数据的可视化了吗?

  但其实猫腻多多。由于想棍骗你的人,才不会用默认模板简单地生成图表,而是处心积虑地调整各类参数,让你看完图后,得出和数据本身并不相符的结论。

  具体有哪些猫腻?Cairo 起首科普了一张图表该若何准确地阅读:为什么要这么读图?此刻糊口中图表这么多,还要教吗?

  是的,良多人其实并不会读图。碰到图表时,往往只看题目和可视化,忽略了数据来历、坐标轴等部门,而这些恰是能够做四肢举动的处所。

  Cairo 就按照这些读图要点总结出了 5 大类图表圈套,我们一个个来看。别的,为了让大师更好理解这些圈套及其背后的道理,课代表找了一些国内的图表做案例来做申明,说不定就有已经骗到你的图。

  下面这张是凤凰旧事(右边)和 BBC (左边)报道中国新冠确诊人数的地图,数据更新时间都是2020年2月14日的下战书。

  是不是 BBC 的地图看起来像是国内的疫情重灾区有良多?东部良多省份的疫情都和湖北一样严峻,而我们晓得现实环境并不是这么一回事,凤凰旧事的图就没这种观感。

  不同就在色块的取值范畴上:虽然两张地图都划了 5 个色块,但 BBC 将确诊病例大于 500 例的省份都付与最严峻的深红色,导致了其时确诊 529 例的重庆和确诊 51986 例的湖北是一样的颜色,很有误导性。而凤凰网的数据划分范畴就合理的多,是以 10 的次方为分界线。

  “图表的质量取决于数据编码的精准度以及它能否采用了得当的比例。”——《数据可视化圈套》第 91 页

  数据上,小米6 的跑分是 18 万多分,而 OPPO R9s 是 7 万分不到,前者是后者的 3 倍不到。而从4万分起头展现,高度给人的视觉感触感染是两边的倍数有 5 倍多。“肆意地摆布标度和比例凡是会导致图表展示的歪曲。”——《数据可视化圈套》第 68 页

  关于坐标轴是不长短得从 0 起头,不断是可视化设想中的一个老生常谈的问题,美数课也已经有图被读者指出坐标轴起点不是零(见《特朗普的败选人生该若何放置,这里有份楷模名单》的评论区)。

  Cairo 感觉这个需要连系现实问题看,若是图表是操纵高度本身去呈现数据,如柱状图,那么坐标轴就该当从 0 起头,但若是我们关心的是数据的相对位置,如散点图等,那么坐标轴的起点就能够更矫捷。

  手机发布会上的 PPT 图表耍小伶俐的真是太多了,小米至多仍是基于数据去呈现的图表,下面这张图是就真的是放飞自我了,这是 魅蓝S6 手机新品发布会上引见处置器的一幕:

  课代表按照数据做了一张对比图,本来 PPT 制造者不只将本人的柱形图拉长了,数值 1313 应是拔到了 1400 多,还把竞品的柱形图缩短了。这是课代表见过的最不走心的一张哄人图表了。

  第一个图表圈套是操纵读者没有看坐标轴或标签的习惯来进行视觉棍骗,接下来这个圈套操纵的则是常常被大师轻忽的数据来历。

  Cairo 在书中提到了这么一句鄙谚——“输入垃圾,输出必为垃圾”(Garbage in garbage out),这是法式员、统计学家和科学家中常说的一句话。在图表中这个事理也同样合用:若是图表援用的数据都是错的,那它再精彩也没用。

  来看下面这张图,这是一张讲各地小孩会说方言比例的图表,曾在社交媒体广为传播。

  而这张图最大的问题就是数据来历。谁做的查询拜访、查询拜访的样本量是几多、熟练利用方言的判断尺度是什么,这些通通没有交待。

  “那些合适我们根深蒂固的信念的图表,对我们发生误导的可能性最高。”——《数据可视化圈套》第 93 页

  在知乎上“若何对待这张《6 ~ 20 岁熟练使用方言人群比例》统计图?”这个问题下,不少回覆就是由于这张图合适本人的认知所以选择相信:

  “作为一个无锡人,无锡(包罗苏南吴语区)的方言普及率真的是很令人担心。”

  若何识破呢?Cairo 在书中写了 17 条经验,这里囿于篇幅限制,分享一条最全能的方式:

  不要相信赖何没有明白申明故事来历或没有给出援用链接的颁发物。——《数据可视化圈套》第 93-94 页

  Cairo 总结的第三种圈套是供给全面的数据,比拟前一种,这种哄人体例愈加奸刁。

  “视觉垃圾的销售者们都晓得,要想棍骗读者,一种无效手段就是利用断章取义的数据。”——《数据可视化圈套》第 124 页

  猫腻就在这位收集博主躲藏了一个环节消息——这是上海市户籍人员的统计数据,并不是生在上海的生齿数统计。上海作为一个移民城市,户籍生齿不断在增加,所以这里的数据中有良多是出生后移民来沪的。

  课代表在 2021 年 2 月 7 日也在这个小法式上查了一下,上海市户籍生齿中共有 252 人在 2020 年 1 月 1 日此日出生,比上面的 156 人多了不少,下次查可能又多了。

  “与其处心积虑地展现一小部门精挑细选的数据,不如把尽可能多的数据一股脑塞进图标里,挤爆读者的思维宽带。”——《数据可视化圈套》第 124 页

  2019 年的时候,一系列主题为“北京离婚率 48.3% ”的文章刷爆了伴侣圈,衬着中国的婚姻轨制将要消亡的空气,同时还配了看起来很全很官方的数据。

  良多做数据阐发的公家号就指出了这些文章背后的数据问题:昔时离婚对数÷昔时成婚对数获得的不是离婚率,而是离结比。至于离婚率的计较公式要看是要精离婚率(Fine Divorce Rate),仍是粗离婚率(Crude Divorce Rate),两者的计较方式也分歧。

  大师有没有感受到,比拟前面那些圈套,这种圈套荫蔽性更强,但它们都有一个配合特征,就是前面提到的那句——都是“合适我们根深蒂固的信念的图表”。

  生孩子的是不是越来越少了?离婚的是不是越来越多了?对,那就点赞、转发呀。

  所以,Cairo 感觉设想师在做图表时,需要“勤奋在‘过度简化现实’和‘展示过多细节以掩盖现实’之间寻求均衡”,部门的现实并不等于现实。

  什么是虚假关系(spurious relationship)?简单说就是把两件没有因果关系的事成立联系,太阳升起是由于公鸡打鸣就是一个典型的例子。

  有人还记得“巧克力吃得越多的国度,诺贝尔奖就拿得越多”这条旧事吗?这出自医学权势巨子期刊《新英格兰医学杂志》上的一篇研究(DOI: 10.1056/NEJMon1211064),论文中有如许一张图表:

  可别冷笑他的奇异逻辑,还有此外研究人员受他思绪开导,研究出了喝牛奶多的国度获诺贝尔奖几率高。

  “人的大脑本身就有一种‘对所见进行过度解读’的倾向,并且人的大脑老是识图印证与我们信念相符的内容,当图表碰到人脑的这种倾向性,其暗示误导性纪律的感化更会被放大。”——《数据可视化圈套》第 177 页

  有个很典范的搞笑网站“虚假相关”(),就汇集了良多这种瑰异的虚假因果关系图:鸡肉消费量竟和原油进口总量相关?日本车卖得越多,撞车他杀的美国人越多?掉进泳池淹死的人数竟然与凯奇演的片子有联系?

  影帝瑟瑟颤栗,暗示不敢再演片子了。对于这些图表中的逻辑圈套,Cairo 给通俗读者的识破方式就是多想想:

  “这幅图表展示出来的纪律和趋向之外,这些数据还有可能躲藏了哪些纪律和趋向?”——《数据可视化圈套》第 191 页

  我们糊口中,还会碰到良多查询拜访性或预测性的数据,如谁会在投票中胜出、台风挪动路线或者股票的走势。但这些预测有时候不克不及包管百分百的精确,它们常常会带有一个叫相信区间的工具。

  好比“查询拜访显示,北方人春节吃饺子的比例是 70% ,95% 的相信程度上边际误差是正负 10 个百分点。”的意义是:按照我们的查询拜访,我们有 95% 的把握,确定 60% 到 80% 的北方人春节吃饺子。(数据是课代表随手想的,请勿当真)

  设想的时候就需要将这种可能性表现出来,而不是简简单单呈现一个 70% 就竣事了,而读者必然要留神图里的相信环境。

  Cairo在书的最初提到:“我们糊口在一个数据和图表被神化的时代”,而如许揭穿图表圈套的科普是很有需要的。书里还有良多成心思的可视化案例解析,感乐趣的小伙伴接待找书来看。

方言英语录入:admin    责任编辑:admin 
  • 上一个方言英语:

  • 下一个方言英语: 没有了
  • 【字体: 】【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    方言大全网声明:登载内容出于传递信息之目的,绝不意味着赞同其观点或证实其描述,若侵权请来信告知,我们将及时处理! 站长: