您当前所在位置: 首页 > 部门信息公开目录 > 统计局 > 工作动态 > 统计数据

李斯宇:如何读懂统计数字

访问量:
如何读懂统计数字

    随着大数据时代的降临,人们生活方方面面都离不开统计数字。大到国家经济发展,小到群众生活所需,统计数字都在起着十分重要的作用。从人一出生就伴随终生的18位数字的身份证号码,到高考填报志愿时搜集的各类高校历年录取分数等统计信息,从超市购物时各类商品的价格比较,到汽车加油时对油价变动的敏感,我们的生活与统计数字已经紧密相关。每天我们都要接触太多太多统计数字,常常会产生疑问甚至质疑,统计数字会撒谎吗?

    面对这个问题,我总是会想起一本出版已68年的老书——《统计数字会撒谎》。这是美国统计专家达莱尔·哈夫的经典作品,成于1954年。虽然经历了大半个世纪,但书中所涉内容在当今社会依然屡见不鲜,书中大胆地揭露了至今仍然被企业销售、自媒体撰稿人、记者甚至专家频频使用的大量的统计操纵技巧,这些技巧往往会给人们带来误导甚至产生错误判断。

    笔者从事统计工作八年多,做过统计执法、设计管理、综合统计、服务业统计等专业工作,也做过两年半的脱贫攻坚驻村第一书记(涉及贫困户调查统计),虽然时间不算很长,但也有一些心得。在此,分享几个对统计数字的判断方法,希望能够对识别统计数字是否在撒谎有所帮助。

    一是调查样本的偏差误导判断。除了全国人口普查、经济普查、农业普查等国家普查行为,这些是对国内所有符合条件的调查对象进行全面调查统计外,我们生活中接触的大部分统计数字都是通过抽样调查得出。比如CPI(居民消费物价指数),就是典型的抽样调查,我们常常用这个指数来判断一定时期内城乡居民所购买的生活消费品和服务项目价格变动趋势和程度。CPI中有个猪肉价格,是对样本调查得出,包括一些农贸市场、肉贩,但不是对每个卖肉的商贩都去询问肉价,这种抽样调查是综合考量成本与效率所采取的统计方法。统计陷阱也很多,网络上的这类博眼球信息非常多,比如“大学生毕业平均月薪8870元,调查的对象却只针对985、211院校,调查的毕业生也只是能够联系上且同意公布薪资的部分,因为薪资低不好意思公布或联系不上等情况的毕业生却没有纳入统计,样本的数量与广度都没有代表性,这种统计数字就是撒谎的。

    二是统计图表的设计误导判断。统计数字是比较枯燥的,尤其是数字一多,读者就很容易失去耐心,因为不直观。因此,统计图表就更加容易抓住人的眼球。但是,阅读统计图表的时候,一点要提高警惕,因为一不小心,你就上当了。比如下面两张图,都是2020-2021年景德镇市地区生产总值的总量及增速图,但是仅仅因为Y轴刻度的变化,给人的视觉冲击是完全不同的。左图的两年总量看上去增长不多,而右图的两年总量看上去翻了一倍多;左图的增速变化看上去也比较平缓,而右图的增速看上去却提高很大。这种类似的图表设计误导,在平时的生活中也比较普遍,比如商家的广告上表示产品销量连年攀升,又比如自媒体上各种新闻分析问题的图表等,一定要擦亮眼睛,关注数字本身变化,而不受图表的设计误导。

图片


    三是对统计算法的不了解误导判断。统计数字具有专业性,各个指标解释及计算方法都有所不同。比如最常说的地区生产总值,即GDP,还是看上图,图表显示2021年景德镇市地区生产总值比2020年增长8.7%。有的人会用2021年的地区生产总值总量除以2020年的总量,即1102.31÷957.14≈1.152,得出2021年比2020年增长15.2%的结果,说公布的8.7%的增速是错误的,真是如此吗?统计局公布的GDP数据,是以现价统计的绝对值,增速是扣除价格因素之后,也就是按可比价格计算的结果。如果是可比价,直接计算即可;如果是现价,需要扣除物价上涨影响,也就是考虑通胀因素。

    同样的,但凡是涉及到增加值的经济指标,均存在这种问题。还有如CPI等指数型指标,也不能用直接除的方法计算增速。

    统计是一门科学,统计方法制度需要与时俱进,统计相关知识的宣传更需要统计部门下大功夫,只有大家都了解统计、学会统计,才能减少这类因统计知识理解错误产生误解的情形发生。
   (作者:李斯宇 景德镇市统计局