大跃进“饿死三千万”的思考:(5)人口统计数据有误差就不能用了吗?

(一) 姚明的身高

先看一个故事

NBA火箭队中锋姚明身高到底多少?目前至少有223、226、227、229厘米4个版本,NBA在即将开打的本季网站上认定他的身高是229厘米,莫非23岁的姚明又长高了?


《休斯敦纪事报》报道227、229厘米的两个数字由来,原来是姚明上季在选秀时,NBA官方将姚明的身高登记为7英尺5.5英寸,换算为227厘米,此一高度是姚明在NBA体检时所量;火箭队在上季公布姚明身高时是7英尺6英寸,就是229厘米了,火箭队的说法是,当时姚明是穿鞋量的。

那么,223和226厘米的数字是怎么来的呢?原来226厘米是中国篮管中心在中国男篮队参加亚洲男篮赛时报名册上的数字,而223厘米据说是姚明在1998年时的身高,他所属的上海东方大鱼队在报名参加2001—2002年甲级篮球联赛时的身高,据说当时是因量身高的尺不够长。

(二)测量与误差

姚明的身高故事告诉我们,测量都是有误差的。误差并不可怕,关键是我们要对误差有足够的了解和评估。

维基百科:测量误差


测量误差(英语:Measurement error)也称观测误差(Observational error),是指观测值与真实值之间的差异。

在统计学中,测量误差并不是“错误”,是事物固有的不确定性因素在量测时的体现。每次我们用精密仪器重复量测某一数据时,我们会得到一些存在微小差异的数据。

在统计学上,通常测量误差被分为两部分:

系统误差:在相同的观测条件下,系统误差通常会表现出一定的规律性。有时也被称作统计偏差。系统误差可由严格标准的操作来控制。

随机误差:也称偶然误差,是由我们无法控制的因素造成的,如人眼的分辨能力,仪器的极限精度和气象因素等。偶然误差是不可避免的,但是大量的偶然误差呈现一定的统计规律。通过重复观测取平均数的方法可以较少偶然误差的影响。


在测量学上,也把由于观测者的不规范操作和操作失误造成的粗大误差当作测量误差。

在对误差的处理上,我们可以对系统误差进行校正,对随机误差进行统计分析。关于误差与偏差,准确度与精确度和更多的概念,就不多说了。

(三)有效数与数据处理

有效数字指科学计算中用以表示一个浮点数精度的那些数字。一般地,指一个用小数形式表示的浮点数中,从第一个非零的数字算起的所有数字。如1.24和0.00124的有效数字都有3位。

举一个例子,三人的身高分别是 175, 176, 179cm. 那么他们的平均身高是多少?


用计算器算:(1.75 + 1.76 + 1.79)/3 = 176.66666666667

但是我们报结果的时候,只能报177cm。 这里就涉及到有效数运算规则

如果我们的量尺没有厘米刻度,只有分米刻度。那我们的结果就是 1.8 x 10^2 cm. 所以测量的误差会影响结果的准确度。

(四)人口统计的误差

这里有两个问题:


(1)我们对人口非正常死亡的估算,对人口统计误差的容忍度有多大?换句话说,如果精确到千万数量级,百万数量级,十万数量级,可以容忍多大的误差?

(2)对人口统计的误差,有没有办法进行评估和校正?

第一个问题告诉我们,只要我们不要求精确到个位数,有误差的人口统计数据是非常有意义的。

第二个问题的答案,也是肯定的。因为在1953年,1964年,和1982年,中国进行了人口普查。这个数据,就是对人口统计进行误差分析和校正的标尺。

下一篇,我们讲人口学家如何用人口普查数据对人口统计数据进行误差分析和校正。


参考阅读:

人口普查_百度百科

http://baike.baidu.com/view/46884.htm - China - Translate this page

人口普查(英文:census),是指在国家统一规定的时间内,按照统一的方法、统一的项目、统一的调查表和统一的标准时点,对全国人口普遍地、逐户逐人地进行的 ...

登录后才可评论.