统计数据再次“打架”专家建议出具说明书

日期:2010-07-22 作者:吴鹏 出处:腾讯科技我来说两句()

■ 关注焦点

统计数据又“打架”了。国家计生委日前公布《省级人口个案库数据质量评测结果》,20个省2000~2009年出生人口总数与人口计生统计报表数据相比高出12%。近一两年,因统计数据的差异引来各方关注的案例不在少数,“房价上涨率之争”、“地方GDP之和大于全国”、“失业率到底是多少”……一连串的疑问让统计数据的公信力遭受考验。最近有报道称,连北大、清华录取的状元人数之争,也爆出与统计方式和口径有关。

对于愈加热闹的“数据打架”,统计专家表示,发布统计数据应更加公开透明,包括数据来源、统计方法、适用范围等全面公开,发布数据时应提供详细的“说明书”,避免公众对数据的误读,提高统计数据的公信力。

■ 专家建言

统计数据需更公开透明

如何避免公众对数据产生误读,提高数据的公信力?北京大学社会学系教授郭志刚认为,统计数据应该更加公开透明,“统计数字怎么来的,原始数字有哪些,只有都公布了,大家才会知道你是不是有道理”。

全国人大代表、湖北省统计局副局长叶青也认为,能公开的数据尽量都要公开。

两个不同的部门,数字一个天上,一个地下,但我相信各有各的道理,郭志刚说:“但道理是什么,需要说清楚,要不怎么让人相信你呢?”

不仅要公布基础数据,郭志刚认为,要通过实事求是的工作来避免统计上的问题,并且不能总公布一个简单的结果,真正要说服人,就需要一个说明。“国外原始文件有一尺厚,不怕别人问。但我们做得比较粗。”

据了解,从国际经验看,统计数据的发布并不仅仅是一连串数据的公布,更应当包括数据的来源、方法、意义和适用范围等的公开。发达国家统计机构在发布数据的同时,往往提供详尽的数据来源、生产过程、适用范围。

如果把统计数据看作是产品的话,理应有着详细的“说明书”。缺少“说明书”,数据的使用必然会遇到种种问题,对数据的误读难以避免,甚至会影响数据的公信力。

■ 案例分析

1 数据“内讧” 出生人口比报表多10%

【案例】

国家人口和计生委前日消息称,2009年9月在全国范围内部署开展了人口和计划生育基础信息核查工作,各地通过信息核查均发现了一些报表未反映的出生人口。其中,有6个省核查出生比报表出生多10%以上。

【解读】

与以往的“数据打架”不同,计生委两组数字的差异,更像是一场“内讧”。

昨日,北京大学社会学系教授郭志刚接受本报采访时解释说,“这次是计生委自己的两种统计来源对不上”。

国家计生委在通报中称,本次核查重点是2000年以来中国出生人口及其父母的相关信息。这是人口计生系统“首次收集个案信息,并对其中的流动人口开展双向协查”,并开展人口基础信息核查。

“计生委报表出生数历来比较低,高了一些也不新鲜”,业内一直认为,人口计生统计报表数据有漏报的现象,郭志刚说,所以这次他看到“12%”的漏报率,与之前一直流传的“30%”的漏报相差比较大,所以并没有“吓一跳”。

专家也认为,就出生数而言,人口计生报表数字一直偏低的原因,主要是超生处罚的政策。比如担心处罚故意不报,甚至举家迁离;还有一些地方或基层计生单位为保政绩,也会故意瞒报超生人口。

2 方法不同 全年房价上涨率差24%

【案例】

今年年初,“房价上涨率”之争引人关注。国家统计局在2009年统计报告中称,2009年70个大中城市房屋销售价格上涨1.5%。但是,国土部事业单位——中国土地勘测规划院全国城市地价监测组所提供的数据显示,2009年全国住宅平均价格为4474元/平方米,涨幅为25.1%。

【解读】

对于“房价上涨率”之争,全国人大代表、湖北省统计局副局长叶青分析说,由于统计方式的不同,会带来一些统计结果的差异。

中国土地勘测规划院地价所所长赵松此前在接受本报采访时也表示,两个数字的模型和统计方法或许存在差异,导致了统计结果的不同。赵松解释说,国土部不统计房价,报告中也已经标注,房价数据来自《中国统计年鉴》。

此外,得出两组统计数字的方法或许有所不同。中国统计年鉴的数字是对全国城市房地产价格进行统计,而统计局的数字则来自70个大中城市房屋销售价格。

媒体报道称,国家统计局中国经济景气监测中心副主任潘建成在回应“房价上涨1.5%”时称,“1.5%”是全年的平均涨幅,2009年房地产价格呈现前低后高的走势,综合全年涨幅并不是很高。

不仅是政府与研究机构存在统计方法的差异,政府之间也会存在因统计方法不同等因素,导致的数据差别。郭志刚举例说,中国人口统计主要有三大数据来源,分别由国家统计局、公安部、人口计生委负责。除人口计生委在报表数字可能出现的漏报外,郭志刚认为,其他部门在数字上出现差异也不是新鲜事。

比如公安部统计户籍总人口是多少,但是也可能存在死亡不销户口、生了孩子不报户口的问题。而统计局主要根据人口变动抽样调查,只是抽取了一部分人,进行统计推断,这里就有抽样差异,也不可能100%准确。

3 害怕遗漏 地方GDP之和大于全国

【案例】

2009年,全国GDP增幅为8.7%,今年7月2日,国家统计局将2009年全国GDP增幅修正为9.1%。根据公开报道,各省区市GDP总量加起来,增速比8.7%要高得多。各地公布的数据,经济增速低于8.7%的仅有3个省份。其余28个省份增速都高于8.7%,其中有两个省超过16%。

【解读】

全国国内生产总值(GDP)数据与各省份公布的总和为何对不上?叶青昨日分析说,目前,中国实行GDP核算分别独立进行的政策,也就是说,省、市、区自己核算自己的GDP,这样多少会有误差,不会出现1+1=2的情况。

另一方面,确实存在重复计算的问题,比如生产基地,分公司不在一个地方,这样就会造成重复计算,“作为地方,谁都不愿意自己的GDP被少算”。

此外,叶青认为,确实不排除人为因素,当然这种因素越来越少。“不好说是造假”,叶青说,对于统计数字比真实大一点的情况,统计系统外的人士认为是造假,但是作为系统内人士,我们进行“应统尽统”,“作为统计系统的干部,不能遗漏,在这种工作心态下,可能会出现数字大一些的情况。”

如果报多了会被压下来,但是报少了,就没有表现出当地的情况。叶青坦言:“这主要是一种心态,但谁也不敢故意造假,因为造假的处罚非常大。”

叶青认为,改变这一现状,是要在方法制度上进行改革,现在由各级自己核算GDP,过渡到由上一级算出来,本级只负责对外公布,这样会减少差别。

4 口径差异 城填失业率数据相差5%

【案例】

2009年1月20日,人力资源和社会保障部公布2008年四季度末城镇登记失业率为4.2%,而据中国社会科学院当时公布的一项调查显示,城镇经济活动人口的失业率大概是9.4%。

【解读】

失业率为什么会造成这种偏差呢?对此,有专家分析认为,这与政府和学术机构因为统计口径不一样有关。

对此,人力资源和社会保障部新闻发言人尹成基当时在发布会上也解释说,两者相差悬殊,涉及两个概念,即“调查失业率”和“登记失业率”。

“登记失业率”主要是指在报告期末城镇登记失业人数占期末城镇从业人员总数与期末实有城镇登记失业人数之和的比重。分子是登记的失业人数,分母是从业的人数与登记失业人数之和。而“城镇调查失业率”是反映城镇常住经济活动人口中,符合失业条件的人数占全部城镇常住经济活动人口的比率。

我国从上世纪80年代开始建立登记失业制度,但是,这个指标有其不足之处,“它在一定时间内,反映总体失业状况的敏感程度不是很强。此外,有一部分失业人员没有进行登记,这就可能不是很全面地反映状况。”

尹成基表示,由于两个失业率在统计方法、指标定义和统计范围上都不相同,一般不好直接进行对比。

更多相关资讯
IT新闻头条推荐
新闻焦点 | 新闻专题
一周热点新闻排行
人物周刊
科技新知
备案编号:4406043011566 经营许可证编号:粤B2-20050807 网站备案号:粤ICP备09124497号
Copyright © IT.com.cn All rights reserved. IT世界网 版权所有