万维读者网 > 中国瞭望 > 正文  

直击七普数据的各种“对不上”:“蛮三篇”原文

www.creaders.net | 2021-05-15 17:25:05  数据归集处 | 0条评论 | 查看/发表评论

  万维读者网编者注:本文内容最初源头来自微信公号“数据归集处”,据多处转载和相关新闻称,作者“应该是当年天涯法律论坛的版主之一蛮族勇士”,即“老蛮”。

  编者查阅微信公众号“数据归集处”,但是目前只看到第二篇《人口数据再剖析》,第一篇《人口之惑》和第三篇《三论人口之惑》已经不见,据原文作者称已经被删除(在文中提到)。

  所以,本次转发的“蛮三篇”分别转载自以下出处:

  第一篇:《人口之惑》,转自凤凰网转载内容,声明来源自“数据归集处”(其文中截图看出、部分或者全部内容转自其他微信公众号)。

  第二篇:《人口数据再分析》,来自文章原始出处,即微信公众号“数据归集处”。

  第三篇:《三论人口之惑》,转自凤凰网转载内容,声明来源自“数据归集处”。

  另,转载中为便于读者理解,已将原文中的“中国”字样以“中国”代替。

——————————

“蛮三篇”之第一篇:《人口之惑》

  注意,本文既然命名为“人口之惑”,那就意味着整体数据中,存在逻辑上无法自洽之处。为了彻底说明问题,我必须从最基础的部分开始讲起。国家统计局官网今天发布了2020年第七次人口普查的1-8号公报数据,它们在官网的截图长成下面这样:

  根据这次的普查公报,我们得到了一些关键数据:2020年全国人口总量为141178万人(不含港澳台),较2019年的140005万人,大幅增加1173万。注意,2019年的数据为人口抽样调查的结果。除了10年一次的人口普查之外,这种人口抽样调查每年都会进行,逢5的年份为1%

抽样,其它年份为1‰抽样。由于近年来中国全面实现了个人信息的电子化,除了极个别的情况,公安部门打开电脑,可以查阅全国每个人的详细户籍登记信息、手机信息及社保信息等。这套个人电子信息系统有效协助了人口抽样调查的开展,相关调查可以将有限的精力集中在出生人口、死亡人口以及搬迁人口这种变数上,因此每年的数据可信度都很高。就今时今日来说,出生之后完全不办户籍登记的情况,几乎已经不存在了,即便是超生人口,也可以先办一个出生证,罚款可以以后再说,隐瞒人口的意义不大。理解了这样的背景,我们再来将本次人口普查数据中的总人口、15-64岁人口、65岁以上人口数据摘录出来,并入1990年至今的大表内。到这里,不和谐之处就体现出来了。

  中国历年的新增人口,1990年为1629万,此后逐年下降。从2000年开始新增人口下降到了1000万以下,为957万。2010年的新增人口继续下降到641万。注意,这些年份都有人口普查,新增人口数的下降趋势是非常明显的。2010年后,中国分步放开了二胎,所以新增人口数量有所反复,2016年达到了阶段性峰值809万,但是此后又开始迅速萎缩,2019年的人口增量只剩下467万。考虑到2016年后中国全面实现了户籍信息的电子化,这意味着2016年之后的抽样人口数据已经非常可信了,放开二胎之后的人口再次进入萎缩趋势,也是非常明显的。

  然而2020年的普查数据横空出世,当年度全国新增人口1173万!这真是石破天惊,让人目瞪口呆。1173万,较2019年的新增人口467万,足足增加了151.2%!就这种增幅,实在是犀利到令人不知道应该怎么评价了。

  对于这种突如其来的人口增量,我们当然有必要挖一挖根由。有意思的是,15-64周岁的适龄劳动人口,并没有增长,而是出现了下降,从2019年的98910万,下降到了2020年的96776万,年度降幅2.16%,这导致2020年扣除在校学生之后的适龄劳动力占比下降到了63.1%,倒退到了上世纪80年代的水平。这种降幅是符合我们的一贯理解的,毕竟每一年的新增人口都在下降,人口老龄化,一定会导致劳动力的总量下降。所以扣除在校学生的适龄劳动人口在2014年达到峰值的93566万之后就一路下降,2020年持续下降到89019万,相当于2007年的劳动力水平,这是非常正常的数据。

  然而恶搞之处在于,65岁以上老年人口的数据突然出现了暴增:2020年的数据为19064万,较2019年的17603万,增加了1461万。而此前老年人口的年度增幅也就是900万这个区间,2020年即便是多一点,1000万出头也就是了,达到1461万这个数量级,让我实在是无法理解。2020年新增的年满65周岁的老人,也就是1955年出生的老人。1955年中国的人口出生率突然暴涨了一轮吗?当年度较1954年多出生了几百万人口?基于这个疑问,我查阅了一下国家统计局官网数据库里的1950年代的人口出生率,顺手截了个图(见下图)。结论非常清晰:1955年的人口出生率32.60‰,远低于1954年的37.97‰;人口自然增长率20.32‰,也远低于1954年的24.79‰。1955年的出生率和人口自然增长率都较1954年有了大幅下降。所以,2020年突然增加的1641万65岁以上老年人口,我个人真不知道是怎么来的。

  这里必须说一下,1955年中国总人口61465万,当年度出生人口2004万。我把这个数据加粗,放大,希望大家记住这个数据,我们待会儿还会用到。

  接下来我们继续深入分析人口增量的由来。毫无疑问,人口增量=当年度新出生人口-死亡人口。2020年的人口出生率和死亡率,在目前的普查公报里没有发布,或许未来会在普查详细数据库里发布,总之现在还看不到。不过没关系,我们精通数学,并且有此前历年的数据,我们可以自己算出来。

  本次普查公报发布了2020年的人口年龄构成表,见下图:

  关键数据在于0-14岁的总人口数,25338万。恰好,我搜集了此前每一年的人口出生数,从2006-2019年的出生人口合计为22738万,我们假设其中任何一个儿童都不会夭折,全都是健康宝宝,天使宝宝,扣减一下,我们就得出了2020年的出生人口为:25338万-22738万=2600万。一个非常吉利的数据。

  好吧,现在2020年的年度新增人口有了,1173万;出生数据也有了,2600万,那么,2020年的死亡人口数据也可以反算出来了:2600-1173=1427万。

  接下来我们把这组数据同样放进1990年至今的人口出生率和死亡率数据表,供各位感受一下:

  2020年的人口出生率突然就达到了18.41‰,恢复到了1990年代早期的水平。这个数据我就不多解释了,总之就是非常厉害。关键是死亡数据,2020年死亡了1427万人,远远超出此前接近1千万的水平。死亡率8.30‰,也是远远超出近十年千分之五以下的平均水平。这是怎么回事?

  更关键的问题还在于,这个死亡数据,与老年人口数据之间,出现了非常严重的逻辑上的不自洽。2020年65岁以上老年人口新增了1641万,当年度中国死亡人口1427万。今时今日中国死亡人口基本上都是老年人,年轻人的死亡率还是非常低的,这一点我们还是要相信,毕竟这是常识。所以,这意味着,2020年一定要有超过3千万的老年人口补充进入65岁以上老年人口这个群体,才能实现老龄人口的数据增长,才能实现数据逻辑的自洽!

  然而,最令人无法理解的事情发生了:1955年中国出生人口为2004万,即便这些人在随后的穷 折腾里平安喜乐的活了下来,一个都没有中途夭折,然后改革开放之后他们也完完整整的熬过了90年代初期的通胀潮、90年代后期的下岗潮,然后一个不剩的干到了退休,并活到了现在,也远远凑不够3千万的数!

  所以,就2020年的人口数据而言,我实在不知道应该怎么分析。数据与数据之间,是存在逻辑上的强关联的。尝试对任何一个数据进行优化,都会对整个数据逻辑链条带来巨大冲击。就2020年的人口普查数据而言,我个人缺乏平复这种冲击的能力。希望我大中国能除了我之外,还能再诞生一位数据大咖,可以分析整个人口数据链条,将我上面的这些疑惑之处,全都完美的解决。如果有的话,希望各位能在本公号后台给我留言,让我看到。谢谢!

——————————

“蛮三篇”之第二篇:《人口数据再剖析》

  昨天我讲了一下国家统计局新鲜发布的人口普查数据之中存在的逻辑冲突,希望能有人为我解惑,但是很可惜,至今为止没有看到合理的解释。这篇文章大家现在也看不到了,这是意料之中的事。今天我们继续来分析一下。没看过昨天的文章也没关系,今天这是全新的一章。

  首先,我们必须对现在的人口普查技术,有清晰的认识。这次人口普查,事实上就是在公安部门的电子户籍信息的基础之上,进行的普查,也就是我们号称的电子普查。截个相关新闻的图给大家看看。

  事实上,我大中国的户籍信息电子化已经实现超过6年了。近年来相关相关信息系统不断的完善,身份证重号的现象也都逐步予以了解决。可以说,现在不在户籍信息系统里的人,已经非常罕见了,误差率不会超过千分之一。即便在偏远山区的小村落,伴随着中国基层党组织工作的强化,以及扶贫工作的全面开展,入户也成为了最基本的要求,生了娃不落户的现象,已经几乎不存在了。这么说吧,今时今日除非你自己一家人呆在深山老林里做野人,不属于任何社会组织,也不跟外界发生任何商品交易,不然但凡你生了娃敢不去落户口,村支书会让你精准的认识到马王爷为啥生了三只眼。所以,第七次人口普查的技术难度其实是很低的,在很多地区,都是通过短信等电子方式完成的普查,其实只是对户籍电子信息进行了一次再确认而已。

  理解了这一点,我们才能更加深刻的理解,事实上, 现在人口普查工作的意义已经不大了。现在不比十年前二十年前了,现在每个人的信息都在系统里了。如果国家统计局出来放话说,现在还有数以千万计的人口不在系统内,要靠统计调查队的人挨家挨户钻山沟走树林把这些人找出来,公安部门能跳起脚来骂人。实在需要进行入户调查的,主要也就是搬迁人口,比如老蛮我这种,前年在深圳工作,去年调广州,今年又调广西,说不定明年又调去哪里了。这种情况需要两地统计部门予以协调,不要搞出重复统计,但是遗漏的可能性是不存在的。如此而已。

  在昨天的新闻发布会上,国家统计局给出了几个很有趣的数据:从2018年以来人口出生数持续走低,2020年出生人口的大数是1200万。相关新闻的附图如下:

  我这里先说明一下,2020年的出生数据只在新闻发布会上提了一嘴,在人口普查公报里并没有发布。我们在这里就相信这个口头数据好了。现在我们可以开始做计算题。2020年普查结果,总人口规模为141178万,扣减2019年的总人口140005万,增量为1173万。

  各位,你们必须清晰的认识到,人口增量不是凭空而来的,它是当年度的出生人口-死亡人口而来的。2020年中国出生人口的大数是1200万,人口增量1173万,所以2020年中国的死亡人口数=1200-1173=27万。这是什么意思????

  为了进一步说明这个问题,我把1990年至今的人口出生和死亡数都放出来,并把2020年的数据放进去,形成了下表的数据。

  对于2020年只死亡了27万人的事情,我实在不知道应该怎么分析。这大概是由于去年的新冠期间大家特别注意养生吧,呵呵。

  此外,国家统计局在昨天下午对于数据上的逻辑不自洽给出了一些解释,比如此前年份的数据是抽样调查数据,有些人口遗漏的情况。事实上户籍信息电子化之后,抽样调查已经足够精准了,不过这个事我们就不多纠结了。那么,到底是哪些年的数据失真呢?

  人口增量从来都不是凭空而来的,它一定是出生人口-死亡人口而来的。一个非常重要的信息是:国家统计局在新闻发布会明确说明了2016-2020年的人口出生数,也就是说,国家统计局并不会再上修这些年的出生数据。那么,如果少算了此前年份的人口增量的话,唯一的可能性,就是多计了近年来的死亡人口。

  真是天可怜见,中国的人口死亡数据,那是真没有多计的可能性。这个数据是卫生部门和公安部门的汇总数据,是以“死亡证明”为基础的。它有可能会漏计部分偏远地区的死亡,但是绝不会多计,更不可能出现千万计的多计。你说卫生部门没事多开上千万张死亡证明是图什么啊?存在这种可能性吗?

  所以,我个人实在是不能理解,这凭空冒出来的千万级的人口增量,到底是哪里来的?它总归一定是人口出生数-死亡数的结果。人口出生数不会再上修了,死亡数里存在泡沫的可能性更是微乎其微,那这到底是怎么回事呢?我特别希望,我大中国除了我之外,还能有另外的数据大咖,把这个数据逻辑解释清楚,解决我这个微不足道的小疑惑。谢谢了。

——————————

“蛮三篇”之第三篇:《三论人口之惑》

  关于人口普查数据问题,这是我的第三篇文章了,也是最后一篇。本篇之后,这个事我就搁下了。接下来我将会继续关注如火如荼的通胀潮。这么说吧,通胀潮可比人口数据吓人多了。

  就在昨天晚上,国家统计局对我的连续两篇文章做出了隔空回应,并发在了官网上,地址是:http://www.stats.gov.cn/tjsj/zxfb/202105/t20210512_1817360.html 。我截了个回应标题放在下面,有兴趣的朋友可以去看看。话说你国家统计局既然都正式回应了,那么我第一篇被夹掉了的文章能不能也顺便给我恢复了呢?大家都是研究探讨嘛,道理越辩越明嘛,你把我嘴巴堵上了再作出跟我探讨的姿态,这个姿态也不是很大方嘛,对不对?

  接下来我们进入正式讨论环节。国家统计局这个回应的意思我总结一下,是这样的:除了十年一次的大普查之外,其它年份的抽样调查都是不准确的,会遗漏人口,累计下来遗漏了整整一千万的人口。幸亏这次普查使用了电子信息技术(也就是与户籍信息系统联了个网),不再纯粹使用手写版这种低级手段,所以国家统计局把隐藏在深山老林里的黑户都挖了出来。

  对这个回应,我的第一反应是:真厉害,给国家统计局点赞!本次人口普查的一个核心技术要点是什么呢,是每个人都要统计身份证号,由此与户籍信息系统实现了相互关联。对这一点,国家统计局在事前事后都反复予以了强调(官网地址:http://www.stats.gov.cn/tjsj/sjjd/202105/t20210512_1817336.html),这里也给一个截图,注意我用红色框标起来的部分。

  在这里,我的第一个问题是:那些被隐藏起来了的千万人口,他们到底有没有身份证号?如果这上千万的人口居然长期没有身份证号,那么他们这么多年来是怎么生活的?他们是怎么处理社保医疗银行和交通出行问题的?他们到底生活在哪里?公安部门和民政部门这么多年都在干什么?为什么有上千万的黑户,这两个部门居然始终不闻不问?

  由于存在这些根本无法解答的疑问,所以我又干了一件很有趣的事:找出这些隐藏起来的千万人口,到底分布在哪里。虽然国家统计局非常严肃的要求,不能拿2020年的普查数据与2019年的抽样调查数据做对比,不过,为了找出那隐藏起来的一千万人口到底在哪里,我依然进行了一番了对比。我将本次人口普查公报上的分省数据,与2019年各省发布的人口数据,进行了对比。毫无疑问,年度增量最大的省份,就是在历年的抽样调查中隐藏了人口的省份。数据表在下面。请各位在阅读下表的时候先猜一下,这上千万黑户,是不是隐藏在了中西部的深山老林里。

  (解释一下,2020年的分省人口之和140978万,较第七次人口普查结果141178万,少了两百万人。这两百万是军人,不纳入分省人口统计。2019年分省人口之和140385万,较当年度国家统计局发布的140005万,又多了380万。考虑到分省数据未计入军人的问题,其实是多了500多万。所以,2019年国家统计局事实上基于重复计算的问题,下调了各省的汇总数据。在人口问题上,重复计算才是最令人头疼的事。隐瞒人口?不存在的。)

  呵呵,各位被上表吓了一跳吧。数据比较的结果令人难以置信:按照2020年第七次人口普查的结果来看,广东隐藏了1080万人口,浙江隐藏了607万人口,江苏隐藏了405万人口,合计超过两千万。而中西部地区的人口增长量并不大,乃至还有15个省份是负增长。正负相抵之后,还隐藏了足足一千万人口。我十分好奇的是,粤浙苏三省,到底能够怎么隐藏这两千万人口?这三个富裕省份,那真是走出家门就必须要用身份证,没有身份证寸步难行,这两千万人是怎么做到没有身份证长期生存的?凭什么啊?有没有这么强的生存能力啊?

  接下来我们再来看一下,这隐藏起来的千万级的人口,是哪个年龄段的人口。为了更清晰的说明问题,我将1990年至今的所有人口分年龄数据都放了出来。我再强调一次:虽然国家统计局反复说普查数据不能与其它年份进行同比比较,不过没关系嘛,我们通过这个比较,可以挖掘出到底哪个年龄段的人口里面有那上千万的隐藏起来的黑户嘛,呵呵呵。

  好吧,结论依然很清晰,2020年儿童增加了1846万,老人增加了1461万,劳动力减少了2134万,此消彼长的结果,总人口增加1173万。所以说,隐藏起来的人口,主要是儿童和老人。

  综合两张表的数据来看,所以国家统计局的意思就是:粤浙苏三省,隐藏了数以千万计的老人和儿童。通过第七次人口普查, 这些隐藏人口终于被挖了出来。对这个结论,你信不信?

  儿童我也就不多说了,这三省居然还有上千万儿童出生之后不办出生证的,也是出乎我的意料。关键在于,这三省的老人是怎么隐藏下来的?他们这一辈子的黑户,是怎么生存的?要知道这是广东浙江和江苏啊,商品经济高度发达,社保基本上实现了全覆盖,基层农村政治组织也极其完善。在这三个省混成了老年黑户,这到底是怎么操作的啊?这明显操作不能啊!如果非黑户,就只会重复统计,不会遗漏。

  不好意思,我个人实在是缺乏足够的想象力,不能理解这个问题。我现在越来越迫切的希望,我大中国除了我之外,居然真的还能冒出来一位新的数据大咖,他精研数据,逻辑清晰,能够修整出一份挑不出逻辑缺陷的人口数据。让我一看之下,就大为叹服,并竖起大拇指,给这整份数据表点赞!

  毕竟,数据与数据之间,永远都是存在强逻辑关联的。逻辑,还是逻辑!最重要的,永远都是逻辑!谢谢各位。关于人口问题,我的论述就到这里。我们下一篇文章,还是重新聚焦通胀问题吧。

( 推荐:万维相关阅读 凤凰网:“蛮三篇”横空出世,统计局坐不住了 )

   0


热门专题
1
苗华被抓
6
美国大选
11
台湾大选
2
川普
7
以哈战争
12
李克强
3
俄乌战争
8
巴黎奥运
13
中国爆雷
4
中美冷战
9
三中全会
14
李尚福出事
5
万维专栏
10
中共两会
15
秦刚失踪
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2024. Creaders.NET. All Rights Reserved.