1引言
中国的人口学家也许是世界上最纠结的,因为我们有如此之多的大规模人口调查,但是我们总是不能准确弄清调查所揭示的实际情况。中国持续20多年的低生育率引发的生育水平到底有多低的争论,一直没有停止过。1990年代初生育率降到更替水平或以下时,就有是否大大低于更替水平的讨论。2000年和2010年人口普查得到极低生育率后,更是产生了广泛的争论。特别是与生育政策调整相联系,学术的和非学术的研究和议论轰轰烈烈。有极端地认为目前的生育率就是如普査得到的那么低,也有另一极端的估计接近1.8;有认为在1.5~1.6之间的,也有估计在1.6~1.7之间的。当然也有认为在1.5以下或者略高于普査的结果。
从国家统计局的人口抽样调查和人口普查以及国家人口计生委的生育率调查直接获得的结果看,1990年代后期以来,中国的生育率达到了很低的水平。众多调查反映的生育水平是持续的、一致的很低,显然中国的生育水平已是长期的大大低于更替水平。现有的研究之所以繁乱而难以达成一致意见,除了使用的数据和方法不同外,可能主要还是研究者们的思维定势。因为在长期的争论中,学者们的认识格局并没有改变,五普时是怎样的观点,到六普时还是怎样的观点。而且都分别由各自的进一步的证据所支持和强化。仿佛觉得要弄清目前中国的生育水平,学者们达成一致的意见,是不可能的。
中国的生育政策调整已经迈出了重要的一步,2014年在全国范围实施了“单独二孩”政策。生育政策调整将会很快迈出更重大的一步,就是实行“全面二孩”政策。无论我们对生育水平有多低的争论是否有定论,都与生育政策的进一步调整没有多大关系。只要生育率明显低于更替水平,但又不是过低,生育政策就应该及时进行调整。一些研究或议论认为,中国生育率已长期过低,已经错过了生育政策调整的最佳时机。本文研究则认为,目前中国的生育率没有过低,依然是生育政策调整的合适时机,我们将利用国家统计局历次的人口普查和人口变动抽样调查数据,进一步估计中国近期的生育水平。需要强调的是,本研究提供的估计只能是目前生育率的大致水平,而不是确切的生育水平。
2文献回顾
对中国近期生育率的研究已有很多文献。和以前一样,学者们使用的数据、方法不尽相同,得到的结果也存在很大差别。概括起来,有三类不同的研究。一类是直接利用普査数据进行的估计,或多或少隐含着普查数据可信、准确的假设。这类研究得到的结果是最低的,总和生育率不超过1.5(郭志刚,2011;郝娟、邱长溶,2011;朱勤,2012)。第二类研究在利用普查数据估计生育水平时,对普查数据质量提出质疑,并进行调整估计。这类研究中,不同学者的调整和估计存在较大差别,估计的生育水平在1.42~1_75(崔红艳、许嵗、李睿,2013;王金营、戈艳霞,2013;李汉东、李流,2012)。第三类研究中,针对人口普査和抽样调査数据存在的问题,利用教育数据、公安数据等其他系统收集统计的数据,校对、调整普査数据,进而估计生育水平(杨凡、赵梦晗,2013;陈卫,2014a)。估计的生育水平处于1?6~1.7。
在低生育率条件下,中国人口学者对生育水平的估计,充分展示了各种人口分析技术的应用。去进度效应总和生育率和内在总和生育率旨在克服总和生育率受生育推迟、间隔延长等的进度效应的影响,试图反映更真实的生育水平(郭志刚,2000a、2000b、2002、2004a和2004b;高爽、陈卫,2013;陈卫、髙爽,2013)。母子匹配或生育史重构法,一般是将人口普查中母亲的信息(曾生育孩子数量、生育年龄)与子女信息(年龄、孩次)进行匹配,以期获得更为准确的出生人口数、不同孩次人口数以及育龄妇女生育年龄(郭志刚,2004a和2004b)。利用得到的数据既可以计算总和生育率,又可以计算分孩次总和生育率以及平均生育年龄。人口模拟预测法(“打靶”)在估计以往生育水平时所用的人口模拟预测不同于一般的人口预测,它不是对未来人口的估计,而是利用人口预测的方法,在已知较远的过去的人口数和较近的过去的人口数的前提下,测算总和生育率、死亡水平等参数(郭志刚,2011;朱勤,2012;李汉东、李流,2012)。这一过程就像是“打祀”。例如,五普和六普之间十年要有怎样的生育水平,才能使人口总数由五普的数字增长到六普的数字。还有学者使用回归分析、存活率倒推、队列分析等相结合的方法(杨凡、赵梦晗,2013;陈卫,2014a)。这种方法遵循总和生育率的一般计算过程,在求得出生人数、育龄妇女数和生育模式的前提下,方可得到总和生育率,主要运用在使用多种来源数据进行生育水平估计,以调整当前数据中的漏报,估计了难以得到的数据。最后,生育率的间接估计方法,即Bmss的P/F比值方法,也被运用到中国生育率的估计中(陈卫,2014b)。该方法利用曾生子女数中所反映的生育水平,来调整时期生育率。就是妇女各年龄的平均曾生子女数和与此相匹配的各年龄的累计生育率进行逐一计算比值,然后计算各年轻年龄组妇女的比值的平均数,最后以该平均数乘以时期生育率,得到调整的总和生育率。本文在现有研究存在很大差异的背景下,利用人口普査和抽样调査数据,运用队列对比分析、生命表存活率推算以及生育率与出生率的数学关系,对中国2005年以来的生育水平再次进行估计。
3数据与方法
以往对中国生育水平的研究往往使用两类数据。一类是普査数据,即利用普查数据本身,无论是普査的低年龄组人口数据,还是利用后一次普查高年龄组人口数据对前一次普査的低年龄组数据进行的调整,对两次普査间的生育水平进行估计。另一类是其他来源的数据,主要是教育数据和公安数据。一些学者认为,由于国家统计局的人口普査和抽样调查数据,以及国家人口计生委的生育率调查数据或生育统计数据,都是“系统内”的数据,存在一致性的误差,用这些数据之间的比较、调整,不能克服“系统内”数据误差的缺陷。那么,很自然,一些研究利用别的系统的数据,例如教育数据或公安数据,通过不同系统的数据之间的对比,来调整“系统内”的结果。尽管在理论上可以拿教育数据或公安数据,来对比、调整人口系统的数据,但是由于别的系统的数据也存在缺陷,这样的比较、调整又是不够科学的。本文的研究将只使用“系统内”的数据,即使用人口普查和人口变动抽样调査数据,对中国2005年以来的生育水平进行再次估计。
本研究使用1990年人口普査数据、2010年人口普査数据和2006-2013年人口变动调查数据。本文的思路是利用2010年普查数据估计1990年普査低年龄人口的漏报率,然后假设2010年普査低年龄人口的漏报率与1990年普查低年龄人口的漏报率相同,以此估计、调整出2010年普査低年龄人口数量。将调整的2010年普查低年龄人口数量,利用生命表存活率回推至各年的出生人口数,从而估计各年的生育水平。
估计生育水平需要估算出生人口和育龄妇女人口。出生人口估计出来后,使用人口普査或人口变动调查中得到的出生人口的年龄分布进行分解,得到育龄妇女分年龄的生育人数。然后利用2010年普查15?54岁女性人口,通过生命表存活率,推算出2005-2010年各年的分年龄育龄妇女人数。这样,通过分年龄的出生人数和分年龄育龄妇女人数,可以得到分年龄生育率和总和生育率。
本研究通过队列对比分析、Brasslogit转换和生命表存活率的推算,估计出生人口和育龄妇女人口。队列分析用来对比2010年普査和1990年普査的同队列人口,以估计1990年普查低年龄人口中的漏报率。Brasslogit转换是为了获得各年的生命表,以便使用生命表存活率推算估计生育率所需要的各种人口,包括各年的育龄妇女、普査低年龄人口及相对应的各年的出生人口。
4结果与分析
由于2010年普查0~5岁人口无法使用队列对比分析或别的来源的数据进行准确性检验(需要下一次普查或未来的教育数据或公安数据),因此只能使用别的方法进行评估。国家统计局公布的2010年普查的人口漏登率为0.12%,大大低于2000年普査的漏登率1.81%,而高于1990年普查的漏登率0.06%。虽然一些研究认为没有充分理由相信2010年普查开展时的社会环境和普查的登记办法,能够使得2010年普査质量比2000年普査更好(杨凡、赵梦晗,2013),但是我们有理由假设2010年普査数据质量要低于1990年普查数据质量。如果我们基于2010年普査数据质量与1990年普查数据质量相同的假设,来估计2010年普查低年龄人口,进而估计相应年份的生育水平,那么这种估计反映的就是生育水平的下限。也就是说,实际的生育水平只能高于这样的估计值。
表1利用2010年普査20~25岁和1990年普査0~5岁的同队列人口对比分析,并基于2010年普查漏报率与1990年普査漏报率相同的假设,估计了2010年普査0~5岁人口的漏报量。通过表1中第(6)列“2010年普査c”和第(2)列“1990年普査”数据的对比,得到1990年普查0?5岁人口漏报1136万,0~5岁人口漏报率达到7.7%。实际上,有学者(周皓,2003)通过2000年普査数据与1990年普查数据的对比分析,认为“四普数据的质量并没有我们以前所认为的那样好”,四普漏报率大概在0.187%,并不是官方公布的0.06%;其中0~9岁人口漏报严重,漏报1163万人。所以,即使是质量公认较好的1990年普査,低年龄人口漏报也很严重,2010年普查低年龄人口漏报情况应该更严重。
从表1最后一列的分年龄漏报率看,2~5岁人口的漏报很低,漏报主要发生在0~1岁,0岁漏报达到20%以上,1岁漏报达到10%以上。我们使用这一分年龄漏报率,对2010年普査0~5岁人口进行调整,得到表2中的第(3)列“调整后的人数”。然后,利用生命表存活率将它们倒推出相应年份的出生人口,如表2中第(5)列所示。基于这些估计的出生人数,可以计算得到如表2中最后一列所示的“总和生育率”。可以看出,估计的2005-2010年的生育水平基本上在1.5以上。2005年的生育率
略低于1_5,而2009年的生育率又明显高于1.5,其他年份的生育率在1.56~1.58之间。所以,可以认为,中国近期的生育率不会低于1.5。不低于1.5并不意味着中国的生育率不是很低,哪怕是1.7的生育率,相对于中国的经济社会发展水平而言,仍然是很低的生育率。
国家统计局出版发布的历次人口普査、1%人口抽样调查和年度人口变动抽样调査数据集中所反映的生育水平是调查直接获得的结果,基于此国家统计局进行适当调整,公布每年的出生人口和出生率。而公布的出生人口和出生率要明显高于调查直接获得的结果。那么,公布的出生率反映了多高的生育水平呢?总和生育率和出生率之间可以建立严格的数学关系,借此可以推算生育水平。乔晓春(2014)利用总和生育率和出生率之间的数学关系,估计了2000年以来中国的生育水平,显示在表3中的最后一列“总和生育率b”。本文也利用总和生育率和出生率之间关系,估计了2005-2013年的生育水平,显示在表3中的第(8)列“总和生育率a”。根据总和生育率和出生率之间的数学关系,出生率除以或乘以某个因子就可以得到总和生育率。这个因子取决于育龄妇女的年龄结构和生育率的年龄结构。乔晓春使用2010年普査数据计算了这个因子,然后使用这个因子统一调整了历年的出生率。在生育率和年龄结构变化较小、较为稳定的条件下,这样做是可以的,而且2000年以来中国的人口变化是比较稳定的。本文虽然使用了类似的方法,但是实际上是对每年都使用了不同的因子,而这些因子的计算也稍有不同。本文使用历次调査中获得的总人口(第(2)列)和出生人数(第(3)列),计算得到出生率(第(4)列),然后与历次调查得到的总和生育率相比,得到历年的比值(第(6)列)。然后再以国家统计局公布的出生率和这些比值进行计算,就得到如表3中的第(8)列“总和生育率a”。本文的计算表明2005-2013年,中国的生育率处于下降中,由1.7以上降到1.5,2010年来基本稳定在1_5。乔晓春(2014)的估计表明,2005~2013年中国的生育率一直比较稳定,在1.6左右。可见,这样的估计也表明,中国目前的生育率不会低于1.5。
总之,通过上面两种方法的估计,中国近期的生育水平不会低于1.5,很有可能在1.6左右的水平上。实际上,这样的结果没有出乎意料,官方和多数学者,包括国际机构,都基本上接受这样的生育水平。这样的生育水平意味着中国还处于适度的低生育水平范畴,但是需要通过生育政策调整完善和其他经济社会政策来避免生育率走向更低。因此,目前对生育政策的调整完善仍然是合适的时机。一方面要尽快从“单独二孩”政策转向“全面二孩”政策,另一方面也要加快制定其他辅助的经济社会政策,进一步促使生育政策调整完善产生积极效果
5结论和讨论
本文利用国家统计局的人口普査和人口变动抽样调查数据,在假设2010年普査漏报率与1990年普査漏报率相同的条件下,估计了2005年以来中国的生育率。同时,又通过总和生育率与出生率之间的关系,利用国家统计局公布的出生率,估计了2005年以来的生育率。这两种方法得到的估计结果存在差异,但也可以认为存在一致性。总的来说,中国近期的生育水平不会低于1.5,很有可能在1.6左右的水平上。这既与很多研究的结果一致,也是官方和非官方都接受的生育水平。如果这样的生育水平仍然是在适度的低生育率的范畴,那么,中国政府就需要及早通过经济社会政策制定、调整和完善来避免生育率进一步下滑。低生育率的长期人口后果具有警示意义:在一个稳定人口中,如果育龄妇女的平均生育年龄为30岁,总和生育率为1.5时,人口总量下降一半需要65年,而当总和生育率下降到1.3时,人口减半的时间则只需要45年(陈卫,2008)。
本文的研究是在一定的假设下进行的,即2010年普查数据质量与1990年普查数据质量相当。也就是说,2010年普查数据质量是很高的。这是一个很强的假设。因为从已有对2010年普查数据质量评估的研究看,这样的假设很可能是不合理的。2010年普查的登记办法并没有能保证比以前的登记办法更好地避免漏报瞒报,同时它又产生了很多的重报。它的年龄结构存在严重的问题。另外,从死亡登记结果看,2010年普查的死亡数据质量也许是历次普査中最差的。本文在很强的假设下得到的估计值’说明中国近期的生育水平不可能更低。
随着中国生育政策的调整完善,我们期待着生育率不再进一步下降,而是在波动中平稳变化。既然生育率返回高水平不可能,那么平稳变化的、适度的即越接近于更替水平的低生育率便是越好的政策目标选择。很多研究表明,中国的低生育率主要是由经济发展所决定的,计划生育政策的作用在不断消退,甚至有的学者认为巳经基本不起作用了。结合近期对“单独二孩”政策“遇冷”的讨论,实际上说明一些研究或议论是自相矛盾的。他们一方面认为“遇冷”不出乎意料,经济社会的发展已经导致很低的生育意愿和生育水平;另一方面又极力建议要立刻全面放开二孩政策。如果说中国的低生育水平是经济发展决定的,而不是生育政策导致的,甚至生育政策基本不起作用,那么再调整放开生
育政策就失去了很强的意义。
最后,需要指出本文可能存在的缺陷是在利用2010年普査和1990年普查进行同队列比较分析,进而估计分年龄漏报率,然后推算出各年的出生人口和生育率的过程中,实际上也是假设了2010年0~5岁人口漏报的年龄模式与1990年0~5岁人口漏报的年龄模式一致。这种假设总体来说应该是没问题的,历次人口普查和抽样调查都揭示类似的漏报年龄模式,即年龄越低,漏报程度越大。只是有可能在个别年龄不符合这种模式,导致偏高或偏低的估计结果。例如,本文表2中估计的2009年生育率高达1.7,明显高于其他年份,但又没有表现出如表3第(8)列中估计的下降趋势。另外,2010年普查20~25岁人口的重报问题,也会影响本文的估计结果。