第40卷第3期华中师范大学学报(自然科学版) 2006年9月 J OU RNAL OF CEN TRAL CHINA NORMAL UN IV ERSIT Y (Nat. Sci. ) 文章编号:100021190(2006) 0320452205
Vol. 40No. 3
Sept. 2006
人口增长的常用数学模型及其预测方法
———兼谈对Keyfitz 双曲增长等模型的修正与发展
陈彦光1, 余 斌2,3
(1. 北京大学环境学院城市与区域规划系, 北京100871; 2. 华中师范大学城市与环境科学学院, 武汉430079;
3. 信阳师范学院城市与环境学系, 河南信阳464000)
摘 要:预测人口增长的数学模型通常采用3种函数, . 3模型的数学根源都在于二阶Bernoulli 式微分方程, 解. 论述了上述3种模型的历史根源、应用方法进行了探讨; S 曲线式人口预测模型和二, . 过程; 反双曲关系; 反S 曲线:2
文献标识码:A
人口预测的数学模型是一个人们研究较多而至今没有定论的问题. 预测方法看似简单, 但实际应用却又常常出现失误. 具体说来, 常见的问题主要表现在如下几个方面:其一是简单的趋势外推. 假定区域人口按照一定的增长率变化, 这相当于线性增长. 区域人口变化曲线从来都不是线性延伸, 尽管线性模型可以拟合短期时间序列. 其二是模型的选择没有依据. 采用一个常用的模型给出预测结果, 但没有考虑该模型是否符合区域人口变化规律. 其三是多种结果的加和平均, 这是最常见的一种错误处理方式:将多种预测模型不分青红皂白地全都套搬而上, 给出一系列的预测结果, 然后取各项预测的平均水平. 有位学者曾经感叹:20世纪80年代人们对部分城市人口规模的做出的预测结果, 今天看来多数有相当大的出入. 难道区域或者城市人口真的不能预测? 作者相信开展10~20年的人口增长预测应该不会误差太远, 否则一定在方法的运用上存在问题.
人口增长的预测模型通常采用三种函数, 即指数函数、Logistic 函数和双曲函数. 前面两种函数为我国学者熟知, 但人们对第三种模型则未必十分了解. 尤其重要的是, 在什么情况下采用何种模型
进行数据拟合和增长预测时常出现一些认识上的
混乱以至应用上的错误. 问题的关键在于, 许多应用工作者对这三个基本模型的建设思路及其内在的数理关系缺乏认识. 本文将借助简明的实例解析上述模型的应用方法, 然后论证各个模型的逻辑联系及其适用场合; 提出人口预测双曲函数的一般形式, 从这个函数中可以衍生出人口预测的反S 形曲线模型和二次双曲模型.
1指数预测模型及其应用实例
1. 1数学模型的来源与表达形式
在最简单的情况下, 人口预测采用指数增长函数. 建模思路如下:假定第t 0=0年的人口为P (0) , 人口增长率为r , 则第t 年的人口为
t
(1) P (t ) =P (0) (1+r ) ,
经过简单的数学变换, 上面递推公式的通用项可以化为指数形式
rt
(2) P (t ) =P 0e ,
这便是著名的Malt hus (1798) 人口增长模型[1]. 假定变量连续, 求导得到齐次方程
(3) =rP (t ) , d t
显然式(2) 是微分方程式(3) 的特解.
收稿日期:2006203201.
基金项目:国家自然科学基金资助项目(40371039) .
作者简介:陈彦光(1965-) , 男, 河南罗山人, 副教授, 博士, 主要从事城市与数量地理学研究. Email :chenyg @pku.
edu. cn.
第3期陈彦光等:人口增长的常用数学模型及其预测方法 453
1. 2应用方法与实例
指数模型的应用方法非常简单, 将模型线性化, 然后采用普通最小二乘(OL S ) 法进行线性回归运算即可实现数据的模型拟合和预测分析. 下面以世界城市人口的增长为例进行具体说明. 原始数据资料来自联合国(UN ) [2]. 数据的时间间隔即取样时间步长为5年~25年不等, 这不影响模型的拟合. 一共有15个观测值, 时间跨度是200年. 采用前面13个数据(1800年~1990年) 建模, 后面两个数据点用作预测对比. 为了处理方便, 将公元纪年式的年份n 转化为时序t . 借助Excel 、SPSS 或者Matlab 等数学或者统计分析软件容易对有关数据
2Logistic 预测模型及其应用实例
2. 1数学模型的来源与表达形式
指数模型虽然在一定时段适用, 但长远看肯定
是不符合实际的———正如恩格斯所说, 大自然决不会让一棵树长得刺破了天———人口的增长必将受到环境的约束, 为此需要在式(3) 中加上一个表征环境约束因子的二次项q P (t ) 2, 从而得到二阶Bernoulli 式齐次方程2
=(t ) -qP (t ) 1-],
d t P m
(4)
进行回归分析. 利用原始数据点作散点图, 有指数上升趋势; 、, 特征. , 发现指数增. 基于回归计算的结果可得如下模型
0. 0215t 0. 0215(n-1800)
u (t ) =32. 676e =32. 676e , 式中n 表示公元纪年, t 表示时序. 模型的拟合优度即测定系数为R 2=0. 9808, 线性化模型的标准误差为s =0. 2062. 拟合优度和标准误差检验不成问题. 由于1995年和2000年两个年份的数据没有参与回归, 比较观测值和计算值可以发现模型的预测差强人意. 尽管局部效果不太理想, 但宏观趋势依然可取, 也就是说较长期的预测比较可靠. 实际上, 世界城市人口的增长模式介于指数模型和正态模型之间, 要比指数模型快速得多, 即有P (t ) =
v
P 0exp (rt ) , 式中参数v =1. 5. 指数模型仅仅是一种近似表达, 应用起来更为方便
.
(Verhulst 方Verhulst (1838) 最早将上述-人口预测[3]. 此方程有三个参数, 但利用Excel 或者SPSS 等还是容易拟合的, 只不过麻烦一些. 式中P m =r/q 表示区域饱和人口即最大人口容量, 方程式(4) 的初始条件和饱和条件分别为P (t 0) =P 0, P (t ) ≤P m . 解之得到著名的Logistic 预测模型
P (t ) =
-1+(-1) e P 0
rt
=
-1+λe
rt
, (5)
图1 世界城市人口增长及其指数拟合曲线
原始资料来源:1.1800年~1990年:United Nations 等, 参见参考文献[2];2. 1995年~2000年:United Nations
Population Division , World Urbanization Prospect s :The 2001Revision.
容易看出, 式中参数λ=(P m /P 0-1) .
2. 2应用方法与实例
Logistic 模型有三个参数, 普通的回归无法实现数据的拟合, 这就要求我们灵活地应用OL S 方法了. 一个有效的办法是估计一个初始的人口饱和值P m , 代入式(5) 的对数转换形式进行回归分析, 然后反复调整P m 值, 直到模型的拟合优度接近最大值.
关于美国人口预测方法, 西方学者大多采用指数方程:Banks利用1790年~1980年的数据给出了指数预测分析[3], 美国“数学及其应用协会(Co nsortium for Mat hematics and It s Applications , COMA P ) ”基于1780年~1990年的数据将指数式人口预测写进了教科书[4]. 但是, 本文作者认为美国人口其实是Logistic 增长, 下面给出较上述两个实例更好的拟合结果. 美国从1790年至今, 每隔10年有一次人口普查, 积累至今已有22个样本点了(1790年~2000年) . 为了预测对比, 采用前面21个样本点(1790年~1990年) 建模,2000年的数据用于预测结果对比. 将这些数据点标绘到散点图上, 发现点列具有Logistic 曲线特征(图2) . 经过多个模型的匹配与比较, 发现果然以Logistic 函数的拟合效果最好. 用时序代替年
454华中师范大学学报(自然科学版) 第40卷
份, 得到Logistic 模型如下
P (t ) =-0. 0274t =
1+74. 3284e -0. 0274(n-1790) ,
1+74. 3284e
测定系数R 2=0. 9963, 线性化模型的标准误差s
=0. 1059. 式中t 为时序, n 为公元纪年. 结果显
P (t )
如下模型=1. 9045-0. 0051t =
-t ,
0. 52510. 5251
测定系数R 2=0. 9981, 线性化模型的标准误差s =0. 0272. 与式(6) 比较可见参数P 0和r 的计算
值分别为0. 5251和0. 0027; 而实际上的P 0=0. 51, r =0. 004
1.
示, 模型的计算值与观测值也大致吻合. 从图2可以看出点列与计算值形成的趋势线总体匹配效果良好, 但用它预测2000年的人口却有较大的出入. 尽管如此, 较之西方学者采用的指数预测的效果要准确很多
.
图3 世界人口增长及其双曲拟合曲线
原始资料来源:1.1650年~1990年:见参考文献[3]; 2. 1995年~2000年:United Nations Population Division , World
Urbanization Prospect s :The 2001Revision.
4模型的内在联系及其适用范围
图2 美国人口增长及其Logistic 拟合曲线[5]
4. 1模型的内在关系和修正形式
3双曲预测模型及其应用实例
3. 1数学模型的来源与表达形式
Logistic 方程虽然在理论上更加符合区域或
者城市人口的增长实际, 但在许多情况下其模型拟合精度不能满足要求, 或者说标准误差检验不能通过. 在这种情况下, 反双曲函数可以作为一个有效
的替代方程. 双曲增长模型最早由Keyfitz (1968) 提出[6], 其实它是Logistic 方程的近似表达形式. 将式(5) 两边同时颠倒分子分母, 并且假定P m 足够大, 借助Taylor 级数展开式进行变换, 可得双曲线表达形式
[3]
同样是进行人口增长预测, 在不同情况下拟合的数学模型却大不相同. 而我们隐隐约约已经看到, 上述模型之间似乎存在某种内在的数理关系. 考察它们之间的逻辑联系有助于我们在实践中根据具体情况正确地选择预测模型. 实际上, 从二阶Bernoulli 齐次方程即式(4) 出发可以将上述三种模型都引导出来.
第一种情况, 在Logistic 微分方程中, 假定t 0
=0, 则当q =0、r >0时, 其解为指数方程, 即式(2) 形式. 第二种情况, 当r =0、-q >0时, 其解为双曲线, 可以得到式(6) 形式. 第三种情况, 当r >0、q >0时, 其解为Logistic 模型即式(5) 形式.
作者发现第二种情况依然是一种特例, 即参数q 为恒常. 然而, 现实的人口演化动力学要复杂的多. 为此将参数q 视为一种参变量, 定义为q =-V (t ) , 当r =0时, 式(4) 化为
2
=V (t ) P (t ) , d t
(7)
P (t )
=
P 0
-
t. P 0
(6)
3. 2应用方法与实例
(t ) =1/P (t ) , 即可将模型化为在上式中令P ′
线性形式. 借助OL S 方法不难得到拟合结果. 下面
以世界人口的增长数据(1650年~2000年) 为例进行具体说明. 将人口数据取倒数, 以时序t 为横坐标, 以1/P (t ) 为纵坐标, 作坐标图, 发现点列成线性分布趋势, 表明数据序列具有双曲关系的特征. 然后经过多种模型的对比分析, 发现以双曲函数的拟合效果最佳. 基于1650年~1990年的数据得到
取V (t ) =b/t , 解得
P (t )
=
P 1
-b ln t , (8)
式中b 为参数. 这是反S 形曲线形式, 式中参数P 1在理论上为t =1时的人口值. 为了避免取对数的
第3期陈彦光等:人口增长的常用数学模型及其预测方法 455
困难, 直接采用公元纪年为自变量, 以图3中的世界人口为因变量, 经过非线性回归可得如下模型
=71. 1387-9. 3414ln n ,
P (n )
5结语
人口的长期预测是一件复杂而又困难的事情, 但中短期的预报却是现实可能的, 上述各种方法都可以在中国的人口预测分析中找到相应的应用场合. 关键在于正确地遴选模型和甄别方法. 作者发现, 中国的总人口在局部时段(如20世纪50年代) 是指数增长的, 但长期趋势却是Logistic 过程, 而相当多的城市(如郑州) 或者具有反曲线特征. 系, . , 无论怎样. 由于人口序列自相关性较Durbin 2Wat son (DW ) 检验和残差分析一般都不能通过. 统计学家和应用数学家对线性回归分析的DW 检验和残差分析要求很严, 但对非线性模型的有关验测却相对放松. 然而, 非线性模型的拟合方法多数基于OL S 技术, 其实质是借助某种数学变换将模型线性化以后展开的回归分析, 因此DW 检验和残差分析的统计参量自然暗示着预测结果的有效程度. 一个无可幸免的结论乃是:基于确定性数学模型的人口预测能力是有限度的, 对预测结果不可以无条件地过分外推. 国内的一些规划和战略研究中动辄数十年乃至上百年的人口预测是没有意义的. 为了加强人口预测的可靠性, 除了准确选用数学模型以外, 还需要开展更为有效的时间序列分析, 限于篇幅, 进一步的问题留待今后再作深入探讨. 参考文献:
[1] Malt hus T. An Essay on t he Principle of Population [M ].
Cambridge :Cambridge University Press , 1992. [2] 周一星. 城市地理学[M ].北京:商务印书馆,1999.
[3] Banks R B. Growt h and Diffusion Phenomena :Mat hematical
Frameworks and Applications [M ].Verlag , 1994.
[4] COMAP. Principles and Practice of Mat hematics[M ].New
Y ork :Springer , 1997.
[5] Http ://www. census. gov/populaxon
[6] Keyfitz N. Introduction to t he Mat hematics of Population
[M ].Reading , Massachusett s :Addison 2Wesley , 1968. [7] 周一星, 陈彦光. 城市与城市地理[M ].北京:人民教育出版
Berlin :Springer 2
式中n 为公元纪年, 测定系数R =0. 9986, 标准
误差s =0. 0233, 模型的计算值与实际观测值也更为接近. 点列与趋势线匹配的坐标图与图3相似, 但效果更好.
但是, 用上述各种模型都无法有效拟合千年左右的世界人口数据. 于是我们需要新的模型. 在式(7) 中, 如果取V (t ) =2bt , 解得二次双曲函数
2
(9) =-bt .
P (t )
P 1
2
式中参数P 1在理论上为t =1元1年~2000年的世界人http ://) , 2
0. 0000000012n P (n ) . 9
拟合优度为R 2=0. 9986, 标准误差s =0. 00005, 模型的计算值与实际观测值也非常接近. 4. 2模型的适用范围
现在看来, 指数模型和双曲模型其实都可视为Logistic 模型的在极端情况下的特例, 但它们的用处又不是Logistic 模型可以替代的. 不仅不同的模型的适用范围不同, 预测时间尺度也不相同:Logistic 方程主要用于远期预测, 对于近期预测的效果未必胜过指数模型、双曲模型和反S 模型. 模型的适用范围和预测时限都可以从Logistic 方程的参数的含义得到理解:在式(4) 中, r 代表系统的自身的或者内在的增长因子的力量, 而q 则代表环境的约束或者外在的支持力量. 当一个区域的人口增长短期内没有明显的约束时, 采用指数预测方式; 当人口增长以资源掠夺式增长时, 采用双曲函数形式; 当环境的作用随着时间而衰减时, 采用反S 曲线模型; 当系统的内力先起作用、外在的约束
力量由小到达逐渐发生作用时, 采用Logistic 方程.
经验表明, 一个国家的城市人口、国家现代化过程中的突发城市(shock city ) 的人口[7,8]等通常具有指数增长特征; 世界总人口在一定时期内明显满足双曲增长曲线[3], 作者还发现一个城市的非农业人口等也可用双曲增长函数拟合, 而这两种情况都可以借助反S 形曲线给出更精确的预测结果; 一个国家的总人口通常满足Logisitc 方程[3]———特别是, 一个国家的城市人口比重在理论上满足Logistic 曲线[2, 9211].
社,2003.
[8] Knox P L , Marston S A. Places and Regions in G lobal
Context :Human Geography[M ].Upper Saddle River , NJ :Prentice Hall , 1998.
[9] Karmeshu. Demographic models of urbanization [J ].
456华中师范大学学报(自然科学版)
Environment and Planning B :Planning and Design , 1988, 15(1) :47254.
16(3) :2892295.
第40卷
[11] 陈彦光, 周一星. 城市化Logistic 过程的阶段划分及其空间
[10] Rao D N , Karmeshu J ain V P. Dynamics of urbanization :
t he empirical validation of t he replacement hypot hesis [J].Environment and Planning B :Planning and Design , 1989,
解释———对Nort ham 曲线的修正与发展[J].经济地理,
2005, 25(6) :8172822.
Three models for predicting population grow th
———Theoretical foundation , application met hods , and revised ressions
CH EN Yanguang 1, Bin 2,3
(1. Department of Geography , Peking ;
2. College of Urban and Environmental Science , , 430079; 3. Department of Urban and , , Xinyang , Henan 464000)
Abstract :are always employed to predict t he growt h
of or pop , including exponential f unction (Malt hus model ) , f (Keyfitz model ) , and logistic f unction (Verhulst model ) . All t t hree models originate from logistic equation , but under different conditions. The logic relations and distinctions between t he t hree models are expounded and a new model used for pop ulation p redict is derived f rom t he same mat hematic source in t he form :1/P (t ) =1/P 1-blnt , which in fact defines an ’inverse S 2shaped curve’.The Keyfitz model t urns out to be t he " approximator" of t he inverse S 2f unction advanced by t he aut hor. In addition , a new model based on t he hyperbola wit h power is given as 1/P (t ) =1/P 1-b α, where αis a parameter. Three set s of data and t he corresponding analytical result s are taken as examples to illust rate t he models and while showing how to use t he prediction met hods correctly.
K ey w ords :pop ulation growt h ; exponential model ; logistic curve ; hyperbolic growt h ; inverse S 2curve
第40卷第3期华中师范大学学报(自然科学版) 2006年9月 J OU RNAL OF CEN TRAL CHINA NORMAL UN IV ERSIT Y (Nat. Sci. ) 文章编号:100021190(2006) 0320452205
Vol. 40No. 3
Sept. 2006
人口增长的常用数学模型及其预测方法
———兼谈对Keyfitz 双曲增长等模型的修正与发展
陈彦光1, 余 斌2,3
(1. 北京大学环境学院城市与区域规划系, 北京100871; 2. 华中师范大学城市与环境科学学院, 武汉430079;
3. 信阳师范学院城市与环境学系, 河南信阳464000)
摘 要:预测人口增长的数学模型通常采用3种函数, . 3模型的数学根源都在于二阶Bernoulli 式微分方程, 解. 论述了上述3种模型的历史根源、应用方法进行了探讨; S 曲线式人口预测模型和二, . 过程; 反双曲关系; 反S 曲线:2
文献标识码:A
人口预测的数学模型是一个人们研究较多而至今没有定论的问题. 预测方法看似简单, 但实际应用却又常常出现失误. 具体说来, 常见的问题主要表现在如下几个方面:其一是简单的趋势外推. 假定区域人口按照一定的增长率变化, 这相当于线性增长. 区域人口变化曲线从来都不是线性延伸, 尽管线性模型可以拟合短期时间序列. 其二是模型的选择没有依据. 采用一个常用的模型给出预测结果, 但没有考虑该模型是否符合区域人口变化规律. 其三是多种结果的加和平均, 这是最常见的一种错误处理方式:将多种预测模型不分青红皂白地全都套搬而上, 给出一系列的预测结果, 然后取各项预测的平均水平. 有位学者曾经感叹:20世纪80年代人们对部分城市人口规模的做出的预测结果, 今天看来多数有相当大的出入. 难道区域或者城市人口真的不能预测? 作者相信开展10~20年的人口增长预测应该不会误差太远, 否则一定在方法的运用上存在问题.
人口增长的预测模型通常采用三种函数, 即指数函数、Logistic 函数和双曲函数. 前面两种函数为我国学者熟知, 但人们对第三种模型则未必十分了解. 尤其重要的是, 在什么情况下采用何种模型
进行数据拟合和增长预测时常出现一些认识上的
混乱以至应用上的错误. 问题的关键在于, 许多应用工作者对这三个基本模型的建设思路及其内在的数理关系缺乏认识. 本文将借助简明的实例解析上述模型的应用方法, 然后论证各个模型的逻辑联系及其适用场合; 提出人口预测双曲函数的一般形式, 从这个函数中可以衍生出人口预测的反S 形曲线模型和二次双曲模型.
1指数预测模型及其应用实例
1. 1数学模型的来源与表达形式
在最简单的情况下, 人口预测采用指数增长函数. 建模思路如下:假定第t 0=0年的人口为P (0) , 人口增长率为r , 则第t 年的人口为
t
(1) P (t ) =P (0) (1+r ) ,
经过简单的数学变换, 上面递推公式的通用项可以化为指数形式
rt
(2) P (t ) =P 0e ,
这便是著名的Malt hus (1798) 人口增长模型[1]. 假定变量连续, 求导得到齐次方程
(3) =rP (t ) , d t
显然式(2) 是微分方程式(3) 的特解.
收稿日期:2006203201.
基金项目:国家自然科学基金资助项目(40371039) .
作者简介:陈彦光(1965-) , 男, 河南罗山人, 副教授, 博士, 主要从事城市与数量地理学研究. Email :chenyg @pku.
edu. cn.
第3期陈彦光等:人口增长的常用数学模型及其预测方法 453
1. 2应用方法与实例
指数模型的应用方法非常简单, 将模型线性化, 然后采用普通最小二乘(OL S ) 法进行线性回归运算即可实现数据的模型拟合和预测分析. 下面以世界城市人口的增长为例进行具体说明. 原始数据资料来自联合国(UN ) [2]. 数据的时间间隔即取样时间步长为5年~25年不等, 这不影响模型的拟合. 一共有15个观测值, 时间跨度是200年. 采用前面13个数据(1800年~1990年) 建模, 后面两个数据点用作预测对比. 为了处理方便, 将公元纪年式的年份n 转化为时序t . 借助Excel 、SPSS 或者Matlab 等数学或者统计分析软件容易对有关数据
2Logistic 预测模型及其应用实例
2. 1数学模型的来源与表达形式
指数模型虽然在一定时段适用, 但长远看肯定
是不符合实际的———正如恩格斯所说, 大自然决不会让一棵树长得刺破了天———人口的增长必将受到环境的约束, 为此需要在式(3) 中加上一个表征环境约束因子的二次项q P (t ) 2, 从而得到二阶Bernoulli 式齐次方程2
=(t ) -qP (t ) 1-],
d t P m
(4)
进行回归分析. 利用原始数据点作散点图, 有指数上升趋势; 、, 特征. , 发现指数增. 基于回归计算的结果可得如下模型
0. 0215t 0. 0215(n-1800)
u (t ) =32. 676e =32. 676e , 式中n 表示公元纪年, t 表示时序. 模型的拟合优度即测定系数为R 2=0. 9808, 线性化模型的标准误差为s =0. 2062. 拟合优度和标准误差检验不成问题. 由于1995年和2000年两个年份的数据没有参与回归, 比较观测值和计算值可以发现模型的预测差强人意. 尽管局部效果不太理想, 但宏观趋势依然可取, 也就是说较长期的预测比较可靠. 实际上, 世界城市人口的增长模式介于指数模型和正态模型之间, 要比指数模型快速得多, 即有P (t ) =
v
P 0exp (rt ) , 式中参数v =1. 5. 指数模型仅仅是一种近似表达, 应用起来更为方便
.
(Verhulst 方Verhulst (1838) 最早将上述-人口预测[3]. 此方程有三个参数, 但利用Excel 或者SPSS 等还是容易拟合的, 只不过麻烦一些. 式中P m =r/q 表示区域饱和人口即最大人口容量, 方程式(4) 的初始条件和饱和条件分别为P (t 0) =P 0, P (t ) ≤P m . 解之得到著名的Logistic 预测模型
P (t ) =
-1+(-1) e P 0
rt
=
-1+λe
rt
, (5)
图1 世界城市人口增长及其指数拟合曲线
原始资料来源:1.1800年~1990年:United Nations 等, 参见参考文献[2];2. 1995年~2000年:United Nations
Population Division , World Urbanization Prospect s :The 2001Revision.
容易看出, 式中参数λ=(P m /P 0-1) .
2. 2应用方法与实例
Logistic 模型有三个参数, 普通的回归无法实现数据的拟合, 这就要求我们灵活地应用OL S 方法了. 一个有效的办法是估计一个初始的人口饱和值P m , 代入式(5) 的对数转换形式进行回归分析, 然后反复调整P m 值, 直到模型的拟合优度接近最大值.
关于美国人口预测方法, 西方学者大多采用指数方程:Banks利用1790年~1980年的数据给出了指数预测分析[3], 美国“数学及其应用协会(Co nsortium for Mat hematics and It s Applications , COMA P ) ”基于1780年~1990年的数据将指数式人口预测写进了教科书[4]. 但是, 本文作者认为美国人口其实是Logistic 增长, 下面给出较上述两个实例更好的拟合结果. 美国从1790年至今, 每隔10年有一次人口普查, 积累至今已有22个样本点了(1790年~2000年) . 为了预测对比, 采用前面21个样本点(1790年~1990年) 建模,2000年的数据用于预测结果对比. 将这些数据点标绘到散点图上, 发现点列具有Logistic 曲线特征(图2) . 经过多个模型的匹配与比较, 发现果然以Logistic 函数的拟合效果最好. 用时序代替年
454华中师范大学学报(自然科学版) 第40卷
份, 得到Logistic 模型如下
P (t ) =-0. 0274t =
1+74. 3284e -0. 0274(n-1790) ,
1+74. 3284e
测定系数R 2=0. 9963, 线性化模型的标准误差s
=0. 1059. 式中t 为时序, n 为公元纪年. 结果显
P (t )
如下模型=1. 9045-0. 0051t =
-t ,
0. 52510. 5251
测定系数R 2=0. 9981, 线性化模型的标准误差s =0. 0272. 与式(6) 比较可见参数P 0和r 的计算
值分别为0. 5251和0. 0027; 而实际上的P 0=0. 51, r =0. 004
1.
示, 模型的计算值与观测值也大致吻合. 从图2可以看出点列与计算值形成的趋势线总体匹配效果良好, 但用它预测2000年的人口却有较大的出入. 尽管如此, 较之西方学者采用的指数预测的效果要准确很多
.
图3 世界人口增长及其双曲拟合曲线
原始资料来源:1.1650年~1990年:见参考文献[3]; 2. 1995年~2000年:United Nations Population Division , World
Urbanization Prospect s :The 2001Revision.
4模型的内在联系及其适用范围
图2 美国人口增长及其Logistic 拟合曲线[5]
4. 1模型的内在关系和修正形式
3双曲预测模型及其应用实例
3. 1数学模型的来源与表达形式
Logistic 方程虽然在理论上更加符合区域或
者城市人口的增长实际, 但在许多情况下其模型拟合精度不能满足要求, 或者说标准误差检验不能通过. 在这种情况下, 反双曲函数可以作为一个有效
的替代方程. 双曲增长模型最早由Keyfitz (1968) 提出[6], 其实它是Logistic 方程的近似表达形式. 将式(5) 两边同时颠倒分子分母, 并且假定P m 足够大, 借助Taylor 级数展开式进行变换, 可得双曲线表达形式
[3]
同样是进行人口增长预测, 在不同情况下拟合的数学模型却大不相同. 而我们隐隐约约已经看到, 上述模型之间似乎存在某种内在的数理关系. 考察它们之间的逻辑联系有助于我们在实践中根据具体情况正确地选择预测模型. 实际上, 从二阶Bernoulli 齐次方程即式(4) 出发可以将上述三种模型都引导出来.
第一种情况, 在Logistic 微分方程中, 假定t 0
=0, 则当q =0、r >0时, 其解为指数方程, 即式(2) 形式. 第二种情况, 当r =0、-q >0时, 其解为双曲线, 可以得到式(6) 形式. 第三种情况, 当r >0、q >0时, 其解为Logistic 模型即式(5) 形式.
作者发现第二种情况依然是一种特例, 即参数q 为恒常. 然而, 现实的人口演化动力学要复杂的多. 为此将参数q 视为一种参变量, 定义为q =-V (t ) , 当r =0时, 式(4) 化为
2
=V (t ) P (t ) , d t
(7)
P (t )
=
P 0
-
t. P 0
(6)
3. 2应用方法与实例
(t ) =1/P (t ) , 即可将模型化为在上式中令P ′
线性形式. 借助OL S 方法不难得到拟合结果. 下面
以世界人口的增长数据(1650年~2000年) 为例进行具体说明. 将人口数据取倒数, 以时序t 为横坐标, 以1/P (t ) 为纵坐标, 作坐标图, 发现点列成线性分布趋势, 表明数据序列具有双曲关系的特征. 然后经过多种模型的对比分析, 发现以双曲函数的拟合效果最佳. 基于1650年~1990年的数据得到
取V (t ) =b/t , 解得
P (t )
=
P 1
-b ln t , (8)
式中b 为参数. 这是反S 形曲线形式, 式中参数P 1在理论上为t =1时的人口值. 为了避免取对数的
第3期陈彦光等:人口增长的常用数学模型及其预测方法 455
困难, 直接采用公元纪年为自变量, 以图3中的世界人口为因变量, 经过非线性回归可得如下模型
=71. 1387-9. 3414ln n ,
P (n )
5结语
人口的长期预测是一件复杂而又困难的事情, 但中短期的预报却是现实可能的, 上述各种方法都可以在中国的人口预测分析中找到相应的应用场合. 关键在于正确地遴选模型和甄别方法. 作者发现, 中国的总人口在局部时段(如20世纪50年代) 是指数增长的, 但长期趋势却是Logistic 过程, 而相当多的城市(如郑州) 或者具有反曲线特征. 系, . , 无论怎样. 由于人口序列自相关性较Durbin 2Wat son (DW ) 检验和残差分析一般都不能通过. 统计学家和应用数学家对线性回归分析的DW 检验和残差分析要求很严, 但对非线性模型的有关验测却相对放松. 然而, 非线性模型的拟合方法多数基于OL S 技术, 其实质是借助某种数学变换将模型线性化以后展开的回归分析, 因此DW 检验和残差分析的统计参量自然暗示着预测结果的有效程度. 一个无可幸免的结论乃是:基于确定性数学模型的人口预测能力是有限度的, 对预测结果不可以无条件地过分外推. 国内的一些规划和战略研究中动辄数十年乃至上百年的人口预测是没有意义的. 为了加强人口预测的可靠性, 除了准确选用数学模型以外, 还需要开展更为有效的时间序列分析, 限于篇幅, 进一步的问题留待今后再作深入探讨. 参考文献:
[1] Malt hus T. An Essay on t he Principle of Population [M ].
Cambridge :Cambridge University Press , 1992. [2] 周一星. 城市地理学[M ].北京:商务印书馆,1999.
[3] Banks R B. Growt h and Diffusion Phenomena :Mat hematical
Frameworks and Applications [M ].Verlag , 1994.
[4] COMAP. Principles and Practice of Mat hematics[M ].New
Y ork :Springer , 1997.
[5] Http ://www. census. gov/populaxon
[6] Keyfitz N. Introduction to t he Mat hematics of Population
[M ].Reading , Massachusett s :Addison 2Wesley , 1968. [7] 周一星, 陈彦光. 城市与城市地理[M ].北京:人民教育出版
Berlin :Springer 2
式中n 为公元纪年, 测定系数R =0. 9986, 标准
误差s =0. 0233, 模型的计算值与实际观测值也更为接近. 点列与趋势线匹配的坐标图与图3相似, 但效果更好.
但是, 用上述各种模型都无法有效拟合千年左右的世界人口数据. 于是我们需要新的模型. 在式(7) 中, 如果取V (t ) =2bt , 解得二次双曲函数
2
(9) =-bt .
P (t )
P 1
2
式中参数P 1在理论上为t =1元1年~2000年的世界人http ://) , 2
0. 0000000012n P (n ) . 9
拟合优度为R 2=0. 9986, 标准误差s =0. 00005, 模型的计算值与实际观测值也非常接近. 4. 2模型的适用范围
现在看来, 指数模型和双曲模型其实都可视为Logistic 模型的在极端情况下的特例, 但它们的用处又不是Logistic 模型可以替代的. 不仅不同的模型的适用范围不同, 预测时间尺度也不相同:Logistic 方程主要用于远期预测, 对于近期预测的效果未必胜过指数模型、双曲模型和反S 模型. 模型的适用范围和预测时限都可以从Logistic 方程的参数的含义得到理解:在式(4) 中, r 代表系统的自身的或者内在的增长因子的力量, 而q 则代表环境的约束或者外在的支持力量. 当一个区域的人口增长短期内没有明显的约束时, 采用指数预测方式; 当人口增长以资源掠夺式增长时, 采用双曲函数形式; 当环境的作用随着时间而衰减时, 采用反S 曲线模型; 当系统的内力先起作用、外在的约束
力量由小到达逐渐发生作用时, 采用Logistic 方程.
经验表明, 一个国家的城市人口、国家现代化过程中的突发城市(shock city ) 的人口[7,8]等通常具有指数增长特征; 世界总人口在一定时期内明显满足双曲增长曲线[3], 作者还发现一个城市的非农业人口等也可用双曲增长函数拟合, 而这两种情况都可以借助反S 形曲线给出更精确的预测结果; 一个国家的总人口通常满足Logisitc 方程[3]———特别是, 一个国家的城市人口比重在理论上满足Logistic 曲线[2, 9211].
社,2003.
[8] Knox P L , Marston S A. Places and Regions in G lobal
Context :Human Geography[M ].Upper Saddle River , NJ :Prentice Hall , 1998.
[9] Karmeshu. Demographic models of urbanization [J ].
456华中师范大学学报(自然科学版)
Environment and Planning B :Planning and Design , 1988, 15(1) :47254.
16(3) :2892295.
第40卷
[11] 陈彦光, 周一星. 城市化Logistic 过程的阶段划分及其空间
[10] Rao D N , Karmeshu J ain V P. Dynamics of urbanization :
t he empirical validation of t he replacement hypot hesis [J].Environment and Planning B :Planning and Design , 1989,
解释———对Nort ham 曲线的修正与发展[J].经济地理,
2005, 25(6) :8172822.
Three models for predicting population grow th
———Theoretical foundation , application met hods , and revised ressions
CH EN Yanguang 1, Bin 2,3
(1. Department of Geography , Peking ;
2. College of Urban and Environmental Science , , 430079; 3. Department of Urban and , , Xinyang , Henan 464000)
Abstract :are always employed to predict t he growt h
of or pop , including exponential f unction (Malt hus model ) , f (Keyfitz model ) , and logistic f unction (Verhulst model ) . All t t hree models originate from logistic equation , but under different conditions. The logic relations and distinctions between t he t hree models are expounded and a new model used for pop ulation p redict is derived f rom t he same mat hematic source in t he form :1/P (t ) =1/P 1-blnt , which in fact defines an ’inverse S 2shaped curve’.The Keyfitz model t urns out to be t he " approximator" of t he inverse S 2f unction advanced by t he aut hor. In addition , a new model based on t he hyperbola wit h power is given as 1/P (t ) =1/P 1-b α, where αis a parameter. Three set s of data and t he corresponding analytical result s are taken as examples to illust rate t he models and while showing how to use t he prediction met hods correctly.
K ey w ords :pop ulation growt h ; exponential model ; logistic curve ; hyperbolic growt h ; inverse S 2curve