气 象 科 技第32卷第5期Vol.32,No.5
2004年10月Oct.,2004METEOROLOGICALSCIENCEANDTECHNOLOGY
气温数据栅格化中的几个具体问题
廖顺宝 李泽辉
(中国科学院地理科学与资源研究所,北京100101)
摘要 用地理信息系统软件ARC/INFO及4种空间插值方法,对中国617个气象站30年平均气温数据和1961年平均气温数据的栅格化试验发现,克立格插值方法的精度最高,反距离权重法次之,样条插值法的精度第三,趋势面插值方法的精度最低。利用多年平均气温数据和年平均气温的距平值进行气温数据的栅格化,虽然可以减少分析和计算量,但栅格化结果的精度比利用年平均气温数据直接进行栅格化的精度要低。气象站的实际高程与气象站经纬度对应的数字高程(DEM)上的高程不完全一致,但气温数据的栅格化完全依赖于DEM,用气象站实际高程建模进行气温数据栅格化的精度比用与气象站经纬度对应的DEM上的高程建模进行气温数据栅格化的精度要高。关键词 气温 栅格化 内插方法 数字高程 距平值
引言
气温是重要的气候资源,气温数据主要是通过分布在全国范围内的气象观测站的长期连续观测获得。然而,气象站的观测气温值只能代表气象站所在地区(面积非常有限)的气温状况,对于广大非气象站所在地区的气温,只能通过推算求得。
气温数据的栅格化[1~4]是推算非气象站所在地区气温的有效手段之一。气温数据的栅格化涉及空间插值、数字高程模型的应用以及回归分析[5~6]等一些最基本的问题。空间插值有不同的方法[7],哪种插值方法更加适合气温数据的栅格化?数字高程模型上的高程值往往与气象站的实际海拔高度不一致,而气温数据的栅格化又必须依赖于DEM(DigitalElevationModel),在栅格化分析建模过程中究竟使用哪种高程值更加准确可靠?另外,是否能用多年平均气温数据和(某年的)气温距平值进行年平均气温数据的栅格化?本文将对上述问题进行分析、试验和探讨。
1 数据资料及预处理
111 数据资料
(1)中国30年(1951~1980年)的年平均气温
数据,共有624个台站的数据。
(2)中国1961年年平均气温数据,共有650个气象站的数据记录,每条记录包括气象站的名称、编号、经度、纬度、海拔高度和年平均气温等数据项。
(3)中国30″分辨率数字高程数据(经纬度坐标)。112 数据预处理
(1)气象站资料与DEM数据复合。由于数据空间坐标的误差,在ARC/INFO中用气象站的经纬度数据与DEM数据复合时,有7个气象站点落在了DEM的无值区域(主要是几个位于海岛上的气象站)。本文主要进行气温数据栅格化中的基本问题探讨,因此,在进行数据分析时去掉了这7个气象站。
(2)气温资料的一致性处理。根据气象站编码一一对应的原则,从30年平均气温数据和1961年年平均气温数据中选择出在二者中均有记录的数据,共599条记录。
国家科技基础性工作专项资金课题(2001DEA30027-9)和中国科学院知识创新工程项目(INF105-SDB-1-18)及中日合作课题“全
(AIM/Impact)共同资助球变化对中国的影响研究”
作者简介:廖顺宝,男,1966生,博士,副研究员,硕士生导师,主要从事遥感与地理信息系统应用以及属性数据空间化等方面的研究,
E2mail:[email protected]
收稿日期:2003年8月1日;定稿日期:2003年9月30日
(3)选择验证气象站。根据均匀分布的原则从
表1 4种空间插值方法直接用于气温数据内插的比较
判断参数
相关系数标准误差/℃平均误差/℃
反距离权重克立格插值样条插值趋势面插值[***********][***********][**************]8
全国617个气象站中选择57个气象站用于气温数
据栅格化结果的验证,它们在1951~1980的30年平均气温数据和1961年的年平均气温数据中均有记录。用于检验的57个气象站是:海拉尔市、北安市、齐齐哈尔、依兰、吉木乃、精河、巴仑台、柯坪、民丰、巴里坤哈、安西、山丹、格尔木市、兴海、榆中、苏尼特左、百灵庙、盐池、太原市、安阳市、通榆、林西、九站、宝国图、沈阳市、通化市、张家口市、营口市、唐山市、沂源、拉萨市、玉树、红原、雅安市、德荣、华坪、盘县、临沧、西安市、宝丰、巴东、南充、天门市、桐梓、铜仁、宁冈、桂林市、亳州市、南京市、慈溪市、景德镇市、龙泉、龙岩市、连平、百色市、罗定和琼中。2 几个具体问题分析
211 几种常用空间插值方法的比较
ARC/INFO是最专业的地理信息系统软件之
所谓“多元回归+内插残差”的气温数据栅格化
方法,是首先以气象站(560个)的气温值为输出变量,以气象站的经度、纬度和海拔高度为输入变量进行多元回归分析并建立回归方程,同时得到每个气象站的气温残差。将气温残差进行空间插值后再加上回归方程的计算结果即得到栅格化的气温数据。4种空间插值方法在57个验证站上的检验结果见
一,它提供的常用的空间插值方法包括反距离权重(IDW)插值、样条(Spline)插克立格(Kriging)插值、
值和趋势面(Trend)插值等。对于气温数据的栅格化,究竟哪种插值方法最好?下面以全国1951~1980年间的30年多年平均气温数据为例进行试验。共有617个气象站的数据,用其中560个站的数据进行气温数据栅格化的建模和计算,用其余57个站的数据对栅格化结果进行检验,从而判断哪种插值方法最好。
关于气温数据栅格化的方法,相关文献[4]已有研究,其结果是“多元回归+内插残差”的方法要明显好于“气温数据直接内插”的方法。为了说明4种空间插值方法在气温数据栅格化中的优劣,将4种插值方法同时应用于两种栅格化方法中,并对结果进行分析和比较。
直接内插法是根据全国560个气象站的经度、纬度和气温值,在ARC/INFO中直接使用4种空间插值函数内插生成全国30″×30″分辨率的栅格气温数据。用57个验证站(它们没有参加插值运算)的实测数据进行验证,结果见表1。为增加判断的可靠性,除了用计算气温值与实测气温值之间的相关系数和标准误差作为判断参数外,再增加平均误差作为判断参数之一。平均误差的定义为:验证站计算气温值与实测气温值之差的绝对值再取平均值(下同)。
表2。
从表1和表2可以看出,4种插值方法不论是直接用于气温数据的直接内插还是对回归分析的气温残差进行内插,反距离权重内插法和克立格插值法都具有较高的精度,样条插值法的精度次之,趋势面插值的精度最低。从气温数据栅格化的实际(通常用“多元回归+内插残差”的方法而不是“气温数据直接内插”方法)出发,4种插值方法的优劣顺序为:克立格插值法、反距离权重法、样条插值法和趋势面插值法。
表2 4种空间插值方法用于气温残差内插的比较
反距离权重克立格插值样条插值趋势面插值
相关系数标准误差/℃平均误差/℃
0.9881.030.62
0.9900.960.62
0.9851.170.72
0.9841.183.20
2.2 距平值在气温数据栅格化中的应用探讨
相对于年气温而言,多年平均气温在空间上的变化更加趋于平稳。年平均气温与多年平均气温的差称为气温的距平,气温距平值在气候长期变化研究中具有重要作用。
根据“多元回归+内插残差”的方法进行气温数据的栅格化,需要对每年(或每月)的数据进行回归分析和建立相应的回归方程,因为每年(或每月)的情况都是不一样的。这样,在进行栅格化气温数据产品的生产时就显得比较繁琐,那么是否能够采取一种比较简单的方法,即只对多年平均气温数据建立回归方程和对残差进行内插,其它任何年都使用该回归方程和内插后的残差,同时计算该年年平均气温与多年平均气温的距平值并在空间上进行内插,最后再加上栅格化的多年平均气温就得到该年
的栅格化气温。下面以全国542个气象站的30年(1951~1980年)平均气温和1961年年平均气温为例进行1961年年平均气温数据的栅格化,以另外57个气象站的实测气温值进行验证。
(1)多年平均栅格化气温+当年栅格化气温距平全国30年年平均气温(542站)与气象站经度、纬度和海拔高度的多元回归方程为:
T30=55.29-0.1487X-0.7032Y-0.0044Z(1)式中,X、Y、Z表示气象站的经度、纬度和海拔高度,单位分别为度、度和m(下同)。
用该回归方程计算出全国范围内的栅格气温,同时将回归残差和1961年气温距平值进行空间内插(本次试验用IDW内插法),三者求和得到1961年的栅格化气温数据
(2)当年平均气温直接栅格化
全国1961年平均气温(542站)与气象站经度、纬度和海拔高度的多元回归方程为:
T1961=53.66-0.1320X-0.6925Y-0.0045Z(2)
用该回归方程计算出全国范围内的栅格气温,同时将回归残差进行空间内插(IDW内插法),二者求和得到1961年的栅格化气温数据
将上述两种方法得到的57个验证气象站的计算气温分别与实测气温进行比较和分析,结果见表3。
表3 两种栅格化方法在57个验证站上的比较
当年回归计算结果+
当年残差
相关系数标准误差/℃平均误差/℃
0.9881.020.62
多年回归计算结果+多年残差+当年距平值
0.9871.040.66
从表3可以发现,仅用当年的气温数据进行栅格化比用多年平均气温数据和气温距平值进行栅格化的精度要高。图1是通过两种栅格化方法计算得到的1961年平均气温与实测平均气温的关系图
。
图1 用两种栅格化方法计算得到的1961年年平均气温与实测年平均气温的关系
213 DEM数据误差对栅格化结果的影响
在进行气温数据栅格化的过程中,DEM数据是非常重要的参数之一,因为气温随高程的变化而发
生规律性的变化。气象部门提供气象数据时也会提供每个气象站的海拔高度,但由于种种原因,气象部
门提供的高程与通过气象站经纬度从DEM上查询到的高程往往不一致,表4为全国617个气象站实际海拔高度与气象站相应经纬度上DEM高度的差异情况。
表4 气象站的实际高度与相应经纬度DEM上高度的误差
0~10
10~2014223.01
20~5014022.69
误差绝对值范围/m
50~100100~200
477.62
223.57
200~500193.08
6
>5000.97
气象站个数
所占百分比/%
24139.06
从理论上讲,气象部门提供的气象站高程要比DEM上的气象站高程准确,但在气温数据栅格化的
门提供的气象站的高程相对于整个国土面积来说毕竟是非常有限的点。因此,在建立回归方程时究竟
是使用气象站实际高程还是使用DEM上的高程值
过程中使用的高程数据为DEM数据,因为气象部
得进一步分析。
仍以全国560个气象站30年(1951~1980年)平均气温数据为例,分别以两种高程进行多元回归分析,回归分析所得到的参数列于表5。
表5 气象站实际高程和相应经纬度DEM高程分析结果
回归分析所用高程
气象站实际高度
相关系数
标准误差/℃平均误差/℃
0.9831.290.97P
表6 基于气象站实际高程和相应经纬度DEM高程的气温栅格化结果与实测气温的比较
回归分析所用高程
气象站实际高度气象站所在经纬度的DEM高度
相关系数标准误差/℃平均误差/℃
0.98331.220.72
0.98291.340.70
气象站所在经纬度的DEM高度
0.9811.381.04
从表5可以看出,用气象站的实际高程进行多元回归,不论是相关系数还是误差均比用DEM上的高程进行多元回归要好(但相差不大),这也在一定程度上证明了气象部门提供的气象站高度值比相应经纬度上DEM的高度值要准确一些。而从表6得到的信息是,用基于气象站实际高度所建回归模型进行气温数据栅格化的精度也比用基于相应经纬度DEM上的高度所建回归模型进行气温数据栅格化的精度略高,但同样是相差不大。图2是基于两种高程模型所计算的多年平均气温与实测多年平均气温的关系
。
注:平均误差为残差绝对值取均值
相应的回归方程分别为:
T1=55.09-0.1452X-0.7079Y-0.0044ZT2=55.23-0.1473X-0.7074Y-0.0043Z
(3)(4)
用基于两种高程建立的回归方程和相应残差分别进行气温数据的栅格化,并把57个验证站上的栅格化气温值与其实测气温值进行比较和分析,结果见表6。
图2 基于两种高程的模型计算的多年平均气温与实测多年平均气温的关系
3 结论与讨论
本文基于1951~1980年30年的平均气温和
1961年的年平均气温以及DEM数据,利用ARC/INFO地理信息系统软件和EXCEL数据处理分析软件,对气温数据栅格化中的几种空间插值方法、气温距平值在气温数据空间化中的应用以及DEM的数据误差对气温数据栅格化结果的影响等问题进行了分析和试验,得到以下结论。
(1)反距离权重插值、克立格插值、样条插值和趋势面插值等4种空间插值方法应用于气温数据栅
格化时,克立格插值方法的精度最高,反距离权重法
次之,样条插值法的精度第3,趋势面插值方法的精度最低。因此,在具体的气温数据栅格化过程时,建议使用前2种插值方法。
(2)基于多年平均气温,通过内插气温距平值的方法也可以进行年平均气温的栅格化。这种方法的优点是不需要对每年的数据完整地进行栅格化,而只需对多年平均气温数据进行完整的栅格化和对当年的气温距平值进行内插,因此减少了数据处理和计算的工作量,但栅格化结果的精度比完全用当年的数据进行栅格化的精度要低。相反,完全基于当年的数据进行栅格化,虽然工作量要大一些,但结果
的精度要高一些。
多年平均气温的气象站点数往往与某一年气温数据的气象站点数据不一致(一般是要少),因此,基于多年平均气温进行气温数据的栅格化往往要使样本数降低,这也是精度降低的原因之一。同时,一些气象站位置(经度、纬度和海拔高度)的变动(但名称和编码不变)信息也很难在多年平均气温的记录中得到反映,有时,同一气象站在多年平均气温数据和年平均气温数据中的坐标并不完全一致。因此,从方便和实用的角度出发,仅用当年的数据(而不用多年平均气温数据)进行栅格化更具可操作性,而一些重复性的工作可以通过程序让计算机完成。
(3)尽管气温数据的栅格化完全依赖于DEM,但在栅格化建模过程中,使用气象站的实际高程比使用与气象站经纬度对应的DEM上的高程,其结果的精度要高。用DEM的高程值建模进行栅格化,尽管可以把气象站所在点的气温值恢复到与实测值一致,但总体上的精度降低了;相反,用气象站
的实际高程值建模进行栅格化,虽然因气象站实际高程与DEM之间的差异而不能把气象站所在点的气温值恢复到与实测值完全一致,但在广大的非气象站所在地区的总体精度提高了。参考文献
1 孙和平,罗少聪.中国及其邻区地表气象数据预处理和网格化数
值结果分析.地壳形变与地震,1998,18(3):51-56
2 周锁全,缪起龙,吴战平.山区平均气温细网格插值方法的比较.
南京气象学院学报,1994,17(4):488-492
3 廖顺宝,李泽辉.基于GIS的定位观测数据空间化.地理科学进
展,2003,22(1):87-93
4 廖顺宝,李泽辉,游松财.气温数据栅格化的方法及其比较.资
源科学,2003,25(6):75-80
5 董蕙青.回归分析中因子问题的探讨.广东气象,1998,4(增2):
74-76
6 赵仲莲,王澄海.回归分析在气象应用中的一些问题和进展.甘
肃科学学报,1996,8(2):94-96
7 李新,程国栋,卢玲.空间内插方法比较.地球科学进展,2000,15
(5):571-575
SomePracticalProblemsRelatedtoRasterizationofAirTemperature
LiaoShunbao LiZehui
(InstituteofGeographicalSciencesandNaturalResourcesResearch,CAS,Beijing100101)
Abstract:Throughanexperimentofrasterizationfor302yearmeanairtemperatureand1961’smeanairtemperaturedatafrom617meteorologicalstationsinChinawithARC/INFOandfourinterpolationmethods,itwasfoundthattheKrigingmethodresultedinthehighestprecision,IDWmethodthesecond,Splinemethodthethird,Trendmethodthelowest.Theperennialmeanairtemperatureandannualtemperatureanomalycanbeusedtorasterizeannualairtemperaturedata.Thismethodwillresultinlessanalysisandcomputationbutlowerprecisioncomparedwiththerasterizationusingannualmeanairtemperaturedataonly.Thereisdifferencebetweenmeteorologicalstations’actualelevationandtheDEM(DigitalElevationModel)valuescorrespondingtothemeteorologicalstations’longitudesandlatitudes.RasterizationofairtemperaturedatareliesDEMfully.However,themodelbasedonmeteorologicalstations’actualelevationwillresultinhigherprecisionforrasterizationofairtemperaturedatathanthatbasedontheDEMvaluescorrespondingtometeorologicalstations’longitudesandlatitudes.
Keywords:airtemperature,rasterization,interpolation,DigitalElevationModel,annualtemperatureanomaly
气 象 科 技第32卷第5期Vol.32,No.5
2004年10月Oct.,2004METEOROLOGICALSCIENCEANDTECHNOLOGY
气温数据栅格化中的几个具体问题
廖顺宝 李泽辉
(中国科学院地理科学与资源研究所,北京100101)
摘要 用地理信息系统软件ARC/INFO及4种空间插值方法,对中国617个气象站30年平均气温数据和1961年平均气温数据的栅格化试验发现,克立格插值方法的精度最高,反距离权重法次之,样条插值法的精度第三,趋势面插值方法的精度最低。利用多年平均气温数据和年平均气温的距平值进行气温数据的栅格化,虽然可以减少分析和计算量,但栅格化结果的精度比利用年平均气温数据直接进行栅格化的精度要低。气象站的实际高程与气象站经纬度对应的数字高程(DEM)上的高程不完全一致,但气温数据的栅格化完全依赖于DEM,用气象站实际高程建模进行气温数据栅格化的精度比用与气象站经纬度对应的DEM上的高程建模进行气温数据栅格化的精度要高。关键词 气温 栅格化 内插方法 数字高程 距平值
引言
气温是重要的气候资源,气温数据主要是通过分布在全国范围内的气象观测站的长期连续观测获得。然而,气象站的观测气温值只能代表气象站所在地区(面积非常有限)的气温状况,对于广大非气象站所在地区的气温,只能通过推算求得。
气温数据的栅格化[1~4]是推算非气象站所在地区气温的有效手段之一。气温数据的栅格化涉及空间插值、数字高程模型的应用以及回归分析[5~6]等一些最基本的问题。空间插值有不同的方法[7],哪种插值方法更加适合气温数据的栅格化?数字高程模型上的高程值往往与气象站的实际海拔高度不一致,而气温数据的栅格化又必须依赖于DEM(DigitalElevationModel),在栅格化分析建模过程中究竟使用哪种高程值更加准确可靠?另外,是否能用多年平均气温数据和(某年的)气温距平值进行年平均气温数据的栅格化?本文将对上述问题进行分析、试验和探讨。
1 数据资料及预处理
111 数据资料
(1)中国30年(1951~1980年)的年平均气温
数据,共有624个台站的数据。
(2)中国1961年年平均气温数据,共有650个气象站的数据记录,每条记录包括气象站的名称、编号、经度、纬度、海拔高度和年平均气温等数据项。
(3)中国30″分辨率数字高程数据(经纬度坐标)。112 数据预处理
(1)气象站资料与DEM数据复合。由于数据空间坐标的误差,在ARC/INFO中用气象站的经纬度数据与DEM数据复合时,有7个气象站点落在了DEM的无值区域(主要是几个位于海岛上的气象站)。本文主要进行气温数据栅格化中的基本问题探讨,因此,在进行数据分析时去掉了这7个气象站。
(2)气温资料的一致性处理。根据气象站编码一一对应的原则,从30年平均气温数据和1961年年平均气温数据中选择出在二者中均有记录的数据,共599条记录。
国家科技基础性工作专项资金课题(2001DEA30027-9)和中国科学院知识创新工程项目(INF105-SDB-1-18)及中日合作课题“全
(AIM/Impact)共同资助球变化对中国的影响研究”
作者简介:廖顺宝,男,1966生,博士,副研究员,硕士生导师,主要从事遥感与地理信息系统应用以及属性数据空间化等方面的研究,
E2mail:[email protected]
收稿日期:2003年8月1日;定稿日期:2003年9月30日
(3)选择验证气象站。根据均匀分布的原则从
表1 4种空间插值方法直接用于气温数据内插的比较
判断参数
相关系数标准误差/℃平均误差/℃
反距离权重克立格插值样条插值趋势面插值[***********][***********][**************]8
全国617个气象站中选择57个气象站用于气温数
据栅格化结果的验证,它们在1951~1980的30年平均气温数据和1961年的年平均气温数据中均有记录。用于检验的57个气象站是:海拉尔市、北安市、齐齐哈尔、依兰、吉木乃、精河、巴仑台、柯坪、民丰、巴里坤哈、安西、山丹、格尔木市、兴海、榆中、苏尼特左、百灵庙、盐池、太原市、安阳市、通榆、林西、九站、宝国图、沈阳市、通化市、张家口市、营口市、唐山市、沂源、拉萨市、玉树、红原、雅安市、德荣、华坪、盘县、临沧、西安市、宝丰、巴东、南充、天门市、桐梓、铜仁、宁冈、桂林市、亳州市、南京市、慈溪市、景德镇市、龙泉、龙岩市、连平、百色市、罗定和琼中。2 几个具体问题分析
211 几种常用空间插值方法的比较
ARC/INFO是最专业的地理信息系统软件之
所谓“多元回归+内插残差”的气温数据栅格化
方法,是首先以气象站(560个)的气温值为输出变量,以气象站的经度、纬度和海拔高度为输入变量进行多元回归分析并建立回归方程,同时得到每个气象站的气温残差。将气温残差进行空间插值后再加上回归方程的计算结果即得到栅格化的气温数据。4种空间插值方法在57个验证站上的检验结果见
一,它提供的常用的空间插值方法包括反距离权重(IDW)插值、样条(Spline)插克立格(Kriging)插值、
值和趋势面(Trend)插值等。对于气温数据的栅格化,究竟哪种插值方法最好?下面以全国1951~1980年间的30年多年平均气温数据为例进行试验。共有617个气象站的数据,用其中560个站的数据进行气温数据栅格化的建模和计算,用其余57个站的数据对栅格化结果进行检验,从而判断哪种插值方法最好。
关于气温数据栅格化的方法,相关文献[4]已有研究,其结果是“多元回归+内插残差”的方法要明显好于“气温数据直接内插”的方法。为了说明4种空间插值方法在气温数据栅格化中的优劣,将4种插值方法同时应用于两种栅格化方法中,并对结果进行分析和比较。
直接内插法是根据全国560个气象站的经度、纬度和气温值,在ARC/INFO中直接使用4种空间插值函数内插生成全国30″×30″分辨率的栅格气温数据。用57个验证站(它们没有参加插值运算)的实测数据进行验证,结果见表1。为增加判断的可靠性,除了用计算气温值与实测气温值之间的相关系数和标准误差作为判断参数外,再增加平均误差作为判断参数之一。平均误差的定义为:验证站计算气温值与实测气温值之差的绝对值再取平均值(下同)。
表2。
从表1和表2可以看出,4种插值方法不论是直接用于气温数据的直接内插还是对回归分析的气温残差进行内插,反距离权重内插法和克立格插值法都具有较高的精度,样条插值法的精度次之,趋势面插值的精度最低。从气温数据栅格化的实际(通常用“多元回归+内插残差”的方法而不是“气温数据直接内插”方法)出发,4种插值方法的优劣顺序为:克立格插值法、反距离权重法、样条插值法和趋势面插值法。
表2 4种空间插值方法用于气温残差内插的比较
反距离权重克立格插值样条插值趋势面插值
相关系数标准误差/℃平均误差/℃
0.9881.030.62
0.9900.960.62
0.9851.170.72
0.9841.183.20
2.2 距平值在气温数据栅格化中的应用探讨
相对于年气温而言,多年平均气温在空间上的变化更加趋于平稳。年平均气温与多年平均气温的差称为气温的距平,气温距平值在气候长期变化研究中具有重要作用。
根据“多元回归+内插残差”的方法进行气温数据的栅格化,需要对每年(或每月)的数据进行回归分析和建立相应的回归方程,因为每年(或每月)的情况都是不一样的。这样,在进行栅格化气温数据产品的生产时就显得比较繁琐,那么是否能够采取一种比较简单的方法,即只对多年平均气温数据建立回归方程和对残差进行内插,其它任何年都使用该回归方程和内插后的残差,同时计算该年年平均气温与多年平均气温的距平值并在空间上进行内插,最后再加上栅格化的多年平均气温就得到该年
的栅格化气温。下面以全国542个气象站的30年(1951~1980年)平均气温和1961年年平均气温为例进行1961年年平均气温数据的栅格化,以另外57个气象站的实测气温值进行验证。
(1)多年平均栅格化气温+当年栅格化气温距平全国30年年平均气温(542站)与气象站经度、纬度和海拔高度的多元回归方程为:
T30=55.29-0.1487X-0.7032Y-0.0044Z(1)式中,X、Y、Z表示气象站的经度、纬度和海拔高度,单位分别为度、度和m(下同)。
用该回归方程计算出全国范围内的栅格气温,同时将回归残差和1961年气温距平值进行空间内插(本次试验用IDW内插法),三者求和得到1961年的栅格化气温数据
(2)当年平均气温直接栅格化
全国1961年平均气温(542站)与气象站经度、纬度和海拔高度的多元回归方程为:
T1961=53.66-0.1320X-0.6925Y-0.0045Z(2)
用该回归方程计算出全国范围内的栅格气温,同时将回归残差进行空间内插(IDW内插法),二者求和得到1961年的栅格化气温数据
将上述两种方法得到的57个验证气象站的计算气温分别与实测气温进行比较和分析,结果见表3。
表3 两种栅格化方法在57个验证站上的比较
当年回归计算结果+
当年残差
相关系数标准误差/℃平均误差/℃
0.9881.020.62
多年回归计算结果+多年残差+当年距平值
0.9871.040.66
从表3可以发现,仅用当年的气温数据进行栅格化比用多年平均气温数据和气温距平值进行栅格化的精度要高。图1是通过两种栅格化方法计算得到的1961年平均气温与实测平均气温的关系图
。
图1 用两种栅格化方法计算得到的1961年年平均气温与实测年平均气温的关系
213 DEM数据误差对栅格化结果的影响
在进行气温数据栅格化的过程中,DEM数据是非常重要的参数之一,因为气温随高程的变化而发
生规律性的变化。气象部门提供气象数据时也会提供每个气象站的海拔高度,但由于种种原因,气象部
门提供的高程与通过气象站经纬度从DEM上查询到的高程往往不一致,表4为全国617个气象站实际海拔高度与气象站相应经纬度上DEM高度的差异情况。
表4 气象站的实际高度与相应经纬度DEM上高度的误差
0~10
10~2014223.01
20~5014022.69
误差绝对值范围/m
50~100100~200
477.62
223.57
200~500193.08
6
>5000.97
气象站个数
所占百分比/%
24139.06
从理论上讲,气象部门提供的气象站高程要比DEM上的气象站高程准确,但在气温数据栅格化的
门提供的气象站的高程相对于整个国土面积来说毕竟是非常有限的点。因此,在建立回归方程时究竟
是使用气象站实际高程还是使用DEM上的高程值
过程中使用的高程数据为DEM数据,因为气象部
得进一步分析。
仍以全国560个气象站30年(1951~1980年)平均气温数据为例,分别以两种高程进行多元回归分析,回归分析所得到的参数列于表5。
表5 气象站实际高程和相应经纬度DEM高程分析结果
回归分析所用高程
气象站实际高度
相关系数
标准误差/℃平均误差/℃
0.9831.290.97P
表6 基于气象站实际高程和相应经纬度DEM高程的气温栅格化结果与实测气温的比较
回归分析所用高程
气象站实际高度气象站所在经纬度的DEM高度
相关系数标准误差/℃平均误差/℃
0.98331.220.72
0.98291.340.70
气象站所在经纬度的DEM高度
0.9811.381.04
从表5可以看出,用气象站的实际高程进行多元回归,不论是相关系数还是误差均比用DEM上的高程进行多元回归要好(但相差不大),这也在一定程度上证明了气象部门提供的气象站高度值比相应经纬度上DEM的高度值要准确一些。而从表6得到的信息是,用基于气象站实际高度所建回归模型进行气温数据栅格化的精度也比用基于相应经纬度DEM上的高度所建回归模型进行气温数据栅格化的精度略高,但同样是相差不大。图2是基于两种高程模型所计算的多年平均气温与实测多年平均气温的关系
。
注:平均误差为残差绝对值取均值
相应的回归方程分别为:
T1=55.09-0.1452X-0.7079Y-0.0044ZT2=55.23-0.1473X-0.7074Y-0.0043Z
(3)(4)
用基于两种高程建立的回归方程和相应残差分别进行气温数据的栅格化,并把57个验证站上的栅格化气温值与其实测气温值进行比较和分析,结果见表6。
图2 基于两种高程的模型计算的多年平均气温与实测多年平均气温的关系
3 结论与讨论
本文基于1951~1980年30年的平均气温和
1961年的年平均气温以及DEM数据,利用ARC/INFO地理信息系统软件和EXCEL数据处理分析软件,对气温数据栅格化中的几种空间插值方法、气温距平值在气温数据空间化中的应用以及DEM的数据误差对气温数据栅格化结果的影响等问题进行了分析和试验,得到以下结论。
(1)反距离权重插值、克立格插值、样条插值和趋势面插值等4种空间插值方法应用于气温数据栅
格化时,克立格插值方法的精度最高,反距离权重法
次之,样条插值法的精度第3,趋势面插值方法的精度最低。因此,在具体的气温数据栅格化过程时,建议使用前2种插值方法。
(2)基于多年平均气温,通过内插气温距平值的方法也可以进行年平均气温的栅格化。这种方法的优点是不需要对每年的数据完整地进行栅格化,而只需对多年平均气温数据进行完整的栅格化和对当年的气温距平值进行内插,因此减少了数据处理和计算的工作量,但栅格化结果的精度比完全用当年的数据进行栅格化的精度要低。相反,完全基于当年的数据进行栅格化,虽然工作量要大一些,但结果
的精度要高一些。
多年平均气温的气象站点数往往与某一年气温数据的气象站点数据不一致(一般是要少),因此,基于多年平均气温进行气温数据的栅格化往往要使样本数降低,这也是精度降低的原因之一。同时,一些气象站位置(经度、纬度和海拔高度)的变动(但名称和编码不变)信息也很难在多年平均气温的记录中得到反映,有时,同一气象站在多年平均气温数据和年平均气温数据中的坐标并不完全一致。因此,从方便和实用的角度出发,仅用当年的数据(而不用多年平均气温数据)进行栅格化更具可操作性,而一些重复性的工作可以通过程序让计算机完成。
(3)尽管气温数据的栅格化完全依赖于DEM,但在栅格化建模过程中,使用气象站的实际高程比使用与气象站经纬度对应的DEM上的高程,其结果的精度要高。用DEM的高程值建模进行栅格化,尽管可以把气象站所在点的气温值恢复到与实测值一致,但总体上的精度降低了;相反,用气象站
的实际高程值建模进行栅格化,虽然因气象站实际高程与DEM之间的差异而不能把气象站所在点的气温值恢复到与实测值完全一致,但在广大的非气象站所在地区的总体精度提高了。参考文献
1 孙和平,罗少聪.中国及其邻区地表气象数据预处理和网格化数
值结果分析.地壳形变与地震,1998,18(3):51-56
2 周锁全,缪起龙,吴战平.山区平均气温细网格插值方法的比较.
南京气象学院学报,1994,17(4):488-492
3 廖顺宝,李泽辉.基于GIS的定位观测数据空间化.地理科学进
展,2003,22(1):87-93
4 廖顺宝,李泽辉,游松财.气温数据栅格化的方法及其比较.资
源科学,2003,25(6):75-80
5 董蕙青.回归分析中因子问题的探讨.广东气象,1998,4(增2):
74-76
6 赵仲莲,王澄海.回归分析在气象应用中的一些问题和进展.甘
肃科学学报,1996,8(2):94-96
7 李新,程国栋,卢玲.空间内插方法比较.地球科学进展,2000,15
(5):571-575
SomePracticalProblemsRelatedtoRasterizationofAirTemperature
LiaoShunbao LiZehui
(InstituteofGeographicalSciencesandNaturalResourcesResearch,CAS,Beijing100101)
Abstract:Throughanexperimentofrasterizationfor302yearmeanairtemperatureand1961’smeanairtemperaturedatafrom617meteorologicalstationsinChinawithARC/INFOandfourinterpolationmethods,itwasfoundthattheKrigingmethodresultedinthehighestprecision,IDWmethodthesecond,Splinemethodthethird,Trendmethodthelowest.Theperennialmeanairtemperatureandannualtemperatureanomalycanbeusedtorasterizeannualairtemperaturedata.Thismethodwillresultinlessanalysisandcomputationbutlowerprecisioncomparedwiththerasterizationusingannualmeanairtemperaturedataonly.Thereisdifferencebetweenmeteorologicalstations’actualelevationandtheDEM(DigitalElevationModel)valuescorrespondingtothemeteorologicalstations’longitudesandlatitudes.RasterizationofairtemperaturedatareliesDEMfully.However,themodelbasedonmeteorologicalstations’actualelevationwillresultinhigherprecisionforrasterizationofairtemperaturedatathanthatbasedontheDEMvaluescorrespondingtometeorologicalstations’longitudesandlatitudes.
Keywords:airtemperature,rasterization,interpolation,DigitalElevationModel,annualtemperatureanomaly