2005年
青海师范大学学报(自然科学版) 2005
第2期Journal of Qinghai N ormal University (Natural Science ) N o. 2
化学数据的一元线性回归分析
才让加
(青海师范大学民族师范学院, 青海西宁 810008)
摘 要:本文利用实验数据建立一元线性回归方程; 回归直线, 并用方差分析法和相关系数法检验方程的有效性。关键词:实验数据; 一元线性回归方程; 回归直线; 方差分析法; 相关系数; 有效性
中图分类号:O21211 文献标识码:A 文章编号:1001-7542(2005) 02-0013-03
在分析化学中, 通过大量的观测数据, 可以发现彼此有关系的量变之间存在着统计规律性, 如以邻二氮菲络合物的吸光度为例, 采用分光光度法测得的邻二氮菲铁络合物的吸光度值见表1。
表1 Fe 2+—邻二氮菲络合物标准系列的吸光度值(λ=510nm )
Fe 2+(μg/mol ) x
y
015001095
110001188
2100010380
310001560
4510001937
若吸光———浓度的直线通过所有的实验点, ,
特别是实验点比较分散时, 变量值, , , 这样可以得到对各实验点的误差最小的直线, 。
1 1. 1 一元线性回归方程的确定
以浓度x 为自变量, 吸光度y 为因变量, 设有多个实验点, x 1y 1、x 2y 2、x 3y 3……x n y n , 则线性回归方程可用下式表示:
y =a +bx
式中a 为截距, b 为回归系数, 只要参数a 、b 确定了回归方程也就确定了, 参数a 、b 确定的依据是:使实验测定值y i 与相应的回归直线上的理论响应值Y i 之差的平方和∑(y i -Y i ) 2为最小, 即最小二
i =1n
乘法, 因此, 根据这个原理, 用求极值的方法导出a 和b 的计算式:
() () ∑x ∑x ∑y b == 式中x =, y =则:22
n n n ∑x i -(∑x i ) ∑x 2i -n x 2a = y -b x
—
由一组实验值算出a 和b 值, 就可以确定出回归方程, 回归方程的具体计算步骤通常是列表进行
(见表2) 。
n =6 x =2158 y =01487
() () 则:b ===0118722
n ∑x i -(∑x i ) 6×55125-(15150) 2
a =y -b x =01487-01187×2158=010051≈01005
收稿日期:2005-01-10
作者简介:才让加(1963-) , 男(藏族) , 青海贵南人, 青海师范大学副教授.
青海师范大学学报(自然科学版) 2005年1 4
则一元回归方程为:y =01005+01187x
若未知样品的吸光度为01282, 则所测溶液的浓度为:
x ==≈1148(μg/mL )
0118701187
表2 回归方程计算表
编号
123456
x i
y i
xi 2
yi 2
xiyi
[***********][1**********]
[***********][**************]14
[***********][1**********]25
[***********][**************]2
[***********][**************]30
∑
1. 2 作回归线
根据上述回归方程找出两点:( x , y ) =(2158, 01487) ; (O , y o ) =(0, 01005)
作标准曲线即回归线
2 回归方程的有效性检验
2. 1 相关系数检验法
x 一的一条直线=x 和y 间存在某种线性关系时, 。两个变量(x 和y ) 线性关系的密切程度可用相关系数r 来衡量:
2
∑(x ) () 2()
r =2=b 22
∑(x i -x ) 2-∑(y i - y ) n ∑y i -(∑y i ) 相关系数r 的取值范围是0≤|r |≤1, 当|r |=1时表示x 和y 之间完全相关, 此时所有实验点落在回归直线上。当|r |=0时说明x 和y 之间完全没有相关。当|r |在0—1之间时说明x 和y 之间存在不同程度的相关关系。当|r |接近1时说明线性关系越好, r 为正值时为正相关, r 为负值时为负相关。
图1 回归直线(标准直线)
对于上述回归方程的相关系数为:2
r =01187=0. 94
×2102-219142
相关系数的临界值见表3.
表3 相关系数的临界值
f =n -2
置 信 水 平
90%[***********]9
95%[***********]1
99%[***********]7
1234
在上例中f =n -2=5-2=3, 查表可知r 的
临界值为01878, 置信水平为95%, 计算值r =0194>01878, 置信水平应在95%以上, 故回归方程的x 和y 之间存在线性关系。
第2期 才让加:化学数据的一元线性回归分析 15212 方差检验法
回归方程的有效性检验就是对求得的回归方程进行显著性检验, 看它是否真实地反映了变量间的线性关系。通常使用方差分析的思想和方法进行, 运用方差(F ) 检验的方法是判断回归平方和(MS R ) 是否显著大于误差平方和(MS E ) , 若MS R 显著大于MS E , 则表明总变异中回归显著, 亦即X 与Y 的线性关系显著或回归方程显著, 表明回归方程在整体上成立, 进一步检验了变量X 和Y 是否存在线性关系。如上述的回归方程进行方差检验:y =01005+01187x
2=2102-=01605
N 6
22
SS R (回归平方和) =b ∑X -=011872×(55125-40104) =01532N
对所有Y 值而言, 自由度为N -1, 即df T =N -1; df E =N -2; 所以df r =df T -df E =1
2
SS T (总平方和) =∑Y -
SS E (误差平方和) =SS T -SS R =01073; MS R (均方) =MS E (残差平方和) =
==01532df R 1
==010243; F ===211893df E 3MS E 010243
表4 方差分析表
查F 值表得F (0105) (1, 3) =10113; F >F 0105, 方差分析表如下:
变异来源回归
残差总计
自由度
13平方和
[**************]F F 0105(1, 3)
[1**********]
3表示在01X 与Y 之间有显著的线性关系。
3 结论
由以上建立回归方程的过程可知, 在分析化学中, 通过大量的实验数据, 可以找到彼此有关系的变量之间的统计规律, 并可用一定的数学模式来表示量变相关关系, 探讨变量数据之间的统计方法, 建立有效的回归线方程, 可以很方便的对变量进行预测、估算和控制, 有利于化学数据的处理。参考文献:
[1] 张厚粲, 徐建平. 现代心理与教育统计学[M].北京:北京大学出版社,2003,11. [2] 陈焕光, 李涣然. 分析化学实验(第二版) [M].广州:中山大学出版社,1998,9. [3] [德]M.奥托著. 邵学广等译. 化学计量学[M].北京:科学出版社,2003,1. [4] 顾庆超. 化学实验与数据处理导论[M].南京:江苏科学技术出版社,1984,8. [5] 陈希孺, 王松桂. 现代回归分析[M].合肥:安徽教育出版社,1987,4.
The unitary linear regression analysis of chemical data
C AI Rang 2jia
(Qinghai N ormal University , X ining 810008,China )
Abstract :This paper use experimental data to set up linear regression equation with unitary and regression straight line ,T o use variance analysis and related coefficient to test validity of equation.
K ey w ords :experimental data ; regression equation ; regression straight line ; variance analysis ;related coeffi 2cient ; validity
2005年
青海师范大学学报(自然科学版) 2005
第2期Journal of Qinghai N ormal University (Natural Science ) N o. 2
化学数据的一元线性回归分析
才让加
(青海师范大学民族师范学院, 青海西宁 810008)
摘 要:本文利用实验数据建立一元线性回归方程; 回归直线, 并用方差分析法和相关系数法检验方程的有效性。关键词:实验数据; 一元线性回归方程; 回归直线; 方差分析法; 相关系数; 有效性
中图分类号:O21211 文献标识码:A 文章编号:1001-7542(2005) 02-0013-03
在分析化学中, 通过大量的观测数据, 可以发现彼此有关系的量变之间存在着统计规律性, 如以邻二氮菲络合物的吸光度为例, 采用分光光度法测得的邻二氮菲铁络合物的吸光度值见表1。
表1 Fe 2+—邻二氮菲络合物标准系列的吸光度值(λ=510nm )
Fe 2+(μg/mol ) x
y
015001095
110001188
2100010380
310001560
4510001937
若吸光———浓度的直线通过所有的实验点, ,
特别是实验点比较分散时, 变量值, , , 这样可以得到对各实验点的误差最小的直线, 。
1 1. 1 一元线性回归方程的确定
以浓度x 为自变量, 吸光度y 为因变量, 设有多个实验点, x 1y 1、x 2y 2、x 3y 3……x n y n , 则线性回归方程可用下式表示:
y =a +bx
式中a 为截距, b 为回归系数, 只要参数a 、b 确定了回归方程也就确定了, 参数a 、b 确定的依据是:使实验测定值y i 与相应的回归直线上的理论响应值Y i 之差的平方和∑(y i -Y i ) 2为最小, 即最小二
i =1n
乘法, 因此, 根据这个原理, 用求极值的方法导出a 和b 的计算式:
() () ∑x ∑x ∑y b == 式中x =, y =则:22
n n n ∑x i -(∑x i ) ∑x 2i -n x 2a = y -b x
—
由一组实验值算出a 和b 值, 就可以确定出回归方程, 回归方程的具体计算步骤通常是列表进行
(见表2) 。
n =6 x =2158 y =01487
() () 则:b ===0118722
n ∑x i -(∑x i ) 6×55125-(15150) 2
a =y -b x =01487-01187×2158=010051≈01005
收稿日期:2005-01-10
作者简介:才让加(1963-) , 男(藏族) , 青海贵南人, 青海师范大学副教授.
青海师范大学学报(自然科学版) 2005年1 4
则一元回归方程为:y =01005+01187x
若未知样品的吸光度为01282, 则所测溶液的浓度为:
x ==≈1148(μg/mL )
0118701187
表2 回归方程计算表
编号
123456
x i
y i
xi 2
yi 2
xiyi
[***********][1**********]
[***********][**************]14
[***********][1**********]25
[***********][**************]2
[***********][**************]30
∑
1. 2 作回归线
根据上述回归方程找出两点:( x , y ) =(2158, 01487) ; (O , y o ) =(0, 01005)
作标准曲线即回归线
2 回归方程的有效性检验
2. 1 相关系数检验法
x 一的一条直线=x 和y 间存在某种线性关系时, 。两个变量(x 和y ) 线性关系的密切程度可用相关系数r 来衡量:
2
∑(x ) () 2()
r =2=b 22
∑(x i -x ) 2-∑(y i - y ) n ∑y i -(∑y i ) 相关系数r 的取值范围是0≤|r |≤1, 当|r |=1时表示x 和y 之间完全相关, 此时所有实验点落在回归直线上。当|r |=0时说明x 和y 之间完全没有相关。当|r |在0—1之间时说明x 和y 之间存在不同程度的相关关系。当|r |接近1时说明线性关系越好, r 为正值时为正相关, r 为负值时为负相关。
图1 回归直线(标准直线)
对于上述回归方程的相关系数为:2
r =01187=0. 94
×2102-219142
相关系数的临界值见表3.
表3 相关系数的临界值
f =n -2
置 信 水 平
90%[***********]9
95%[***********]1
99%[***********]7
1234
在上例中f =n -2=5-2=3, 查表可知r 的
临界值为01878, 置信水平为95%, 计算值r =0194>01878, 置信水平应在95%以上, 故回归方程的x 和y 之间存在线性关系。
第2期 才让加:化学数据的一元线性回归分析 15212 方差检验法
回归方程的有效性检验就是对求得的回归方程进行显著性检验, 看它是否真实地反映了变量间的线性关系。通常使用方差分析的思想和方法进行, 运用方差(F ) 检验的方法是判断回归平方和(MS R ) 是否显著大于误差平方和(MS E ) , 若MS R 显著大于MS E , 则表明总变异中回归显著, 亦即X 与Y 的线性关系显著或回归方程显著, 表明回归方程在整体上成立, 进一步检验了变量X 和Y 是否存在线性关系。如上述的回归方程进行方差检验:y =01005+01187x
2=2102-=01605
N 6
22
SS R (回归平方和) =b ∑X -=011872×(55125-40104) =01532N
对所有Y 值而言, 自由度为N -1, 即df T =N -1; df E =N -2; 所以df r =df T -df E =1
2
SS T (总平方和) =∑Y -
SS E (误差平方和) =SS T -SS R =01073; MS R (均方) =MS E (残差平方和) =
==01532df R 1
==010243; F ===211893df E 3MS E 010243
表4 方差分析表
查F 值表得F (0105) (1, 3) =10113; F >F 0105, 方差分析表如下:
变异来源回归
残差总计
自由度
13平方和
[**************]F F 0105(1, 3)
[1**********]
3表示在01X 与Y 之间有显著的线性关系。
3 结论
由以上建立回归方程的过程可知, 在分析化学中, 通过大量的实验数据, 可以找到彼此有关系的变量之间的统计规律, 并可用一定的数学模式来表示量变相关关系, 探讨变量数据之间的统计方法, 建立有效的回归线方程, 可以很方便的对变量进行预测、估算和控制, 有利于化学数据的处理。参考文献:
[1] 张厚粲, 徐建平. 现代心理与教育统计学[M].北京:北京大学出版社,2003,11. [2] 陈焕光, 李涣然. 分析化学实验(第二版) [M].广州:中山大学出版社,1998,9. [3] [德]M.奥托著. 邵学广等译. 化学计量学[M].北京:科学出版社,2003,1. [4] 顾庆超. 化学实验与数据处理导论[M].南京:江苏科学技术出版社,1984,8. [5] 陈希孺, 王松桂. 现代回归分析[M].合肥:安徽教育出版社,1987,4.
The unitary linear regression analysis of chemical data
C AI Rang 2jia
(Qinghai N ormal University , X ining 810008,China )
Abstract :This paper use experimental data to set up linear regression equation with unitary and regression straight line ,T o use variance analysis and related coefficient to test validity of equation.
K ey w ords :experimental data ; regression equation ; regression straight line ; variance analysis ;related coeffi 2cient ; validity