抽样差误标准与误
抽样差与误参估数计(s
apmilg erron rnda etimstiaono f arampteer)
t分
可布置(信区间
2011-)1-22
1
1
2
体 随机总样抽样 本 描 述统 计量研究 统计量的性和评价一个质统计断推 的优良,性全完取于决其样分抽的性布质.3
2 10-11-21 24
作出推
断抽样
误与差准误标
Sapl i mn ge rro r n ad tsa nd a r d rer o
Garlupl民测意在1948验年后的统总选举的记中
1录396的年国总统美选
罗举福的百分数斯
选
结果举G 预测.的选举结果
26 56
洛普 盖G(allup)
份 年1925 19561 90619 64 198 617291 96 7981 01984 188
9
G预.值测 选结举 样果本量获 胜者 538 5森艾豪威 尔1%55 54% .1448 艾森威豪尔59.5 %5 .8%7 081 肯5迪尼51% 5 0.% 16625 翰逊 6约4 6%13.% 4441尼克 43松% 345%. 6839尼 克 62%松 1.6% 34398卡特 4.59 %1.1%5 503 里0 根553% .1.56 %346 里根 59.50 %9.2%54 80 9布 什650% 53..9
%
差误 4.%4- .71%0 .9% -2 .%70 . 5%- 0.2% 1.6% -.73%0 2.% 2.-1
%6
5
抽样差(误smplainger or)
r于由抽样而起引样本指的(标计统量) 与体指标(参数总)的异差。属 机随差误①:无倾性;②向可避免。不
均数
的抽样验例实
题假定常正年成子男的细胞红数计从服正分 布 态N 4.6602,(05.4762 )的体,单总位1 12 0 L/ 用计算机模拟从。该体总中机抽随样,每抽 次例组5成个样一本重复,10次抽样。0果结见 表1
。
78
表1
正常年男成红子细计胞数抽样实验果结_
_
本样号 1 2…19 20 … 7 3体
个总体测观值
564.4. 625. 4 25.1 4.46 0.5094. 67 5.07 4.50 4.0 462.6 .44 2… …399.4.6 1 …… .51 44.9 5.0404 .3 58.144. 984 .605 .8
X1
.0504.72 4…10.4. 86 .32 9.460 … 5.25 .6044. 66
S
0 5.70 35 . 0….5 90.54… 0. 4 3.07
9
5__
X
100
_
_
S100_
_
1
XS
μ1= 46.6 σ =0 . 5
7
X
2S
21
标0误准SE,(satnadd error)r统
计(量样本数、均本样等)的率标准差, 用于量抽样误度的大小。 样差本数均标准误:即的样均数的标本准 差,明样本均说抽数误样差的计统指。标 总:体σ = σ=0. 7546/ 5 0.=275
0_
_标
准 VS 标准差误
内 性容 质D S示个体变异表小 S大E
统量计的准差, 标表示抽误样差大小
控
制体个变或异自变异然,
增
大本样量可含少减 方 法可不通统过计方法控制。 算来式用途
σ =
=X
n
本:样
∑(
X− μ)N
2σ
==_
_
σ
n
__ =Sσ __=
X
X
∧ nS
XX
11
N
X
S
_与n_成反比,n↑ __,↓; S →n时∞, S_ →0。_
X求
考参值围
范求可
区间信12
样均本数的分布X ∼
N ( μ,σ 2 ) , 则 ∼ XN (μ, σ
__ 2
n
)X
σ ,当2 n够足,大 如 ≥n60 , ∼N (μ ,σ n
)
2X ∼N μ ,( σ ) ,2若体均总为值/
μ ,方为差
_
_t
分布( t
dsirtbutiion)
31
210-1112-2
41
早在
817年,德5国天学家文、测量 学F R家He lemrt 在就数学上 现了t分布发
希尔米。
特
t布
分 X ∼N(μ ,σ 2 )⇒ Z =
X −
μ
σ
X−μ_
∼ _N(0,1)
19
8年0以S他utedtn为名发笔表 论文的。G“osse提出t际实问 , 题Fishr和EePears on将其转 成计统题问N,emayn归 纳数为问学题。
”哥赛特1
X5 ∼N ( μ σ __, ⇒) =
2 X
Z
__
σ
__
N∼ (,01
)__
X
⇒t
X− = ∼μ t(υ ) S __X
61
•
条t三布分密曲线度
v= v=5 v∞1=
分布t的形特征图分布特
征•t 分曲线布单是的峰• 于t关= 0对 称t 布与分正态分布的系 •关自 由v较小时,t度分与标准正态分布布相差 大较并,且t布分曲的尾线面部积 于大标正态分准布曲线尾的面积部• 当自 由 ν度→ ∞ 时,分t布近于标准逼 正分布。态 18
021-11-22
117
分t布的界值
给自由度定vt,布曲线分的双侧部尾面为α时 积应对的t,记值为t α / 2,并称其vt为的侧双值界单侧 界 值:侧一部尾积为面时α应的对值ttα ,v 称性得:对单侧曲2线面积下=双曲侧下面线 积给定曲下线积对面的应界与值由自有关 度同样的尾部面,积t布的分值要界于大准标态 分正布界值
1的92 01-111-22
t布分界的值
t
分界值布意示,α表图示阴影面积的
02
点
计估 参数计估
可(
置信区间
()oncidfnec enitevrlaCI,)
区
估间
统计计推
断假检设验
2
110-1-22
11
22
2
基
概念
参本数估(para计metr estemationi)用样:本指 标统计(量估计总体指标(参数)。 )⑴ 估计点po(nit esitmaiont 总体均数)的估点
μ=计
X ∧_
_总体
数的估均
点计计估p:iotn estmatiino区 间估计i:nervtl astemiatoi
n本统样量计 点(计估 可)/置信区信 可间/ (区信间计估 区)估间)计
⑵
区间计估(nitreal estimvaito)
n32
ˆ=μX
置 信限下置信 限
24上
被估的计体参数
总总参数 均体 一值个 总体 比 例差方 均值差 之个两总体 比例之 差 差方比 符表示 样本号统计量
置信
水平/信度
可复重试时该验间包含总区体均的数概率
μ
p
σ
μ12−2μp1−
p
2
x − x 1 21x −x2 ˆ p1ˆ− ˆ 2pˆ p1 − p
2 2 s2 s22 2 s 11s
22
5x xˆ ˆps 22s
表
方示法:1− α1、0(01−α%)常用的 有99%, 9 5, %09 %相应的 α为0 .1,000.,50.10
σ12
/σ2
22
6总体
数的区间估均计
. 1未知:
σ ⎛ ⎜P t−α⎜ ⎝ __
2
,
ν
例
_题
_
Xμ−
X
2ν
,⎞⎟ =−α ⎟ ⎠
X1
X −α t/2, υS __
总体均 数μ的 侧 双 1 α− 信置间区为:
__
n=2,5X=17 .210mc,S=.24cm0,估试计地该0岁 2男学大生身总体均高的9数%可信区5。间 查表附2的 界值表t,双得侧,即9%5可区间为信
:t
0.05 /2 24, 2.0=4
61(7.01 2 2.0−46× 42.025 1,7.01 + 2.2640× 4.20 52 ) = 1(7.28,01 3774).
2 278
X (− t α/2 ,υS _ _, X +tα / 2, Sυ_ _
X)X
__
_
_2
σ已知,或σ未.但n知够大足:⎛ ⎞
X−μ 1− α = P⎜ − u α
2 ⎟ ⎜ ⎟X σ ⎠
⎝题
例μn =5200, =46.062 ,0.=754,6单 位012 1/ Lσ 试计该估地正成年常男红子胞计细均数的数95%可 区信间 。附表查1标准正态界的值,得双侧,表即5%可 9区间为信:
X
uα− / 2S _ _
X_X
__
_
总体_数均μ 的侧 双1 −α 置信 间为:区
u0.
05/ 2 = 19.
(4.6602 − 1.966 ×= ( .368 ,4.68
2) 903
0.5
47 2560
0(X − uα / 2S _ ,_ X+ u α /2S _ _)X
X
_
__
_
,
4.606 + 2.961×
.5074 2650
0)
9
5可%区间的含信:
义从总体中作随机样抽如,:100次得10,个0 信可区,平间有均5个可信区9包括间体均数μ总( 估计 确正,)只有个5信可间区不括总体均数μ包(估计 不确)。 实际中正只,一次作样,只得到一个抽可信区间 ,作未知为总体数均的能可围范的估计理,上论 有5%的9能是可正确的而,%5可能的生错误。
3发
影1区间宽响的因度
X素± tα /2 ν,S
X1.2. 3.
X uα / 2σ± X
数据
的散程离度,用S σ 来测度或 本样容, SX =
S量
nσ
=
X
n
σ置
信平 (水 -1 α,影响 )tα 2,ν/或 u α /2 的小大
3
2
可信间区的要两素增
样 本大 量密度精 p(ecrsioin )可 区间 公式信 围 估计错 范误率 概9%5X
± t0 05/ 2,ν S .X
可信
区间 9%9X ±
t00./ 2,1 νXS
参考范值围
含 当=α00.5时,IC95以的可 “正常%人”的剖解生理、生、 义能包性含体均数。 总某化项标个体指值波动范围。的计 公算 用 途
式33
σ未知
:
x ±tα 2/,υ⋅ SX
正态分
布:
x u± α/2 ⋅ S
XPP1~0−0
X 大 窄(005. )准度确ac(cruca) y1−
α宽
小(.01)0
σ已
或σ未知但为知样大本:
x uα ±2 /⋅X 或σ x± uα /2 ⋅ S X
体均数总区的估计间
偏
分态:布
绝多数(如大5%9)察对观某象 项指的分布标围范
3
4正两总态均数体之差侧9双5%信区间可μ1 −
μ 2 (两总:方体差知未)时
(X 1− X ) 2 t±0 05. 2,υ /S_ _两
均数之差的标准
误_ __ X_ −1X 2 __
两总体差已知方或,1与n2均较大n时
(: X1 −X2 ) ± u.00 5 /,2σ_ _两
均数之差的准标误
__
_
_
X
−1X 2
__
S
_
_X − X 21
_
_
=
2
( 1 − n) S12 1 (+ n2 − )1 S 1 21 ( + n1) n2 +− 2n 1n2
ˆ
σ X− X=
1
ˆ σ 12 2n
1+
ˆ2σ n2
263
3
5
例较比某药疗治行流性乙型炎的疗脑,效将2
7名流
行性乙患者随机分为试验组脑对和照,组得两 组退的热数天的均和标准差,数下表见。试计估该 退热效药果95的可%区信。 表间两 组患者退热天数的 组 分验试组 照对 组n3 2 4
解:01 n=32 ,X 1 = .92 S1 , 1.9,= 2n 4=, 0X2 = 5 2. S,2 =.27 样本大计,两算样均本数之标差误 准ˆσ X − X
≈ 1
2
S221 2S1.9 227. 2+= + =0 5. 天) 3(2 4 n0 12n
该
药退热果效用两样本数之均差示表
:X
29. .52
S .91 .7
372
(天 )X − 1 X 2=2 9 −.5 . = −223 .公式计用μ算 1 μ−2
的95%的可信区: −间2 . 3 1±96 ×.0 5 = .−3.3 ~ −1. (天)3
3。8
抽样差误标准与误
抽样差与误参估数计(s
apmilg erron rnda etimstiaono f arampteer)
t分
可布置(信区间
2011-)1-22
1
1
2
体 随机总样抽样 本 描 述统 计量研究 统计量的性和评价一个质统计断推 的优良,性全完取于决其样分抽的性布质.3
2 10-11-21 24
作出推
断抽样
误与差准误标
Sapl i mn ge rro r n ad tsa nd a r d rer o
Garlupl民测意在1948验年后的统总选举的记中
1录396的年国总统美选
罗举福的百分数斯
选
结果举G 预测.的选举结果
26 56
洛普 盖G(allup)
份 年1925 19561 90619 64 198 617291 96 7981 01984 188
9
G预.值测 选结举 样果本量获 胜者 538 5森艾豪威 尔1%55 54% .1448 艾森威豪尔59.5 %5 .8%7 081 肯5迪尼51% 5 0.% 16625 翰逊 6约4 6%13.% 4441尼克 43松% 345%. 6839尼 克 62%松 1.6% 34398卡特 4.59 %1.1%5 503 里0 根553% .1.56 %346 里根 59.50 %9.2%54 80 9布 什650% 53..9
%
差误 4.%4- .71%0 .9% -2 .%70 . 5%- 0.2% 1.6% -.73%0 2.% 2.-1
%6
5
抽样差(误smplainger or)
r于由抽样而起引样本指的(标计统量) 与体指标(参数总)的异差。属 机随差误①:无倾性;②向可避免。不
均数
的抽样验例实
题假定常正年成子男的细胞红数计从服正分 布 态N 4.6602,(05.4762 )的体,单总位1 12 0 L/ 用计算机模拟从。该体总中机抽随样,每抽 次例组5成个样一本重复,10次抽样。0果结见 表1
。
78
表1
正常年男成红子细计胞数抽样实验果结_
_
本样号 1 2…19 20 … 7 3体
个总体测观值
564.4. 625. 4 25.1 4.46 0.5094. 67 5.07 4.50 4.0 462.6 .44 2… …399.4.6 1 …… .51 44.9 5.0404 .3 58.144. 984 .605 .8
X1
.0504.72 4…10.4. 86 .32 9.460 … 5.25 .6044. 66
S
0 5.70 35 . 0….5 90.54… 0. 4 3.07
9
5__
X
100
_
_
S100_
_
1
XS
μ1= 46.6 σ =0 . 5
7
X
2S
21
标0误准SE,(satnadd error)r统
计(量样本数、均本样等)的率标准差, 用于量抽样误度的大小。 样差本数均标准误:即的样均数的标本准 差,明样本均说抽数误样差的计统指。标 总:体σ = σ=0. 7546/ 5 0.=275
0_
_标
准 VS 标准差误
内 性容 质D S示个体变异表小 S大E
统量计的准差, 标表示抽误样差大小
控
制体个变或异自变异然,
增
大本样量可含少减 方 法可不通统过计方法控制。 算来式用途
σ =
=X
n
本:样
∑(
X− μ)N
2σ
==_
_
σ
n
__ =Sσ __=
X
X
∧ nS
XX
11
N
X
S
_与n_成反比,n↑ __,↓; S →n时∞, S_ →0。_
X求
考参值围
范求可
区间信12
样均本数的分布X ∼
N ( μ,σ 2 ) , 则 ∼ XN (μ, σ
__ 2
n
)X
σ ,当2 n够足,大 如 ≥n60 , ∼N (μ ,σ n
)
2X ∼N μ ,( σ ) ,2若体均总为值/
μ ,方为差
_
_t
分布( t
dsirtbutiion)
31
210-1112-2
41
早在
817年,德5国天学家文、测量 学F R家He lemrt 在就数学上 现了t分布发
希尔米。
特
t布
分 X ∼N(μ ,σ 2 )⇒ Z =
X −
μ
σ
X−μ_
∼ _N(0,1)
19
8年0以S他utedtn为名发笔表 论文的。G“osse提出t际实问 , 题Fishr和EePears on将其转 成计统题问N,emayn归 纳数为问学题。
”哥赛特1
X5 ∼N ( μ σ __, ⇒) =
2 X
Z
__
σ
__
N∼ (,01
)__
X
⇒t
X− = ∼μ t(υ ) S __X
61
•
条t三布分密曲线度
v= v=5 v∞1=
分布t的形特征图分布特
征•t 分曲线布单是的峰• 于t关= 0对 称t 布与分正态分布的系 •关自 由v较小时,t度分与标准正态分布布相差 大较并,且t布分曲的尾线面部积 于大标正态分准布曲线尾的面积部• 当自 由 ν度→ ∞ 时,分t布近于标准逼 正分布。态 18
021-11-22
117
分t布的界值
给自由度定vt,布曲线分的双侧部尾面为α时 积应对的t,记值为t α / 2,并称其vt为的侧双值界单侧 界 值:侧一部尾积为面时α应的对值ttα ,v 称性得:对单侧曲2线面积下=双曲侧下面线 积给定曲下线积对面的应界与值由自有关 度同样的尾部面,积t布的分值要界于大准标态 分正布界值
1的92 01-111-22
t布分界的值
t
分界值布意示,α表图示阴影面积的
02
点
计估 参数计估
可(
置信区间
()oncidfnec enitevrlaCI,)
区
估间
统计计推
断假检设验
2
110-1-22
11
22
2
基
概念
参本数估(para计metr estemationi)用样:本指 标统计(量估计总体指标(参数)。 )⑴ 估计点po(nit esitmaiont 总体均数)的估点
μ=计
X ∧_
_总体
数的估均
点计计估p:iotn estmatiino区 间估计i:nervtl astemiatoi
n本统样量计 点(计估 可)/置信区信 可间/ (区信间计估 区)估间)计
⑵
区间计估(nitreal estimvaito)
n32
ˆ=μX
置 信限下置信 限
24上
被估的计体参数
总总参数 均体 一值个 总体 比 例差方 均值差 之个两总体 比例之 差 差方比 符表示 样本号统计量
置信
水平/信度
可复重试时该验间包含总区体均的数概率
μ
p
σ
μ12−2μp1−
p
2
x − x 1 21x −x2 ˆ p1ˆ− ˆ 2pˆ p1 − p
2 2 s2 s22 2 s 11s
22
5x xˆ ˆps 22s
表
方示法:1− α1、0(01−α%)常用的 有99%, 9 5, %09 %相应的 α为0 .1,000.,50.10
σ12
/σ2
22
6总体
数的区间估均计
. 1未知:
σ ⎛ ⎜P t−α⎜ ⎝ __
2
,
ν
例
_题
_
Xμ−
X
2ν
,⎞⎟ =−α ⎟ ⎠
X1
X −α t/2, υS __
总体均 数μ的 侧 双 1 α− 信置间区为:
__
n=2,5X=17 .210mc,S=.24cm0,估试计地该0岁 2男学大生身总体均高的9数%可信区5。间 查表附2的 界值表t,双得侧,即9%5可区间为信
:t
0.05 /2 24, 2.0=4
61(7.01 2 2.0−46× 42.025 1,7.01 + 2.2640× 4.20 52 ) = 1(7.28,01 3774).
2 278
X (− t α/2 ,υS _ _, X +tα / 2, Sυ_ _
X)X
__
_
_2
σ已知,或σ未.但n知够大足:⎛ ⎞
X−μ 1− α = P⎜ − u α
2 ⎟ ⎜ ⎟X σ ⎠
⎝题
例μn =5200, =46.062 ,0.=754,6单 位012 1/ Lσ 试计该估地正成年常男红子胞计细均数的数95%可 区信间 。附表查1标准正态界的值,得双侧,表即5%可 9区间为信:
X
uα− / 2S _ _
X_X
__
_
总体_数均μ 的侧 双1 −α 置信 间为:区
u0.
05/ 2 = 19.
(4.6602 − 1.966 ×= ( .368 ,4.68
2) 903
0.5
47 2560
0(X − uα / 2S _ ,_ X+ u α /2S _ _)X
X
_
__
_
,
4.606 + 2.961×
.5074 2650
0)
9
5可%区间的含信:
义从总体中作随机样抽如,:100次得10,个0 信可区,平间有均5个可信区9包括间体均数μ总( 估计 确正,)只有个5信可间区不括总体均数μ包(估计 不确)。 实际中正只,一次作样,只得到一个抽可信区间 ,作未知为总体数均的能可围范的估计理,上论 有5%的9能是可正确的而,%5可能的生错误。
3发
影1区间宽响的因度
X素± tα /2 ν,S
X1.2. 3.
X uα / 2σ± X
数据
的散程离度,用S σ 来测度或 本样容, SX =
S量
nσ
=
X
n
σ置
信平 (水 -1 α,影响 )tα 2,ν/或 u α /2 的小大
3
2
可信间区的要两素增
样 本大 量密度精 p(ecrsioin )可 区间 公式信 围 估计错 范误率 概9%5X
± t0 05/ 2,ν S .X
可信
区间 9%9X ±
t00./ 2,1 νXS
参考范值围
含 当=α00.5时,IC95以的可 “正常%人”的剖解生理、生、 义能包性含体均数。 总某化项标个体指值波动范围。的计 公算 用 途
式33
σ未知
:
x ±tα 2/,υ⋅ SX
正态分
布:
x u± α/2 ⋅ S
XPP1~0−0
X 大 窄(005. )准度确ac(cruca) y1−
α宽
小(.01)0
σ已
或σ未知但为知样大本:
x uα ±2 /⋅X 或σ x± uα /2 ⋅ S X
体均数总区的估计间
偏
分态:布
绝多数(如大5%9)察对观某象 项指的分布标围范
3
4正两总态均数体之差侧9双5%信区间可μ1 −
μ 2 (两总:方体差知未)时
(X 1− X ) 2 t±0 05. 2,υ /S_ _两
均数之差的标准
误_ __ X_ −1X 2 __
两总体差已知方或,1与n2均较大n时
(: X1 −X2 ) ± u.00 5 /,2σ_ _两
均数之差的准标误
__
_
_
X
−1X 2
__
S
_
_X − X 21
_
_
=
2
( 1 − n) S12 1 (+ n2 − )1 S 1 21 ( + n1) n2 +− 2n 1n2
ˆ
σ X− X=
1
ˆ σ 12 2n
1+
ˆ2σ n2
263
3
5
例较比某药疗治行流性乙型炎的疗脑,效将2
7名流
行性乙患者随机分为试验组脑对和照,组得两 组退的热数天的均和标准差,数下表见。试计估该 退热效药果95的可%区信。 表间两 组患者退热天数的 组 分验试组 照对 组n3 2 4
解:01 n=32 ,X 1 = .92 S1 , 1.9,= 2n 4=, 0X2 = 5 2. S,2 =.27 样本大计,两算样均本数之标差误 准ˆσ X − X
≈ 1
2
S221 2S1.9 227. 2+= + =0 5. 天) 3(2 4 n0 12n
该
药退热果效用两样本数之均差示表
:X
29. .52
S .91 .7
372
(天 )X − 1 X 2=2 9 −.5 . = −223 .公式计用μ算 1 μ−2
的95%的可信区: −间2 . 3 1±96 ×.0 5 = .−3.3 ~ −1. (天)3
3。8