抽样误差与参数估计

抽样差误标准与误

抽样差与误参估数计（s

apmilg erron rnda etimstiaono f arampteer）

t分

可布置（信区间

2011-）1-22

体随机总样抽样本描述统计量研究统计量的性和评价一个质统计断推的优良，性全完取于决其样分抽的性布质.3

2 10-11-21 24

作出推

断抽样

误与差准误标

Sapl i mn ge rro r n ad tsa nd a r d rer o

Garlupl民测意在1948验年后的统总选举的记中

1录396的年国总统美选

罗举福的百分数斯

选

结果举G 预测.的选举结果

26 56

洛普盖G（allup)

份年1925 19561 90619 64 198 617291 96 7981 01984 188

G预.值测选结举样果本量获胜者 538 5森艾豪威尔1%55 54% .1448 艾森威豪尔59.5 %5 .8%7 081 肯5迪尼51% 5 0.% 16625 翰逊 6约4 6%13.% 4441尼克 43松% 345%. 6839尼克 62%松 1.6% 34398卡特 4.59 %1.1%5 503 里0 根553% .1.56 %346 里根 59.50 %9.2%54 80 9布什650% 53..9

差误 4.%4- .71%0 .9% -2 .%70 . 5%- 0.2% 1.6% -.73%0 2.% 2.-1

抽样差（误smplainger or）

r于由抽样而起引样本指的（标计统量）与体指标（参数总）的异差。属机随差误①：无倾性；②向可避免。不

均数

的抽样验例实

题假定常正年成子男的细胞红数计从服正分布态N 4.6602,(05.4762 )的体，单总位1 12 0 L/ 用计算机模拟从。该体总中机抽随样，每抽次例组5成个样一本重复，10次抽样。0果结见表1

。

表1

正常年男成红子细计胞数抽样实验果结_

本样号 1 2…19 20 … 7 3体

个总体测观值

564.4. 625. 4 25.1 4.46 0.5094. 67 5.07 4.50 4.0 462.6 .44 2… …399.4.6 1 …… .51 44.9 5.0404 .3 58.144. 984 .605 .8

.0504.72 4…10.4. 86 .32 9.460 … 5.25 .6044. 66

0 5.70 35 . 0….5 90.54… 0. 4 3.07

5__

100

S100_

μ1= 46.6 σ =0 . 5

标0误准SE，（satnadd error）r统

计（量样本数、均本样等）的率标准差，用于量抽样误度的大小。样差本数均标准误：即的样均数的标本准差，明样本均说抽数误样差的计统指。标总：体σ = σ=0. 7546/ 5 0.=275

_标

准 VS 标准差误

内性容质D S示个体变异表小 S大E

统量计的准差，标表示抽误样差大小

控

制体个变或异自变异然，

增

大本样量可含少减方法可不通统过计方法控制。算来式用途

σ =

本：样

∑(

X− μ)N

2σ

==_

__ =Sσ __=

∧ nS

_与n_成反比，n↑ __，↓； S →n时∞， S_ →0。_

X求

考参值围

范求可

区间信12

样均本数的分布X ∼

N ( μ,σ 2 ) ，则 ∼ XN (μ, σ

__ 2

σ ，当2 n够足，大如 ≥n60 ， ∼N (μ ,σ n

)

2X ∼N μ ,( σ ) ，2若体均总为值/

μ ，方为差

分布（ t

dsirtbutiion）

210-1112-2

早在

817年，德5国天学家文、测量学F R家He lemrt 在就数学上现了t分布发

希尔米。

特

t布

分 X ∼N(μ ,σ 2 )⇒ Z =

X −

X−μ_

∼ _N(0,1)

8年0以S他utedtn为名发笔表论文的。G“osse提出t际实问，题Fishr和EePears on将其转成计统题问N，emayn归纳数为问学题。

”哥赛特1

X5 ∼N ( μ σ __, ⇒) =

2 X

N∼ (,01

)__

⇒t

X− = ∼μ t(υ ) S __X

•

条t三布分密曲线度

v= v=5 v∞1=

分布t的形特征图分布特

征•t 分曲线布单是的峰• 于t关= 0对称t 布与分正态分布的系 •关自由v较小时，t度分与标准正态分布布相差大较并，且t布分曲的尾线面部积于大标正态分准布曲线尾的面积部• 当自由 ν度→ ∞ 时，分t布近于标准逼正分布。态 18

021-11-22

117

分t布的界值

给自由度定vt，布曲线分的双侧部尾面为α时积应对的t，记值为t α / 2,并称其vt为的侧双值界单侧界值：侧一部尾积为面时α应的对值ttα ,v 称性得：对单侧曲2线面积下=双曲侧下面线积给定曲下线积对面的应界与值由自有关度同样的尾部面，积t布的分值要界于大准标态分正布界值

1的92 01-111-22

t布分界的值

分界值布意示，α表图示阴影面积的

点

计估参数计估

可（

置信区间

（）oncidfnec enitevrlaCI，）

区

估间

统计计推

断假检设验

110-1-22

基

概念

参本数估（para计metr estemationi）用样：本指标统计（量估计总体指标（参数）。）⑴ 估计点po（nit esitmaiont 总体均数）的估点

μ=计

X ∧_

_总体

数的估均

点计计估p：iotn estmatiino区间估计i：nervtl astemiatoi

n本统样量计点(计估可)/置信区信可间/ (区信间计估区)估间)计

⑵

区间计估（nitreal estimvaito）

n32

ˆ=μX

置信限下置信限

24上

被估的计体参数

总总参数均体一值个总体比例差方均值差之个两总体比例之差差方比符表示样本号统计量

置信

水平/信度

可复重试时该验间包含总区体均的数概率

μ12−2μp1−

x − x 1 21x −x2 ˆ p1ˆ− ˆ 2pˆ p1 − p

2 2 s2 s22 2 s 11s

5x xˆ ˆps 22s

表

方示法：1− α1、0(01−α%)常用的有99%, 9 5, %09 %相应的 α为0 .1，000.，50.10

σ12

/σ2

6总体

数的区间估均计

. 1未知:

σ ⎛ ⎜P t−α⎜ ⎝ __

例

_题

Xμ−

2ν

,⎞⎟ =−α ⎟ ⎠

X −α t/2, υS __

总体均数μ的侧双 1 α− 信置间区为：

n=2，5X=17 .210mc，S=.24cm0，估试计地该0岁 2男学大生身总体均高的9数％可信区5。间查表附2的界值表t，双得侧，即9％5可区间为信

：t

0.05 /2 24, 2.0=4

61(7.01 2 2.0−46× 42.025 1，7.01 + 2.2640× 4.20 52 ) = 1(7.28,01 3774).

2 278

X (− t α/2 ,υS _ _, X +tα / 2, Sυ_ _

X)X

σ已知，或σ未.但n知够大足:⎛ ⎞

X−μ 1− α = P⎜ − u α

2 ⎟ ⎜ ⎟X σ ⎠

⎝题

例μn =5200， =46.062 ，0.=754，6单位012 1/ Lσ 试计该估地正成年常男红子胞计细均数的数95％可区信间。附表查1标准正态界的值，得双侧，表即5％可 9区间为信：

uα− / 2S _ _

X_X

总体_数均μ 的侧双1 −α 置信间为：区

u0.

05/ 2 = 19.

(4.6602 − 1.966 ×= ( .368 ,4.68

2) 903

0.5

47 2560

0(X − uα / 2S _ ,_ X+ u α /2S _ _)X

，

4.606 + 2.961×

.5074 2650

5可％区间的含信：

义从总体中作随机样抽如，：100次得10，个0 信可区，平间有均5个可信区9包括间体均数μ总( 估计确正，)只有个5信可间区不括总体均数μ包(估计不确)。实际中正只，一次作样，只得到一个抽可信区间，作未知为总体数均的能可围范的估计理，上论有5％的9能是可正确的而，％5可能的生错误。

3发

影1区间宽响的因度

X素± tα /2 ν,S

X1.2. 3.

X uα / 2σ± X

数据

的散程离度，用S σ 来测度或本样容， SX =

S量

nσ

σ置

信平 (水 -1 α，影响 )tα 2,ν/或 u α /2 的小大

可信间区的要两素增

样本大量密度精 p(ecrsioin )可区间公式信围估计错范误率概9％5X

± t0 05/ 2,ν S .X

可信

区间 9％9X ±

t00./ 2,1 νXS

参考范值围

含当=α00.5时，IC95以的可 “正常%人”的剖解生理、生、义能包性含体均数。总某化项标个体指值波动范围。的计公算用途

式33

σ未知

x ±tα 2/,υ⋅ SX

正态分

布：

x u± α/2 ⋅ S

XPP1~0−0

X 大窄（005. ）准度确ac(cruca) y1−

α宽

小（.01）0

σ已

或σ未知但为知样大本:

x uα ±2 /⋅X 或σ x± uα /2 ⋅ S X

体均数总区的估计间

偏

分态：布

绝多数(如大5%9)察对观某象项指的分布标围范

4正两总态均数体之差侧9双5％信区间可μ1 −

μ 2 （两总:方体差知未）时

(X 1− X ) 2 t±0 05. 2,υ /S_ _两

均数之差的标准

误_ __ X_ −1X 2 __

两总体差已知方或，1与n2均较大n时

(： X1 −X2 ) ± u.00 5 /,2σ_ _两

均数之差的准标误

−1X 2

_X − X 21

( 1 − n) S12 1 (+ n2 − )1 S 1 21 ( + n1) n2 +− 2n 1n2

σ X− X=

ˆ σ 12 2n

ˆ2σ n2

263

例较比某药疗治行流性乙型炎的疗脑，效将2

7名流

行性乙患者随机分为试验组脑对和照，组得两组退的热数天的均和标准差，数下表见。试计估该退热效药果95的可％区信。表间两组患者退热天数的组分验试组照对组n3 2 4

解：01 n=32 ,X 1 = .92 S1 , 1.9,= 2n 4=, 0X2 = 5 2. S,2 =.27 样本大计，两算样均本数之标差误准ˆσ X − X

≈ 1

S221 2S1.9 227. 2+= + =0 5. 天） 3（2 4 n0 12n

该

药退热果效用两样本数之均差示表

：X

29. .52

S .91 .7

372

（天）X − 1 X 2=2 9 −.5 . = −223 .公式计用μ算 1 μ−2

的95％的可信区： −间2 . 3 1±96 ×.0 5 = .−3.3 ~ −1. （天）3

3。8