-
Notifications
You must be signed in to change notification settings - Fork 38
/
chapter8.tex
2443 lines (2217 loc) · 136 KB
/
chapter8.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
% !TeX root = main.tex
% Edit by:
\setcounter{chapter}{7}
\chapter{方差分析与回归分析}\label{cha:8}
\section{方差分析}\label{sec:8.1}
\subsection{问题的提出}
前面几章我们讨论的都是一个总体或者两个总体的统计分析问题, 在实际工作中我们还会经常碰到多个总体均值的比较问题, 处理这类问题通常采用所谓的方差分析方法. 本节将叙述这个方法, 先看一个例子.
\begin{example}\label{exam:8.1.1}
在饲料养鸡增肥的研究中, 某研究所提出三种饲料配方:$A_1$ 是以鱼粉为主的饲料, $A_2$ 是以槐树粉为主的饲料, $A_3$ 是以苜蓿粉为主的饲料. 为比较三种饲料的效果, 特选 24 只相似的雏鸡随机均分为三组, 每组各喂一种饲料, 60 天后观察它们的重量. 试验结果如下表所示:
\begin{table}[htbp]
\centering
\caption{鸡饲料试验数据}
\begin{tabular}{c|rrrrrrrr}
\toprule
饲料 $A$ & \multicolumn{7}{c}{鸡重/\si{\gram} } & \\
\midrule
$A_1$ & 1073 & 1009 & 1060 & 1001 & 1002 & 1012 & 1009 & 1028 \\
$A_2$ & 1107 & 1092 & 990 & 1109 & 1090 & 1074 & 1122 & 1001 \\
$A_3$ & 1093 & 1029 & 1080 & 1021 & 1022 & 1032 & 1029 & 1048 \\
\bottomrule
\end{tabular}%
\label{tab:8.1.1}%
\end{table}%
\end{example}
本例~\ref{exam:8.1.1} 中, 我们要比较的是三种饲料对鸡的增肥作用是否相同. 为此, 把饲料称为\textbf{因子}\index{Y!因子}, 记为 $A$, 三种不同的配方称为因子 $A$ 的三个水平, 记为 $A_1$, $A_2$, $A_3$, 使用配方 $A_i$ 下第 $j$ 只鸡 60 天后的重量用 $y_{ij}$ 表示, $i = 1,2,3$, $j =1,2,3,\ldots,10$. 我们的目的是比较三种不同饲料配方下鸡的平均重量是否相等, 为此, 需要做一些基本假定, 把所研究的问题归结为一个统计问题, 然后用方差分析的方法进行解决.
在例~\ref{exam:8.1.1} 中, 我们只考察了一个因子, 称其为单因子试验. 通常, 在单因子试验中, 记因子为 $A$, 设其有 $r$ 个水平, 记为 $A_1,A_2,\ldots,A_r$, 在每一水平下考察的指标可以看成一个总体, 现有 $r$ 个水平, 故有 $r$ 个总体, 假定:
\begin{enumerate}
\item 每一总体均为正态分布, 记为 $N(\mu_i, \sigma_i^2)$, $i=1,\cdots,r$;\label{enu:8.1.2.1}
\item 各总体的方差相同, 记为 $\sigma_1^2 = \sigma_2^2=\cdots=\sigma_r^2=\sigma^2$;\label{enu:8.1.2.2}
\item 从每一总体中抽取的样本是相互独立的, 即所有的试验结果 $y_{ij}$ 都相互独立.
\end{enumerate}
这三个假定都可以用统计方法进行验证. 譬如, 利用正态性检验(\ref{ssec:7.4.3} 节)验证~\ref{enu:8.1.2.1} 成立;利用后面~\S\ref{sec:8.3} 的方差齐次性检验验证~\ref{enu:8.1.2.2} 成立;而试验结果 $y_{ij}$ 的独立性可由随机化实现, 这里的随机化是指所有试验按随机次序进行.
我们要做的工作是比较各水平下的均值是否相同, 即要对如下的一个假设进行检验,
\begin{equation}
H_0 \text{:} \mu_1 = \mu_2 = \cdots = \mu_r,\label{eq:8.1.1}
\end{equation}
其备择假设为
\begin{equation*}
H_1 \text{ : } \mu_1,\mu_2,\cdots,\mu_r \text{ 不全相等, }
\end{equation*}
在不会引起误解的情况下, $H_1$ 通常可省略不写.
如果 $H_0$ 成立, 因子 $A$ 的 $r$ 个水平均值相同, 称因子 $A$ 的 $r$ 个水平间没有显著差异, 简称因子 $A$ \textbf{不显著}\index{B!不显著};反之, 当 $H_0$ 不成立时, 因子 $A$ 的 $r$ 个水平均值不全相同, 这时称因子 $A$ 的不同水平间有显著差异, 简称因子 $A$ \textbf{显著}\index{X!显著}.
为对假设~(\ref{eq:8.1.1}) 进行检验, 需要从每一水平下的总体抽取样本, 设从第 $i$ 个水平下的总体获得 $m$ 个试验结果(简单起见, 这里先假设个水平下试验的重复数相同, 后面会看到, 重复数不同时的处理方式与此基本一致, 略有差异),记 $y_{ij}$ 表示第 $i$ 个总体的第 $j$ 次重复试验结果. 共得到如下 $r \times m$ 个试验结果:
\begin{equation*}
y_{ij}, \; i=1,2,\cdots,r, \; j = 1,2,\cdots,m,
\end{equation*}
其中 $r$ 为水平数, $m$ 为重复数, $i$ 为水平编号, $j$ 为重复编号.
在水平 $A_i$ 下的试验结果 $y_{ij}$ 与该水平下的指标均值 $\mu_i$ 一般总是有差距的, 记 $\varepsilon_{ij} = y_{ij} - \mu_i$, $\varepsilon_{ij}$ 称为随机误差. 于是有
\begin{equation}
\label{eq:8.1.2}
y_{ij} = \mu_i + \varepsilon_{ij}
\end{equation}
~(\ref{eq:8.1.2}) 式称为试验结果 $y_{ij}$ 的\textbf{数据结构式}\index{S!数据结构式}. 把三个假定用子数据结构式就可以写出单因子方差分析的统计模型:
\begin{equation}
\label{eq:8.1.3}
\begin{cases}
y_{ij} = \mu_i + \varepsilon_{ij}, \; i = 1,2,\cdots,r,\; j = 1,2,\cdots,m; \\
\text{诸 $\varepsilon_{ij}$ 相互独立, 且都服从 $N(0,\sigma^2)$ }.
\end{cases}
\end{equation}
为了能更好地描述数据, 常在方差分析中引入总均值与效应的概念. 称诸 $\mu_i$ 的平均(所有试验结果的均值的平均)
\begin{equation}
\label{eq.8.1.4}
\mu = \frac{1}{r} (\mu_1 + \cdots + \mu_r) = \frac{1}{r} \sum_{i=1}^{r} \mu_i
\end{equation}
为总均值. 称第 $i$ 水平下的均值 $\mu_i$ 与总均值 $\mu$ 的差
\begin{equation}
\label{eq:8.1.5}
a_i = \mu_i - \mu, \quad i = 1,2,\cdots,r
\end{equation}
为因子 $A$ 的第 $i$ 水平的\textbf{主效应}\index{Z!主效应}, 简称为 $A_i$ 的效应.
容易看出
% \begin{align}
% \sum_{i=1}^{r} a_i = 0, \label{eq:8.1.6}\\
% \mu_i = \mu + a_i, \label{eq:8.1.7}
% \end{align}
\begin{equation}
\label{eq:8.1.6}
\sum_{i=1}^{r} a_i = 0,
\end{equation}
\begin{equation}
\label{eq:8.1.7}
\mu_i = \mu + a_i,
\end{equation}
这表明第 $i$ 个总体均值是由总均值与该水平的效应叠加而成的, 从而模型~(\ref{eq:8.1.3}) 可以改写为
\begin{equation}
\label{eq:8.1.8}
\begin{cases}
y_{ij} = \mu + a_i + \varepsilon_{ij}, \quad i = 1,2,\cdots,r,\; j = 1,2,\cdots,m; \\
\sum_{i=1}^{r} a_i = 0; \\
\text{$\varepsilon_{ij}$ 相互独立, 且都服从 $N(0,\sigma^2)$ }.
\end{cases}
\end{equation}
假设~(\ref{eq:8.1.1}) 可改写为
\begin{equation}
H_0 \textrm{ : } a_1 = a_2 = \cdots = a_r,\label{eq:8.1.9}
\end{equation}
其备择假设为
\begin{equation*}
H_1 \text{ : } a_1,a_2,\cdots,a_r \text{ 不全为 0.}
\end{equation*}
\subsection{平方和分解}\label{ssec:8.1.3}
\subsubsection{试验数据}
通常在单因子方差分析中可将试验数据列成如下表格形式.
% Table generated by Excel2LaTeX from sheet 'Sheet1'
\begin{table}[htbp]
\centering
\caption{单因子方差分析试验数据}
\begin{tabular}{ccccccccc}
\toprule
因子水平 & & \multicolumn{4}{c}{试验数据} & & 和 & 平均 \\
\midrule
$A_1$ & & $y_{11}$ & $y_{12}$ & $\cdots$ & $y_{1m}$ & & $T_1$ & $\bar{y}_{1}$ \\
$A_2$ & & $y_{21}$ & $y_{22}$ & $\cdots$ & $y_{2m}$ & & $T_2$ & $\bar{y}_{2}$ \\
$\vdots$ & & $\vdots$ & $\vdots$ & & $\vdots$ & & $\vdots$ & $\vdots$ \\
$A_r$ & & $y_{r1}$ & $y_{r2}$ & $\cdots$ & $y_{rm}$ & & $T_r$ & $\bar{y}_{r}$ \\
\midrule
& & & & & & & $T$ & $\bar{y}$ \\
\bottomrule
\end{tabular}%
\label{tab:8.1.2}%
\end{table}%
\ref{tab:8.1.2} 中的最后二列的和与平均的含义如下:
\begin{align*}
T_i &= \sum_{j=1}^{m} y_{ij},\; \bar{y}_i = \frac{T_i}{m} \quad i =1,2,\cdots,r,\\
T_i & = \sum_{i=1}^{r} T_{i},\; \bar{y} = \frac{T}{r \cdot m} = \frac{T}{n},\\
n & = r \cdot m = \text{ 总试验次数 }.
\end{align*}
\subsubsection{组内偏差与组间偏差}
数据间是有差异的. 数据 $y_{ij}$ 与总平均 $\bar{y}$ 间的偏差可用 $y_{ij} - \bar{y}$ 表示, 它可分解为两个偏差之和
\begin{equation}\label{eq:8.1.10}
y_{ij}-\bar{y}=(y_{ij}-\bar{y}_{i\cdot})+(\bar{y}_{i\cdot}-\bar{y})
\end{equation}
记
\begin{equation*}
\bar{\varepsilon}_{i\cdot} =\frac{1}{m} \sum_{j=1}^{m} \varepsilon_{ij}, \quad \bar{\varepsilon}=\frac{1}{r} \sum_{i=1}^{r} \bar{\varepsilon}_{i} = \frac{1}{n} \sum_{i=1}^{r} \sum_{j=1}^{m} \varepsilon_{ij}.
\end{equation*}
由于
\begin{equation}\label{eq:8.1.11}
y_{i j}-\bar{y}_{i\cdot}=(\mu_{i}+\varepsilon_{i j})-(\mu_{i}+\bar{\varepsilon}_{i})=\varepsilon_{i j}-\bar{\varepsilon}_{i},
\end{equation}
所以 $y_{ij} - \bar{y}_{i\cdot}$ 仅反映组内数据与组内平均的随机误差, 称为\textbf{组内偏差}\index{Z!组内偏差}; 而
\begin{equation}\label{eq:8.1.12}
\bar{y}_{i\cdot}-\bar{y} = (\mu_{i}+ \bar{\varepsilon}_{i\cdot})-(\mu +\bar{\varepsilon}_{i})= a_i + \bar{\varepsilon}_{i\cdot}-\bar{\varepsilon},
\end{equation}
$\bar{y}_{i\cdot} - \bar{y}$ 除了反映随机误差外,还反映了第 $i$ 个水平的效应,称为组间偏差,
\subsubsection{偏差平方和及其自由度}
在统计学中,把 $k$ 个数据 $y_1,\cdots,y_k$ 分别对其均值 $\bar{y}=(y_1+\cdots+y_{k}) / k$ 的偏差平方和
\begin{equation*}
Q=\left(y_{1}-\bar{y}\right)^{2}+\cdots+\left(y_{k}-\bar{y}\right)^{2}=\sum_{i=1}^{k}\left(y_{i}-\bar{y}\right)^{2}
\end{equation*}
称为 $k$ 个数据的\textbf{偏差平方和}\index{P!偏差平方和},有时简称\textbf{平方和}\index{P!平方和}. 偏差平方和常用来度量若干个数据集中或分散的程度,它是用来度量若干个数据间差异(即波动)的大小的一个重要的统计量.
在构成偏差平方和 $Q$ 的 $k$ 个偏差 $y_1 - \bar{y}, \cdots, y_{k} - \bar{y}$ 间有一个恒等式
\begin{equation*}
\sum_{i=1}^{k}\left(y_{i}-\bar{y}\right)=0,
\end{equation*}
这说明在 $Q$ 中独立的偏差只有 $k-1$ 个. 在统计学中把平方和中独立偏差个数称为该平方和的\textbf{自由度}\index{Z!自由度},常记为 $f$ ,如 $Q$ 的自由度为 $f_{Q}=k-1$. 自由度是偏差平方和的一个重要参数.
\subsubsection{总平方和分解公式}
各 $y_{ij}$ 间总的差异大小可用\textbf{总偏差平方和} $S_T$ 表示,
\begin{equation}\label{eq:8.1.13}
S_{T}=\sum_{i=1}^{r} \sum_{j=1}^{m}\left(y_{i j}-\bar{y}\right)^{2}, \quad f_{T} = n-1,
\end{equation}
仅由随机误差引起的数据间的差异可以用组内偏差平方和表示,也称为误差偏差平方和,记为 $S_e$
\begin{equation}\label{eq:8.1.14}
S_{e}=\sum_{i=1}^{r} \sum_{j=1}^{m}\left(y_{i j}-\bar{y}_{i .}\right)^{2}, \quad f_{e}=r(m-1)=n-r.
\end{equation}
由于组间差异除了随机误差外,还反映了效应间的差异,故由效应不同引起的数据差异可用\textbf{组间偏差平方和}表示,也称为因子 $A$ 的\textbf{偏差平方和},记为 $S_A$;
\begin{equation}\label{eq:8.1.15}
S_{A}=m \sum_{i=1}^{r}\left(\bar{y}_{i\cdot}-\bar{y}\right)^{2}, \quad f_{A}=r-1
\end{equation}
\begin{theorem}{}{8.1.1}
在上述符号下,总平方和 $S_T$ 可以分解为因子平方和 $S_A$ 与误差平方和 $S_e$.之和,其自由度也有相应分解公式,具体为:
\begin{equation} \label{eq:8.1.16}
S_{T}=S_{A}+ S_{e}, \quad f_{T}=f_{A}+f_{e}
\end{equation}
~\eqref{eq:8.1.16} 式通常称为总平方和分解式.
\end{theorem}
\begin{proof}
注意到
\begin{equation*}
\sum_{i=1}^{r} \sum_{j=1}^{m}(y_{i j}-\bar{y}_{i\cdot})(\bar{y}_{i\cdot}-\bar{y})= \sum_{i=1}^{r}\big[(\bar{y}_{i\cdot}-\bar{y}) \sum_{i=1}^{m}(y_{i j}-\bar{y}_{i\cdot})\big]=0
\end{equation*}
故有
\begin{align*}
S_{T} & =\sum_{i=1}^{r} \sum_{j=1}^{m}(y_{i j}-\bar{y})^{2} = \sum_{i=1}^{r} \sum_{i=1}^{m}[(y_{i j}-\bar{y}_{i\cdot})+(\bar{y}_{i\cdot}-\bar{y})]^{2}\\
&=S_{e}+S_{A} + 2 \sum_{i=1}^{r} \sum_{j=1}^{m}(y_{i j}-\bar{y}_{i\cdot})+(\bar{y}_{i\cdot}-\bar{y}) = S_{e} + S_{A},
\end{align*}
诸自由度间的等式是显然的.
\end{proof}
\subsection{检验方法}
偏差平方和 $Q$ 的大小与数据个数(或自由度)有关,一般说来,数据越多,其偏差平方和越大. 为了便于在偏差平方和间进行比较,统计上引入了均方和的概念,它定义为
\begin{equation*}
MS=Q/f_Q,
\end{equation*}
其意为平均每个自由度上有多少平方和,它比较好地度量了一组数据的离散程度.
如今要对因子平方和SA与误差平方和S2之间进行比较,用其均方和
\begin{equation*}
MS_{A}=S_A / f_A, \quad MS_{e}=S_{e}/f_{e}
\end{equation*}
进行比较更为合理,因为均方和排除了自由度不同所产生的干扰.故用
\begin{equation}\label{eq:8.1.17}
F = \frac{MS_{A}}{MS_{e}} = \frac{S_A/f_A}{S_e/f_e}
\end{equation}
作为检验 $H_0$ 的统计量,为给出检验拒绝域,我们需要如下定理:
\begin{theorem}{}{8.1.2}
在单因子方差分析模型~\eqref{eq:8.1.8} 及前述符号下,有
\begin{enumerate}
\item $S_{\varepsilon} / \sigma^{2} \sim \chi^{2}(n-r)$, 从而 $E(S_{e})=(n-r) \sigma^{2}$ \label{enum:8.1.2.1}
\item $E(S_{A})=(r-1) \sigma^{2} + m \sum_{i=1}^{r} a_{i}^{2}$, 进一步, 若 $H_0$ 成立, 则有 $S_{A} / \sigma^{2} \sim \chi^{2}(r-1)$;\label{enum:8.1.2.2}
\item $S_A$ 与 $S_e$ 独立 \label{enum:8.1.2.3}.
\end{enumerate}
\end{theorem}
\begin{proof}
由于~\eqref{eq:8.1.11} 和~\eqref{eq:8.1.14}, $S_{e}=\sum_{i=1}^{r} \sum_{j=1}^{m}(\varepsilon_{i j}-\bar{\varepsilon_{i\cdot}})^{2}$, 在单因子方差分析模型~\eqref{eq:8.1.8} 下, 我们知道, 诸 $\varepsilon_{ij}, \; i=1,2,\cdots,r,\; j=1,2,\cdots,m$ 独立同分布于 $N(0,\sigma^2)$,由定理~\ref{thm:5.4.1} 知,$\frac{1}{\sigma^2} \sum_{j=1}^m (\varepsilon_{ij} - \bar{\varepsilon}_{i\cdot})^2$, $i=1,2,\cdots,r$, 相互独立,其共同分布为 $\chi^2(m-1)$,由卡方分布的可加性,有 $\frac{S_e}{\sigma^2} \sim \chi^2(n-r)$,这给出 $E(S_e/\sigma^2) = n-r=f_e$, ~\ref{enum:8.1.2.1}得证.
类似地,由~\eqref{eq:8.1.12} 和~\eqref{eq:8.1.15},有
\begin{equation*}
S_A = m \sum_{i=1}^r (a_i + \varepsilon_{i\cdot} - \bar{\varepsilon})^2.
\end{equation*}
由定理~\ref{thm:5.4.1} 知,对每个 $i$,平方和 $\sum_{j=1}^m (\varepsilon_{ij} - \bar{\varepsilon}_{i\cdot})^2$ 与均值 $\bar{\varepsilon}_{i}$ 独立,从而 $\bar{\varepsilon}_{1.}, \bar{\varepsilon}_{2.},\cdots,\bar{\varepsilon}_{r.}$ 与 $S_e$ 独立,而 $S_A$ 只是,$\bar{\varepsilon}_{1.}, \bar{\varepsilon}_{2.},\cdots,\bar{\varepsilon}_{r.}$ 的函数,由此~\ref{enum:8.1.2.3} 得证.
在模型~\ref{eq:8.1.8} 下, $S_A$ 的期望是
\begin{equation*}
E(S_A) = m \sum_{i=1}^r a^2 + E\big[m\sum_{i=1}^r (\bar{\varepsilon}_{i\cdot} - \bar{\varepsilon})^2\big],
\end{equation*}
由于诸误差均值 $\bar{\varepsilon}_{1.}, \bar{\varepsilon}_{2.},\cdots,\bar{\varepsilon}_{r.}$ 独立同分布于 $N(0, \sigma^2/m)$,从而由诸误差均值组成的偏差平方和除以 $\sigma^2/m$ 服从卡方分布,即
\begin{equation*}
\frac{1}{\sigma^{2}} \sum_{i=1}^{r} m\left(\bar{\varepsilon}_{i},-\bar{\varepsilon}\right)^{2}-\chi^{2}(r-1).
\end{equation*}
于是, $E\big[\sum_{i=1}^r m(\bar{\varepsilon}_{i\cdot} - \bar{\varepsilon})\big]$ 在 $H_0$ 成立下,$S_A/\sigma^2 \sim \chi^2(r-1)$, 这就完成了~\ref{enum:8.1.2.2} 的证明.
\end{proof}
由定理`\ref{thm:8.1.2} 知,若 $H_0$ 成立,则 \eqref{eq:8.1.17} 定义的检验统计量 $F$ 服从自由度为 $f_A$ 和 $f_e$ 的 $F$ 分布,因此,由假设检验的一般理论,拒绝域为
\begin{equation}\label{eq:8.1.18}
W =\left\lvert F \geq F_{1-\alpha}(f_{A}, f_{e}) \right\rvert .
\end{equation}
通常将上述计算过程列成一张表格,称为方差分析表,见表~\ref{tab:8.1.3}
\begin{table}[htbp]
\centering
\caption{单因子方差分析表\label{tab:8.1.3}}
\begin{tabular}{ccccc}
\toprule
来源 & 平方和 & 自由度 & 均方和 & $F$ 比\\
\midrule
因子 & $S_A$ & $f_{A} = r-1$ & $MS_{A} = S_{A}/f_A$ & $F = MS_{A}/MS_{e}$ \\
误差 & $S_{e}$ & $f_{e} = n - r$ & $MS_{e} = S_e/f_e$ & \\
\midrule
总和 & $S_{T}$ & $f_{T} = n - 1$ & & \\
\bottomrule
\end{tabular}
\end{table}
对给定的 $\alpha$,可作如下判断:
\begin{itemize}
\item 如果 $F > F_{1-\alpha}(f_A,f_e)$,则认为因子 $A$ 显著;
\item 若 $F \leq F_{1-\alpha}(f_A, f_e)$,则说明因子 $A$ 不显著.
\end{itemize}
该检验的 $p$ 值也可利用统计软件求出,若以 $Y$ 记服从 $F(f_A,f_e)$ 的随机变量,则检验的 $p$ 值为 $p = P(Y \geq F)$.
经过简单推导,可以给出常用的各偏差平方和的计算公式如下:
\begin{align}
S_T &= \sum_{i=1}^{r}\sum_{j=1}^{m} y_{ij}^2 - \frac{T^2}{n}; \notag\\
S_A &= \frac{1}{m} \sum_{i=1}^{r} T_{i}^2 - \frac{T^2}{n}; \label{eq:8.1.19}\\
S_e &= S_T - S_A \notag
\end{align}
一般可将计算过程列表进行,见下例.
\begin{example}\label{exam:8.1.2}
采用例~\ref{exam:8.1.1} 的数据,由偏差平方和的公式可以看出,对数据作一个线性变换是不影响方差分析的结果的,本例中,我们将原始数据同时减去 $1000$,并用列表的办法给出计算过程:
\end{example}
% Table generated by Excel2LaTeX from sheet 'Sheet1'
\begin{table}[htbp]
\centering
\caption{例~\ref{exam:8.1.2} 的计算表}
\begin{tabular}{rrrrrrrrrrrr}
\toprule
\multicolumn{1}{l}{水平} & \multicolumn{8}{c}{数据(原始数据 $-1000$)} & \multicolumn{1}{c}{$T_i$} & \multicolumn{1}{c}{$T_i^2$} & \multicolumn{1}{c}{$\sum_{j=1}^{m} y_{ij}^2$} \\
\midrule
\multicolumn{1}{l}{$A_1$} & 73 & 9 & 60 & 1 & 2 & 12 & 9 & 28 & 194 & 37636 & 10024 \\
\multicolumn{1}{l}{$A_2$} & 107 & 92 & -10 & 109 & 90 & 74 & 122 & 1 & 585 & 342225 & 60355 \\
\multicolumn{1}{l}{$A_3$} & 93 & 29 & 80 & 21 & 22 & 32 & 29 & 48 & 354 & 125316 & 20984 \\
\midrule
& & & & & & & & & 1133 & 505177 & 91363 \\
\bottomrule
\end{tabular}%
\label{tab:8.1.4}%
\end{table}%
利用~\eqref{eq:8.1.19},可算得各偏差平方和为:
\begin{align*}
S_T & = 91363 - \frac{1133^2}{24} = 37876.04, && f_T = 24-1=23,\\
S_A &= \frac{505177}{8} - \frac{1133^2}{24} = 9660.08, && f_A = 3 - 1 = 2,\\
S_e &= S_{T} - S_A = 37876.04 - 9660.08 = 28215.96, && f_{e} = 3(8-1)=21.
\end{align*}
把上述诸平方和及其自由度填入方差分析表,并继续计算得到各均方和以及 $F$ 比,见表~\ref{tab:8.1.5}.
% Table generated by Excel2LaTeX from sheet 'Sheet1'
\begin{table}[htbp]
\centering
\caption{\ref{exam:8.1.2} 的方差分析表}
\begin{tabular}{lcccc}
\toprule
来源 & 平方和 & 自由度 & 均方和 & $F$ 比 \\
\midrule
因子 $A$ & 9660.08 & 2 & 4830.04 & 3.59 \\
误差 $e$ & 28215.96 & 21 & 1343.62 & \\
总和 $T$ & 37876.04 & 23 & & \\
\bottomrule
\end{tabular}%
\label{tab:8.1.5}%
\end{table}%
若取 $a=0.05$,则 $F_{0.95} (2, 21)=3.47$,由于 $F=3.59>3.47$,故认为因子 $A$(饲料)是显著的,即三种饲料对鸡的增肥作用有明显的差别.
\subsection{参数估计}
在检验结果为显著时,我们可进一步求出总均值 $\mu$、各主效应 $a_i$ 和误差方差 $\sigma^2$ 的估计.
\subsubsection{点估计}
由模型~\eqref{eq:8.1.8} 知诸 $y_{ij}$ 相互独立,且 $y_{ij}\sim N(\mu+a_i,\sigma^2)$,因此,可使用最大似然方法求出一般平均 $\mu$、各主效应 $a_i$;和误差方差 $\sigma^2$ 的估计.
首先,写出似然函数
\begin{equation*}
L\left(\mu, a_{1}, \cdots, a_{r}, \sigma^{2}\right) \prod_{i=1}^{r} \prod_{j=1}^{m}\left\{\frac{1}{\sqrt{2 \pi \sigma^{2}}} \exp \left\{-\frac{\left(y_{i j}-\mu-a_{i}\right)^{2}}{2 \sigma^{2}}\right\}\right\}
\end{equation*}
其对数似然函数为
\begin{equation*}
l\left(\mu, a_{1}, \cdots, a_{r}, \sigma^{2}\right)=-\frac{n}{2} \ln \left(2 \pi \sigma^{2}\right)-\frac{1}{2 \sigma^{2}} \sum_{i=1}^{n} \sum_{i=1}^{m}\left(y_{i j}-\mu-a_{i}\right)^{2}
\end{equation*}
求偏导,得似然方程为
\begin{equation*}
\begin{cases}
\frac{\partial l}{\partial \mu} =\frac{1}{2 \sigma^{2}} \sum_{i=1}^{r} \sum_{j=1}^{m}\left(y_{i j}-\mu-a_{i}\right)=0 \\
\frac{\partial l}{\partial a_{i}} =\frac{1}{2 \sigma^{2}} \sum_{j=1}^{m}\left(y_{i j}-\mu-a_{i}\right)=0, \quad i=1, \cdots, r\\
\frac{\partial l}{\partial \sigma^{2}} =-\frac{n}{2 \sigma^{2}}+\frac{1}{2 \sum^{4}} \sum_{i=1}^{m} \sum_{j=1}^{m}\left(y_{i j}-\mu-a_{i}\right)^{2}=0
\end{cases}
\end{equation*}
考虑到约束条件~\eqref{eq:8.1.8},可求出前述各参数的最大似然估计为
\begin{equation}
\label{eq:8.1.20}
\begin{split}
\hat{\mu} &= \bar{y}\\
\hat{a}_{i} & =\bar{y}_{i},-\bar{y}, i=1, \cdots, r \\
\hat{\sigma}_{M}^{2} &= \frac{1}{n} \sum_{i=1}^{r} \sum_{j=1}^{m}\left(y_{i j}-\bar{y}\right)^{2}=\frac{S_{e}}{n}
\end{split}
\end{equation}
由最大似然估计的不变性,各水平均值 $\mu_i$ 的最大似然估计为
\begin{equation}
\label{eq:8.1.21}
\hat{\mu}_{i}=\bar{y}_{i}
\end{equation}
由于 $\hat{\sigma}_{M}^{2}$ 不是 $\sigma^2$ 的无偏估计,实用中通常采用如下误差方差的无偏估计
\begin{equation}
\label{eq:8.1.22}
\hat{\sigma}_{M}^{2} = M S_{e}
\end{equation}
\subsubsection{置信区间}
以下讨论各水平均值 $\mu_i$ 的置信区间. 由定理~\ref{thm:8.1.2} 知 $\bar{y}_{i\cdot} \sim N (\mu_{i}, \sigma^{2}/m)$,且两者独立,故 $S_e/\sigma^2 \sim \chi^2(f_e)$, 且两者独立,故
\begin{equation*}
\frac{\sqrt{m}\left(\bar{y}_{i\cdot}-\mu_{i}\right)}{\sqrt{\mathrm{S}_{0} / f_{0}}} \sim t\left(f_{e}\right)
\end{equation*}
由此给出 $A_i$ 的水平均值 $\mu_i$ 的 $1-\alpha$ 的置信区间为
\begin{equation}\label{eq:8.1.23}
\left[\bar{y}_{i\cdot}-\hat{\sigma} \cdot t_{1-\alpha / 2}(f_{e}) / \sqrt{m}, \bar{y}_{i\cdot}+\hat{\sigma} \cdot t_{1-\alpha / 2}(f_{e}) / \sqrt{m}\right]
\end{equation}
其中 $\tilde{\sigma}^2$ 由~\eqref{eq:8.1.22} 给出.
\begin{example}
我们在~\ref{exam:8.1.2} 中已经指出饲料因子是显著的,此处我们给出诸水平均值的估计.因子 $A$ 的三个水平均值的估计分别为
\begin{gather*} \hat{\mu}_{1} =1000+\frac{194}{8}=1024.25 \\
\hat{\mu}_{2} =1000+\frac{585}{8}=1073.13 \\
\hat{\mu}_{3} =1000+\frac{354}{8}=1044.25
\end{gather*}
从点估计来看,水平 $A_2$(以槐树粉为主的饲料)是最优的.误差方差的无偏估计为
\begin{equation*}
\hat{\sigma}^{2}=M S_{e}=1343.62
\end{equation*}
进一步,利用~\ref{eq:8.1.23} 可以给出诸水平均值的置信区间. 此处,$\sigma^2=\sqrt{1343.62}=
36.66$,若取 $a=0.05$,则 $t_{1-\alpha/2} (f_e)=t_{0.975}(21)=2.0796$, $\hat{\sigma} t_{0.975}(21)/\sqrt{8}=26.95$, 于是三个水平均值的 $0.95$ 置信区间分别为
\begin{gather*}
\mu_{1} : 1024.25 \mp 26.95 = [997.30, 1051.21],\\
\mu_{2} : 1073.13 \mp 26.95=[1046.18,1100.08],\\
\mu_{3} : 1044.25 \mp 26.95=[1017.30,1071.21]
\end{gather*}
至此,我们可以看到:在单因子试验的数据分析中可得到如下三个结果:
\begin{itemize}
\item 因子 $A$ 是否显著:
\item 试验的误差方差 $\sigma^2$ 的估计;
\item 诸水平均值 $\mu_i$ 的点估计与区间估计.
\end{itemize}
在因子 $A$ 显著时,通常只需对较优的水平均值作参数估计,在因子 $A$ 不显著场合,参数估计无需进行.
\end{example}
\subsection{重复数不等情形}
有时,每个水平下重复试验次数不全相等,在这最一般情况下进行方差分析与重复数相等情况下的方差分析极为相似,只在几处略有差别.下面我们指出差异之处.
·
\begin{itemize}
\item 数据
设从第 $i$ 个水平下的总体获得 $m_i$ 个试验结果,记为 $y_{i1}, y_{i2}, \cdots, y_{im_{i}}$, $i=1,2,\cdots,r$, 故总试验次数为 $n=m_1+m_2+\cdots+m_r$, 从而, 其统计模型为:
\begin{equation}\label{eq:8.1.24}
\begin{cases}
y_{i j}=\mu_{i}+\varepsilon_{i v}, \quad i=1,2, \cdots, r, \quad j=1,2, \cdots, m_{i},\\
\text{各 $\varepsilon_{ij}$ 相互独立,且都服从 $N(0,\sigma^2)$}.
\end{cases}
\end{equation}
\item 总均值
诸 $\mu_i$ 的加权平均(所有试验结果的均值的平均)
\begin{equation}\label{eq:8.1.25}
\mu=\frac{1}{n}\left(m_{1} \mu_{1}+\cdots+m_{n} \mu_{r}\right)=\frac{1}{n} \sum_{i=1}^{r} m_{i j} \mu_{z}
\end{equation}
称为总均值.第 $i$ 个水平均值 $\mu_i$ 与总均值 $\mu$ 的差
\begin{equation}\label{eq:8.1.26}
a_{i}=\mu_{i}-\mu, \quad i=1,2, \cdots, r
\end{equation}
称为因子 $A$ 的第 $i$ 个水平的效应.
\item 效应约束条件
由~\eqref{eq:8.1.25} 和~\eqref{eq:8.1.26},容易看出关于效应的约束条件为
\begin{equation*}
\sum_{i=1}^{r} m_{i} a_{i}=0
\end{equation*}
且 $\mu_i = \mu + a_i$, 这表明第 $i$ 个总体的均值是由总均值与该水平的效应叠加而成的.类似于~\eqref{eq:8.1.8},有
\begin{equation}\label{eq:8.1.27}
\begin{cases}
y_{i j}=\mu+a_{i}+\varepsilon_{i j}, \quad i=1,2, \cdots, r, j=1,2, \cdots, m_{i}\\
\sum_{i=1}^{r} m_{i} a_{i}=0\\
\text{$\varepsilon_{ij}$ 相互独立,服从 $N(0,\sigma^2)$}.
\end{cases}
\end{equation}
\item 各平方和的计算
要考虑的问题仍是检验~\eqref{eq:8.1.9} 给出的假设. 整个分析思路与方法基本一样,重要的区别是计算公式稍有不同,特别要注意 $S_A$ 的计算公式. 类似地记
\begin{gather*}
T_{i}=\sum_{j=1}^{m_{1}} y_{i j}, \quad \bar{y}_{i},=\frac{T_{i}}{m_{i}} \\
T=\sum_{i=1}^{r} \sum_{j=1}^{m_{i}} y_{i j}=\sum_{i=1}^{r} T_{i}, \quad \bar{y}=\frac{T}{n}
\end{gather*}
则
\begin{equation}
\label{eq:8.1.28}
\begin{split}
S_{T} & =\sum_{i=1}^{r} \sum_{j=1}^{m_{i}}\left(y_{i j}-\bar{y}\right)^{2}=\sum_{i=1}^{r} \sum_{j=1}^{\infty_{i}} y_{i j}^{2}-\frac{T^{2}}{n}, \quad f_{T}=n-1 \\
S_{A} & =\sum_{i=1}^{r} m_{i}\left(\bar{y}_{i} .-\bar{y}\right)^{2}=\sum_{i=1}^{r} \frac{T_{i}^{2}}{m_{i}}-\frac{T^{2}}{n}, \quad f_{A}=r-1 \\
S_{e} & =\sum_{i=1}^{r} \sum_{i=1}^{m_{3}}\left(y_{i j}-\bar{y}_{i}\right)^{2}=S_{T}-S_{A},\quad f_e = n - r
\end{split}
\end{equation}
方差分析表以及参数估计是一样的.
\end{itemize}
\begin{example}\label{exam:8.1.4}
某食品公司对一种食品设计了四种新包装. 为考察哪种包装最受顾客欢迎,选了 10 个地段繁华程度相似、规模相近的商店做试验,其中两种包装各指定两个商店销售,另两个包装各指定三个商店销售.在试验期内各店货架排放的位置、空间都相同,营业员的促销方法也基本相同,经过一段时间,记录其销售量数据,列于表~\ref{tab:8.1.6} 左半边,其相应的计算结果列于右侧.
% Table generated by Excel2LaTeX from sheet 'Sheet1'
\begin{table}[htbp]
\centering
\caption{销售量数据及计算表}
\begin{tabular}{cccccccc}
\toprule
包装类型 & \multicolumn{3}{c}{销售量数据} & $m_i$ & $T_i$ &$T_i^2/m_i$ & $\sum_{j=1}^{m_i} y_{ij}^2$ \\
\midrule
\multicolumn{1}{l}{A1} & \multicolumn{1}{r}{12} & \multicolumn{1}{r}{18} & & 2 & 30 & 450 & 468 \\
\multicolumn{1}{l}{A2} & \multicolumn{1}{r}{14} & \multicolumn{1}{r}{12} & \multicolumn{1}{r}{13} & 3 & 39 & 507 & 509 \\
\multicolumn{1}{l}{A3} & \multicolumn{1}{r}{19} & \multicolumn{1}{r}{17} & \multicolumn{1}{r}{21} & 3 & 57 & 1083 & 1091 \\
\multicolumn{1}{l}{A4} & \multicolumn{1}{r}{24} & \multicolumn{1}{r}{30} & & 2 & 54 & 1458 & 1476 \\
\midrule
\multicolumn{4}{c}{sum} & 10 & 180 & 3498 & 3544 \\
\bottomrule
\end{tabular}%
\label{tab:8.1.6}%
\end{table}%
由此可求得各类偏差平方和如下 $\left(\frac{T^{2}}{n}=\frac{180^{2}}{10}=3240\right)$.
\begin{align*}
S_T & = 91363 - \frac{1133^2}{24} = 37876.04, && f_T = 24-1=23,\\
S_A &= \frac{505177}{8} - \frac{1133^2}{24} = 9660.08, && f_A = 3 - 1 = 2,\\
S_e &= S_{T} - S_A = 37876.04 - 9660.08 = 28215.96, && f_{e} = 3(8-1)=21.
\end{align*}
方差分析表如表~\ref{tab:8.1.7} 所示.
% Table generated by Excel2LaTeX from sheet 'Sheet1'
\begin{table}[htbp]
\centering
\caption{\ref{exam:8.1.4} 的方差分析表}
\begin{tabular}{lcccc}
\toprule
来源 & 平方和 & 自由度 & 均方和 & $F$ 比 \\
\midrule
因子 $A$ & 258 & 3 & 86 & 11.22 \\
误差 $e$ & 46 & 6 & 7.67 & \\
总和 $T$ & 304 & 9 & & \\
\bottomrule
\end{tabular}%
\label{tab:8.1.7}%
\end{table}%
若取 $\alpha=0.01$,查表得 $F_{0.01}(3,6)=9.78$,由于 $F = 11.22 > 9.78$,故我们可认为各水平间有显著差异.
由于因子显著,我们还可以给出诸水平均值的估计.因子 $A$ 的四个水平均值的估计分别为
\begin{gather*}
\hat{\mu}_{1}=30 / 2=15, \quad \hat{\mu}_{2}=39 / 3=13 \\
\hat{\mu}_{3}=57 / 3=19, \quad \bar{\mu}_{4}=54 / 2=27
\end{gather*}
由此可见,第四种包装方式效果最好.误差方差的无偏估计为
\begin{equation*}
\dot{\sigma}^{2}=M S_{e}=7.67
\end{equation*}
进一步,利用~\eqref{eq:8.1.23} 也可以给出诸水平均值的置信区间,只是在这里要用不同的 $m_i$ 代替那里相同的 $m$. 此处,$\hat{\sigma} = \sqrt{7.67}=2.7695$,若取 $\alpha=0.05$, 则 $t_{1-a / 2}\left(f_{8}\right)=t_{0.975}(6)=2.4469$, $\hat{\sigma} t_{0.975}(6)=6.7767$,于是效果较好的第三和第四个水平均值的 0.95 置信区间分别为
\begin{gather*}
\mu_{3} : 19 \pm 6.7767 / \sqrt{3}=[15.09,22.91] \\
\mu_{4} : 27 \pm 6.7767 / \sqrt{2}=[22.21,31.79]
\end{gather*}
\end{example}
\begin{xiti}
\item 在一个单因子试验中,因子 $A$ 有三个水平,每个水平下各重复 4 次,具体数据如下:
% Table generated by Excel2LaTeX from sheet 'Sheet2'
\begin{center}
\begin{tabular}{cccccc}
水平 & & \multicolumn{4}{c}{数据} \\
一水平 & & 8, & 5, & 7, & 4 \\
二水平 & & 6, & 10, & 12, & 9 \\
三水平 & & 0, & 1, & 5, & 2 \\
\end{tabular}%
\end{center}
试计算误差平方和 $S_e$、因子 $A$ 的平方和 $S_A$、总平方和 $S_T$,并指出它们各自的自由度.
\item 在一个单因子试验中,因子 $A$ 有 4 个水平,每个水平下重复次数分别为 5, 7, 6, 8. 那么误差平方和、A的平方和及总平方和的自由度各是多少?
\item 在单因子试验中,因子 $A$ 有 4 个水平,每个水平下各重复 3 次试验,现已求得每个水平下试验结果的样本标准差分别为 1.5, 2.0, 1.6, 1.2, 则其误差平方和为多少?误差的方差o2的估计值是多少?
\item 在单因子方差分析中,因子 $A$ 有三个水平,每个水平各做 4 次重复试验,请完成下列方拳分析表,并在显著性水平 $\alpha=0.05$ 下对因子A是否显著作出检验.
\begin{center}
\textbf{方差分析表}\\
\begin{tabular}{ccccc}
\toprule
来源 & 平方和 & 自由度 &均方和 & $F$ 比 \\
\midrule
因子 $A$ & 4.2 & & & \\
误差 $e$ & 2.5 & & & \\
和 $T$ & 6.7 & & & \\
\bottomrule
\end{tabular}%
\end{center}
\item 用 4 种安眠药在兔子身上进行试验,特选 24 只健康的兔子,随机把它们均分为 4 组,每组各服一种安曝药,安眠时间如下所示.
\begin{center}
\textbf{安眠药试验数据}\\
\begin{tabular}{lrrrrrr}
\toprule
安眠药 & \multicolumn{6}{c}{安眠时间/\hour} \\
\midrule
$A_1$ & 6.2 & 6.1 & 6 & 6.3 & 6.1 & 5.9 \\
$A_2$ & 6.3 & 6.5 & 6.7 & 6.6 & 7.1 & 6.4 \\
$A_3$ & 6.8 & 7.1 & 6.6 & 6.8 & 6.9 & 6.6 \\
$A_4$ & 5.4 & 6.4 & 6.2 & 6.3 & 6.0 & 5.9 \\
\bottomrule
\end{tabular}%
\end{center}
在显著性水平 $\alpha=0.05$ 下对其进行方差分析,可以得到什么结果?
\item 为研究咖啡因对人体功能的影响,特选 30 名体质大致相同的链康的男大学生进行手指叩击训练,此外咖啡因选三个水平:
\begin{equation*}
A_1 = 0 \text{ \mg},\quad A_2 = 100 \text{ \mg},\quad A_3 = 200 \text{ \mg}.
\end{equation*}
每个水平下冲泡 10 杯水,外观无差别,并加以编号,然后让 30 位大学生每人从中任选一杯服下,2 \hour 后,请每人做手指叩击,统计员记录其每分钟叩击次数,试验结果统计如下表:
\begin{center}
\begin{tabular}{lcccccccccc}
\toprule
咖啡因剂量 & \multicolumn{10}{c}{叩击次数} \\
\midrule
$A_1$: 0 \mg & 242 & 245 & 244 & 248 & 247 & 248 & 242 & 244 & 246 & 242 \\
$A_2$: 100 \mg & 248 & 246 & 245 & 247 & 248 & 250 & 247 & 246 & 243 & 244 \\
$A_3$: 200 \mg & 246 & 248 & 250 & 252 & 248 & 250 & 246 & 248 & 245 & 250 \\
\bottomrule
\end{tabular}%
\end{center}
请对上述数据进行方差分析, 从中可得到什么结论?
\item 某粮食加工厂试验三种储藏方法对粮食含水率有无显着影响. 现取一批粮食分成若干份, 分别用三种不同的方法储藏, 过一段时间后测得的含水率如下表:
\begin{center}
\begin{tabular}{cccccc}
\toprule
储藏方法 & \multicolumn{5}{c}{含水率数据} \\
\midrule
$A_1$ & 7.3 & 8.3 & 7.6 & 8.4 & 8.3 \\
$A_2$ & 5.4 & 7.4 & 7.1 & 6.8 & 5.3 \\
$A_3$ & 7.9 & 9.5 & 10 & 9.8 & 8.4 \\
\bottomrule
\end{tabular}%
\end{center}
\begin{enumerate}
\item 假定各种方法储戴的粮食的含水率服从正态分布,且方差相等,试在a=0.05水平下检验这三种方法对含水率有无显着影响;
\item 对每种方法的平均含水率给出置信水平为 0.95 的置信区间.
\end{enumerate}
\item 在入户推销上有五种方法,某大公司想比较这五种方法有无显着的效果差异,设计了一项实验:从应聘的且无推销经验的人员中随机挑选一部分人,将他们随机地分为五个组,每一组用一种推销方法进行培训,培训相同时间后观宗他们在一个月内的推销额,数据如下:
\begin{center}
\begin{tabular}{cccccccc}
\toprule
组别 & \multicolumn{7}{c}{推销额/千元} \\
\midrule
第一组 & 20 & 16.8 & 17.9 & 21.2 & 23.9 & 26.8 & 22.4 \\
第二组 & 24.9 & 21.3 & 22.6 & 30.2 & 29.9 & 22.5 & 20.7 \\
第三组 & 16 & 20.1 & 17.3 & 20.9 & 22 & 26.8 & 20.8 \\
第四组 & 17.5 & 18.2 & 20.2 & 17.7 & 19.1 & 18.4 & 16.5 \\
第五组 & 25.2 & 26.2 & 26.9 & 29.3 & 30.4 & 29.7 & 28.2 \\
\bottomrule
\end{tabular}%
\end{center}
\begin{enumerate}
\item 假定数据满足进行方差分析的假定,对数据进行分析,在 $\alpha = 0.05$ 下,这五种方法在平均月推销额上有无显着差异?
\item 哪种推销方法的效果最好?试对该种方法一个月的平均推销额求置信水平为 0.95 的置信区间.
\end{enumerate}
\end{xiti}
\section{多重比较}\label{sec:8.2}
\subsection{效应差的置信区间} \label{ssec:8.2.1}
如果方差分析的结果因子 $A$ 显著,则等于说有充分理由认为因子 $A$ 各水平的效应不全相同,但这并不是说它们中一定没有相同的. 就指定的一对水平 $A_i$ 与 $A_j$,我们可通过求 $\mu_i - \mu_j$ 的区间估计来进行比较,方法如下:由~\eqref{eq:8.1.27} 可以推出
\begin{equation*}
\bar{y}_{i\cdot} - \bar{y}_{j\cdot} \sim N \left(\mu_{i}-\mu_{j},\left(\frac{1}{m_{i}}+\frac{1}{m_{j}}\right) \sigma^{2}\right)
\end{equation*}
而定理~\ref{thm:8.1.2} 指出 $S_e/\sigma^2 \sim \chi^2(f_e)$, 且两者独立,故
\begin{equation*}
\frac{(\bar{y}_{i\cdot} - \bar{y}_{j\cdot}) - (\mu_i - \mu_j) }{\sqrt{\big(\frac{1}{m_i} + \frac{1}{m_i}\big) \frac{S_e}{f_e}}}
\end{equation*}
由此给出 $\mu_i -\mu_j$ 的置信水平为 $1-\alpha$ 的置信区间为
\begin{equation}\label{eq:8.2.1}
\left[\bar{y}_{i\cdot}-\bar{y}_{j\cdot}-\sqrt{\left(\frac{1}{m_{i}}+\frac{1}{m_{j}}\right)} \hat{\sigma} \cdot t_{1-\frac{\alpha}{2}}\left(f_{e}\right),\,\bar{y}_{i},-\bar{y}_{j}+\sqrt{\left(\frac{1}{m_{i}}+\frac{1}{m_{j}}\right)} \hat{\sigma} \cdot t_{1-\frac{\alpha}{2}}\left(f_{e}\right)\right]
\end{equation}
其中 $\hat{\sigma}^2$ 是 $\sigma^2$ 的无偏估计.
\begin{example}\label{exam:8.2.1}
在例~\ref{exam:8.1.2} 中,我们已知饲料因子是显著的,此处 $m_1=m_2=
m_3 = 8$,$f_e = 21$,$\hat{\sigma}=\sqrt{1343.62} = 36.66$,若取 $\alpha=0.05$,则 $t_{1-\alpha/2}(f_e)=
t_{0.975}(21) = 2.0796$, $\sqrt{1/8+1/8} \hat{\sigma} t_{0.975}(21) = 38.11$,于是可算出各个置信区闻为
\begin{align*}
\mu_{1}-\mu_{2} : &\; -48.88 \pm 38.11=[-86.99,-10.77] \\
\mu_{1}-\mu_{3} : &\; -20 \pm 38.11=[-58.11,18.11] \\
\mu_{2}-\mu_{3} : &\; 28.88 \pm 38.11=[-9.23,66.99]
\end{align*}
可见第一个区间在 0 的左边,所以我们可以概率 95\% 断言认为 $\mu_1$ 小于 $\mu_2$,其他两个区间包含 0 点,虽然从点估计角度看水平均值估计有差别,但这种差异在 0.05 水平上是不显著的.
我们看到,\eqref{eq:8.2.1} 给出的置信区间与第六章中的两样本的 $t$ 区间基本一致,区别在于这里 $\sigma^2$ 的估计使用了全部样本而不仅仅是 $A_i, A_j$ 两个水平下的观测值.
\end{example}
\subsection{多重比较问题}
这里遇到一个新的问题,对每一组 $(i, j)$,\eqref{eq:8.1.2} 给出的区间的置信水平都是 $1-\alpha$,但对多个这样的区间,要求其同时成立,其联合置信水平就不再是 $1-\alpha$ 了. 譬如,设 $E_1,\cdots, E_k$ 是 $k$ 个随机事件,且有 $P(E_i)=1-\alpha$,$i=1,\cdots, k$,则其同时发生的概率
\begin{equation}
P\big(\bigcap_{i=1}^{k} E_{i}\big)=1-P\left(\bigcup_{i=1}^{k} \bar{E}_{i}\right) \geqslant 1-\sum_{i=1}^{k} P\left(\bar{E}_{i}\right)=1-k \alpha
\end{equation}
这说明它们同时发生的概率可能比 $1-\alpha$ 小很多.为了使它们同时发生的概率不低于 $1-\alpha$,一个办法是把每个事件发生的概率提高到 $1-a/k$.比如,如果我们同时考虑所有的 $k = r(r-1)/2$ 组对比 $\mu_i - \mu_j$ 的置信区间,则在~\eqref{eq:8.2.1} 中将 $t_{1-\alpha/2}(f_e)$ 替换为 $t_{1-\alpha/(2k)}(f_e)$ 即可.这将导致每个置信区间过长,联合置信区间的精度很差,一般人们不采用这种方法,而是采用我们下面介绍的多重比较来解决上述问题.
在方差分析中,如果经过F检验拒绝原假设,表明因子 $A$ 是显著的,即 $r$ 个水平对应的水平均值不全相等,此时,我们还需要进一步确认哪些水平均值间是确有差异的,哪些水平均值间无显著差异.
在 $r(r>2)$ 个水平均值中同时比较任意两个水平均值间有无明显差异的问题称为多意比较,多重比较即要以显著性水平 $a$ 同时检验如下 $r(r-1)/2$ 个假设
\begin{equation}\label{eq:8.2.2}
H_{0}^{ij}:\; \mu_i = \mu_j,\quad 1 \leq i < j \leq r.
\end{equation}
直观地看,当 $H_{0}^{ij}$ 成立时,$|\bar{y}_{i\cdot} - \bar{y}_{j\cdot}|$ 不应过大,因此,关子假设~\eqref{eq:8.2.2} 的拒绝域应有如下形式
\begin{equation*}
W = \bigcup_{1\leq i < j \leq r}\{|\bar{y}_{i\cdot} - \bar{y}_{j\cdot}| \geq \varepsilon_{ij}\},
\end{equation*}
诸临界值应~\eqref{eq:8.2.2} 成立时由 $P(W)=a$ 确定. 下面分重复数相等和不等分别介绍临界值的确定.
\subsection[重复数相等场合的 T 法]{重复数相等场合的 $T$ 法}
在重复数相等时,由对称性自然可以要求诸 $\varepsilon_{ij}$ 相等,记为 $c$. 记 $\hat{\sigma^2} = S_e/f_e$,则由给定条件不难有
\begin{equation*}
t_i = \frac{\bar{y}_{i\cdot} - \mu_i}{\hat{\sigma}/\sqrt{m}} \sim t(f_e),
\end{equation*}
于是当~\eqref{eq:8.2.2} 成立时,$\mu_1 = \cdots = \mu_r = \mu$,故有
\begin{align*}
P(W) & = P\left(\bigcup_{1\leq i < j \leq r} \{|\bar{y}_{i\cdot} - \bar{y}_{j\cdot}| \geq c\}\right)\\
& = 1- P\left(\bigcap_{1\leq i < j \leq r} \{|\bar{y}_{i\cdot} - \bar{y}_{j\cdot}| < c\}\right)\\
& = 1 - P(\max_{1\leq i < j \leq r} |\bar{y}_{i\cdot} - \bar{y}_{j\cdot}| < c) \\
& = P(\max_{1\leq i < j \leq r} |\bar{y}_{i\cdot} - \bar{y}_{j\cdot}| \geq c) \\
& = P\left(\max_{1 \leq i < j \leq r} \left|\frac{(\bar{y}_{i\cdot}-\mu) - (\bar{y}_{j\cdot}-\mu)}{\hat{\sigma}/\sqrt{m}}\right|\geq \frac{c}{\hat{\sigma}/\sqrt{m}}\right)\\
& = P\left(\max_{i} \frac{(\bar{y}_{i\cdot}-\mu)}{\hat{\sigma}/\sqrt{m}} - \min_{j}\frac{(\bar{y}_{j\cdot}-\mu)}{\hat{\sigma}/\sqrt{m}}\geq \frac{c}{\hat{\sigma}/\sqrt{m}}\right)
\end{align*}
这里 $q(r,f_e)=\max_{i} \frac{(\bar{y}_{i\cdot}-\mu)}{\hat{\sigma}/\sqrt{m}} - \min_{j} \frac{(\bar{y}_{j\cdot}-\mu)}{\hat{\sigma}/\sqrt{m}}$ 一般称为 $t$ 化极差统计量,这是因为它的结构类似子 $t$ 统计量 $q(r,f_e)$ 的分布与参数 $\mu, \sigma^2$ 无关,也与 $m$ 无关,该分布可由随机模拟方法得到,方法如下(不妨设 $\mu=0, \sigma^2=1, m=1)$: 对给定的 $r$ 和 $f_e$,
\begin{enumerate}[label=\color{structurecolor}(\arabic*)]
\item 从标准正态分布 $N(0,1)$ 产生 $r$ 个随机数 $x_1,\cdots, x_r$, 将该 $r$ 个随机数按从小到大排序得到 $x_{(1)}$ 和 $x_{(r))}$; \label{item:8.2.3.1}
\item 从自由度为 $f_e$ 的 $\chi^2$ 分布 $\chi^2(f_e)$ 产生一个随机数 $y$; \label{item:8.2.3.2}
\item 计算 $g =(x_{(r)}-x_{(1)}))/y$; \label{item:8.2.3.3}
\item 重复~\ref{item:8.2.3.1} 到~\ref{item:8.2.3.3} $N$ (例如 $10^4$ 或 $10^5$) 次, 即得 $g(r,f)$ 的 $N$ 个观测值, 由此可获得 $q(r,f)$ 的各种分位数.\\
于是, 由
\begin{equation}\label{eq:8.2.3}
P(W) = P(q(r,f_e)) \geq \sqrt{m} c/\hat{\sigma} = \alpha,
\end{equation}
可以得出
\begin{equation}\label{eq:8.2.4}
c = q_{1-\alpha}(r,f_e) \hat{\sigma}/\sqrt{m},
\end{equation}
其中 $q_{1-\alpha}(r,f_e)$ 表示 $g(r,f)$ 的 $1-\alpha$ 分位数,其值在附表 8 中给出.
至此,可将重复数相同时多重比较的步骤总结如下:对给定的显著性水平 $\alpha$,查多重比较的分位数 $q_{1-\alpha}(r,f)$ 表,计算 $c = q_{1-\alpha}(r,f_e)\hat{\sigma}/\sqrt{m}$,比较诸 $|\bar{y}_{i\cdot} - \bar{y}_{j\cdot}|$ 与 $c$ 的大小,若
\begin{equation*}
|\bar{y}_{i\cdot} - \bar{y}_{j\cdot} \geq c
\end{equation*}
则认为水平 $A_i$ 与水平 $A_j$ 间有显著差异,反之,则认为水平 $A_i$ 与水平 $A_j$ 间无明显差别. 这一方法最早由 Turkey 提出,因此称为 $T$ 法.
\end{enumerate}
\begin{example}
我们已在例~\ref{exam:8.1.2} 中指出饲料因于是显著的,下面进行多重比较,若取 $\alpha=0.05$,则查表知 $q_{1-0.05}(3,21)=3.57$,而 $\hat{\sigma} = 36.6554$. 所以 $c = 3.57 \times 36.6554/\sqrt{8} = 46.27$.
\end{example}
$\left|\bar{y}_{1.}-\bar{y}_{2.}\right|=|1024.25-1073.13|=48.88>46.27$, 认为 $\mu_1$ 与 $\mu_2$ 有显著差别;
$\left|\bar{y}_{1.}-\bar{y}_{3.}\right|=|1024.25-1044.25|=20<46.27$, 认为 $\mu_1$ 与 $\mu_3$ 无显著差别;
$\left|\bar{y}_{2.}-\bar{y}_{3.}\right|=|1073.13-1044.25|=46.88>46.27$, 认为 $\mu_2$ 与 $\mu_2$ 有显著差别.
由此可见,$\mu_1$ 与 $\mu_3$ 之间无显著差别,而它们与 $\mu_2$ 之间都有显著差异,即以鱼粉为主的饲料与以苜着粉为主的饲料在鸡的增重方面差别不明显,但以槐树粉为主的饲料则明显更有效.
\subsection[意复数不等场合的 S 法]{意复数不等场合的 $S$ 法}
在重复数不等时,沿用上面的记号,我们有
\begin{equation*}
\frac{(\bar{y}_{i\cdot} - \bar{y}_{j\cdot}) - (\mu_i - \mu_j)}{\sqrt{\frac{1}{m_i}+\frac{1}{m_j}}\hat{\sigma}} \sim t(f_e)
\end{equation*}
在假设~\eqref{eq:8.2.2} 成立时,$\mu_1 = \cdots = \mu_r = \mu$,于是有
\begin{equation*}
t_{ij} = \frac{(\bar{y}_{i\cdot} - \bar{y}_{j\cdot})}{\sqrt{\frac{1}{m_i}+\frac{1}{m_j}}\hat{\sigma}} \sim t(f_e) \quad \text{ 或 } F_{ij} = \frac{(\bar{y}_{i\cdot} - \bar{y}_{j\cdot})^2}{\left(\frac{1}{m_i}+\frac{1}{m_j}\right)\hat{\sigma}}^2 \sim F(1, f_e),
\end{equation*}
从而可以要求 $c_{ij} = c \sqrt{\frac{1}{m_i}+\frac{1}{m_j}}$, 类似于重复数相等时的推导,有
\begin{align*}
P(W) & = P \left[\bigcap_{1\leq i < j \leq r} \left(|\bar{y}_{i\cdot} - \bar{y}_{j\cdot}| \geq c \sqrt{\frac{1}{m_i}+\frac{1}{m_j}}\right)\right] \\
& = P \left[\max_{1 \leq i < j \leq r} \frac{|\bar{y}_{i\cdot} - \bar{y}_{j\cdot}|}{\sqrt{\frac{1}{m_i}+\frac{1}{m_j}}\hat{\sigma}} \geq \frac{c}{\hat{\sigma}}\right] \\
& = P \left[\max_{1 \leq i < j \leq r} \frac{(\bar{y}_{i\cdot} - \bar{y}_{j\cdot})^2}{\frac{1}{m_i}+\frac{1}{m_j}\hat{\sigma}} \geq \frac{c}{\hat{\sigma}^2}\right] \\
& = P(\max_{1\leq i < j \leq r} F_{ij} \geq (c/\hat{\sigma})^2).
\end{align*}
可以证明,$\frac{\max_{1\leq i < j \leq r} F_{ij}}{r-1} \sim F(r-1, f_e)$, 从而由 $P(W)=\alpha$ 可推出 $(c/\hat{\sigma})^2 = (r-1) F_{1-\alpha} (r-1, f_e)$, 亦即
\begin{equation*}
c_{ij} = \sqrt{(r-1) F_{1-\alpha}(r-1, f_e) \left(\frac{1}{m_i} + \frac{1}{m_j} \hat{\sigma}^2\right)}
\end{equation*}
\begin{example}\label{exam:8.2.3}
在例~\ref{exam:8.1.4} 中,我们已指出包装方式对食品销量有显著影响,此处 $r=4$, $f_e = 6$, $\hat{\sigma}^2 = 7.67$, 若取 $\alpha = 0.05$, 则 $F_{0.95}(3,6) = 4.76$. 注意到 $m_1 = m_4 = 2$, $m_2=m_3=3$, 故
\begin{align*}
c_{12} &=c_{13}=c_{24}=c_{34}=\sqrt{3 \times 4.76 \times(1 / 2+1 / 3) \times 7.67}=9.6 \\
c_{14} &=\sqrt{3 \times 4.76 \times(1 / 2+1 / 2) \times 7.67}=10.5 \\
c_{23} &=\sqrt{3 \times 4.76 \times(1 / 3+1 / 3) \times 7.67}=8.5
\end{align*}
由于
\begin{align*}
\left|\bar{y}_{1.}-\bar{y}_{2.} \right| &= 2 < c_{12},\\
\left|\bar{y}_{1.}-\bar{y}_{3.} \right| &= 4 < c_{13},\\
\left|\bar{y}_{1.}-\bar{y}_{4.} \right| &= 12 > c_{14},\\
\left|\bar{y}_{2.}-\bar{y}_{3.} \right| &= 6 < c_{23},\\
\left|\bar{y}_{2.}-\bar{y}_{4.} \right| &= 14 > c_{24},\\
\left|\bar{y}_{3.}-\bar{y}_{4.} \right| &= 8 < c_{34},
\end{align*}
这说明 $A_1, A_2, A_3$ 间无显著差异,$A_1, A_2$ 与 $A_4$ 有显著差异,但 $A_4$ 与 $A_3$ 的差异却尚未达到显著水平.综合上述,包装 $A_4$ 销售量最佳.
\end{example}
\begin{xiti}
\item 采用习题 8.1 中第 7 题的数据,对三种储藏方法的平均含水率在 $\alpha = 0.05$ 下作多重比较.
\item 采用习题 8.1 中第 8 题的数据,对五种推销方法在 $\alpha = 0.05$ 下作多重比较.
\item 有七种人造纤维,每种抽 4 根测其强度,得每种纤维的乎均强度及标准差如下:
\begin{center}
\begin{tabular}{cccccccc}
\toprule
i & 1 & 2 & 3 & 4 & 5 & 6 & 7 \\
\midrule
y & 6.3 & 6.2 & 6.7 & 6.8 & 6.5 & 7 & 7.1 \\
s & 0.81 & 0.92 & 1.22 & 0.74 & 0.88 & 0.58 & 1.05 \\
\bottomrule
\end{tabular}%
\end{center}
假定各种纤维的强度凝从等方差的正态分布.
\begin{enumerate}
\item 试问七种纤维强度间有无显着差异(取 $\alpha=0.05$);
\item 若各种纤维的强度间无显著差异,则给出乎均强度的置信水平为 0.95 的置信区间;若各种纤维的强度间有显著差异,请进一步在 $\alpha=0.05$ 下进行多重比较,并指出哪种纤维的平均强度最大,同时给出该种纤维平均强度的置信水平为 0.95 的置信区间.
\end{enumerate}
\item 一位经济学家对生产电子计算机设备的企业收集了在一年内生产力提高指数(用 0 到 100 内的数表示)并按过去三年间在科研和开发上的乎均花费分为三类:
\begin{center}
$A_1$: 花费少,\quad $A_2$: 花费中等,\quad $A_3$: 花费多.
\end{center}
生产力提高的指数如下表所示:
\begin{center}
\begin{tabular}{ccccccccccccc}
\toprule
水平 & \multicolumn{12}{c}{生产力提高指数} \\
\midrule
$A_1$ & 7.6 & 8.2 & 6.8 & 5.8 & 6.9 & 6.6 & 6.3 & 7.7 & 6 & & & \\
$A_2$ & 6.7 & 8.1 & 9.4 & 8.6 & 7.8 & 7.7 & 8.9 & 7.9 & 8.3 & 8.7 & 7.1 & 8.4 \\
$A_3$ & 8.5 & 9.7 & 10.1 & 7.8 & 9.6 & 9.5 & & & & & & \\
\bottomrule
\end{tabular}%
\end{center}
请列出方差分析表,并进行多重比较.
\end{xiti}
\section{方差齐次检验}\label{sec:8.3}
在单因子试验中 $r$ 个水平的指标可以用 $r$ 个正态分布 $N(\mu_i,\sum_i^2)$, $i=1,2,\cdots,r$ 表示. 在进行方差分析时要求 $r$ 个方差相等,这称为\textbf{方整齐性}\index{F!方差齐性}. 而方差齐性不一定自然具有. 理论研究表明,当正态性假定不满足时对 $F$ 检验影响较小,即 $F$ 检验对正态性的偏离具有一定的稳健性,而F检验对方差齐性的偏离较为敏感.所以 $r$ 个方差的齐性检验就显得十分必要.
所谓方差齐性检验是对如下一对假设作出检验:
\begin{equation}\label{eq:8.3.1}
H_0:\; \sum_1^2 = \sum_2^2 = \cdots = \sum_r^2 \text{ vs } H_1:\; \text{ 诸 } \sum_i^2 \text{ 不全相等}.
\end{equation}
很多统计学家提出了一些很好的检验方法,这里介绍几个最常用的检验,它们是:
\begin{itemize}
\item Hartley 检验,仅适用于样本量相等的场合;
\item Bartlett 检验,可用于样本量相等或不等的场合,但是每个样本量不得低于5;
\item 修正的 Bartlett 检验,在样本量较小或较大、相等或不等场合均可使用.
\end{itemize}
下面分别来叙述它们.
\subsection{Hartley 检验}
当各水平下试验重复次数相等时,即
\begin{equation*}
m_{1}=m_{2}=\cdots=m_{r}=m
\end{equation*}
Hartley 提出检验方差相等的检验统计量:
\begin{equation}\label{eq:8.3.2}
H=\frac{\max \left\{s_{1}^{2}, s_{2}^{2}, \cdots, s_{r}^{2}\right\}}{\min \left\{s_{1}^{2}, s_{2}^{2}, \cdots, s_{r}^{2}\right\}}
\end{equation}
它是 $r$ 个样本方差的最大值与最小值之比.这个统计量的分布尚无明显的表达式,但在诸方差相等条件下,可通过随机模拟方法获得H分布的分位数,该分布依赖于水平数 $r$ 和样本方差的自由度 $f=m-1$,因此该分布可记为 $H(r,f)$,其分位数表列于附表 10 上.
直观上看,当 $H_0$ 成立,即诸方差相等 $\sum_1^2 = \sum_2^2= \cdots = \sum_r^2$ 时,$H$ 的值应接近于1,当 $H$ 的值较大时,诸方差间的差异就大,$H$ 愈大,诸方差间的差异就愈大,这时应拒绝~\eqref{eq:8.3.1} 中的 $H_0$. 由此可知,对给定的显著性水平 $\alpha$,检验 $H_0$ 的拒绝域为
\begin{equation}
W=|H>H_{1-\alpha}(r, f)|
\end{equation}
其中 $H_{1-\alpha}(r,f)$ 为 $H$ 分布的 $1-\alpha$ 分位数.
\begin{example}
有四种不同牌号的铁锈防护剂(简称防锈剂),现要比较其防锈能力.为此,制作 40 个大小形状相同的铁块(试验样品),然后把它们随机分为四组,每组 10 件样品. 在每一组样品上涂上同一牌号的防锈剂,最后把 40 个样品放在一个广场上让其经受日晒、风吹和雨打.一段时间后再行观察其防锈能力.由于防锈能力无测量仪器,只能请专家评分. 五位受聘专家对评分标准进行讨论,取得共识. 样品上无锈迹的评 100 分,全锈了评 0 分. 他们在不知牌号的情况下进行独立评分. 最后把一个样品的 5 个专家所给分数的平均值作为该样品的防锈能力.数据列于表~\ref{tab:8.3.1} 上.
% Table generated by Excel2LaTeX from sheet 'Sheet1'
\begin{table}[htbp]
\centering
\caption{防锈能力数据及有关计算}
\begin{tabular}{c|c|cccc}
\toprule
\multicolumn{2}{c|}{因子 $A$ (防锈剂)} & \multicolumn{1}{l}{$A_1$} & \multicolumn{1}{l}{$A_2$} & \multicolumn{1}{l}{$A_3$} & \multicolumn{1}{l}{$A_4$} \\
\midrule
\multirow{10}[2]{*}{$y_{ij}$} &1 & 43.9 & 89.8 & 68.4 & 36.2 \\
& 2 & 39 & 87.1 & 69.3 & 45.2 \\
& 3 & 46.7 & 92.7 & 68.5 & 40.7 \\
& 4 & 43.8 & 90.6 & 66.4 & 40.5 \\
& 5 & 44.2 & 87.7 & 70 & 39.3 \\
& 6 & 47.7 & 92.4 & 68.1 & 40.3 \\
& 7 & 43.6 & 86.1 & 70.6 & 43.2 \\
& 8 & 38.9 & 88.1 & 65.2 & 38.7 \\
& 9 & 43.6 & 90.8 & 63.8 & 40.9 \\
& 10 & 40 & 89.1 & 69.2 & 39.7 \\
\midrule
\multicolumn{2}{c|}{和 $T_i$} & 431.4 & 894.4 & 679.5 & 404.7 \\
\multicolumn{2}{c|}{均值 $\bar{y}_i$} & 43.14 & 89.44 & 67.95 & 40.47 \\
\multicolumn{2}{c|}{组内平方和 $Q_i$} & 81.00 & 44.28 & 42.33 & 53.42 \\
\bottomrule
\end{tabular}%
\label{tab:8.3.1}%
\end{table}%
这是一个重复次数相等的单因子试验.我们考虑用方差分析方法对之进行比较分析,为此,首先要进行方差齐性检验本例中,四个样本方差可由表~\ref{tab:8.3.1} 中诸 $Q_i$ 求出,即
\begin{align*}
s_1^2 = \frac{81.00}{9} = 9.00, \; s_2^2 = \frac{44.28}{9} = 4.92,
s_3^2 = \frac{42.33}{9} = 4.70, \; s_4^2 = \frac{53.42}{9} = 4.94
\end{align*}
由此可得统计量 $H$ 的值
\begin{equation*}
H = \frac{9.00}{4.70} = 1.9149.
\end{equation*}
在 $\alpha=0.05$ 时,由附表 10 查得 $H_{0.95}(4,9)=6.31$,由于 $H<6.31$,所以应该接收原假设 $H_0$,即认为四个总体方差间无显著差异.
进一步,在正态性检验通过(用正态概率纸)的情况下,我们可用方差分析方法对四种不同牌号的防锈剂比较其防锈能力.由表~\ref{tab:8.3.1} 的数据可以算出 $T = T_1 + \cdots + T_a = 2410$,从而求得三个偏差平方和分别为
\begin{align*}
S_{T} & =43.9^{2}+39.2^{2}+\cdots+40.9^{2}+39.7^{2}-\frac{2410^{2}}{40}=16174.50, f_{T}=39 \\
S_{A} & =\frac{1}{10}\left(431.4^{2}+894.4^{2}+679.5^{2}+404.7^{2}-\frac{2410^{2}}{40}=15953.47, f_{A}=3\right. \\
S_{e} & =S_{T}-S_{A}=221.03, f_{e} = 36
\end{align*}
把上述各项移到方差分析表上,可继续计算各均方和与 $F$ 比,具体见表~\ref{tab:8.3.2}.
% Table generated by Excel2LaTeX from sheet 'Sheet2'
\begin{table}[htbp]
\centering
\caption{防锈能力的方差分析表}
\begin{tabular}{lrrrr}
\toprule
\multicolumn{1}{c}{来源} & \multicolumn{1}{c}{平方和} & \multicolumn{1}{c}{自由度} & \multicolumn{1}{c}{均方和} & \multicolumn{1}{c}{$F$ 比} \\
\midrule
因子 $A$ & 15953.47 & 3 & 5317.82 & 866.09 \\
误差 $e$ & 221.03 & 36 & 6.14 & \\
和 $T$ & 16174.5 & 39 & & \\
\bottomrule
\end{tabular}%
\label{tab:8.3.2}%
\end{table}%
若给定显著性水平 $\alpha = 0.05$,查表可得 $F_{0.95}(3,36)=2.87$,由于 $F>2.87$,故因子 $A$ 显著,即四种防锈剂的防锈能力有显著差异.
各种防锈剂的防锈能力均值分别为
\begin{gather*}
\hat{\mu}_1=43.14, \hat{\mu}_2=89.44, \hat{\mu}_3=67.95, \hat{\mu}_4 = 40.47,
\end{gather*}
第二种牌号的防锈剂的防锈能力最强.
此外,试验误差的方差 $\sigma^2$ 的估计为 $\hat{\sigma^2}=6.14$, $\sum$ 的估计为 $\hat{\sigma}=\sqrt{6.14}=
2.48$.
由于第二种牌号的防锈剂的防锈能力最强,我们还可求出其均值 $\mu_2$ 的 $95\%$ 的置信区间,现在 $t_{1-\alpha/2}(n-r)=t_{0.975}(36)=2.0281$, $\hat{\sigma}=2.48$, $m=10$, $\hat{\mu}_2=\bar{y}_2=89.44$, 则
\begin{equation*}
\hat{y}_{2} \pm t_{1-\alpha / 2}(n-r) \hat{\sigma} / \sqrt{m}=89.44 \pm 1.73
\end{equation*}
即 $A_2$ 的 95\% 的置信区间为 $[87.71, 91.17]$.
\end{example}
\subsection{Bartlett 检验}
在单因子方差分析中有 $r$ 个样本,设第 $i$ 个样本方差为:
\begin{equation*}
s_{i}^{2}=\frac{1}{m_{i}-1} \sum_{j=1}^{m_{i}}\left(y_{i j}-\hat{y}_{\imath}\right)^{2}=\frac{Q_{i}}{f_{i}}, \quad i=1,2, \cdots, r
\end{equation*}
其中 $m_i$ 为第 $i$ 个样本的容量(即试验重复次数),$Q_i = \sum_{j=1}^{m_i} (y_{ij} - \bar{y}_i)^2$ 与 $f_i =m_i -1$ 为该样本的偏差平方和及自由度. 由于误差均方和
\begin{equation*}
M S_{e}=\frac{1}{f_{e}} \sum_{i=1}^{r} Q_{i}=\sum_{i=1}^{r} \frac{f_{i}}{f_{e}^{2}} s_{i}^{2}
\end{equation*}
它是 $r$ 个样本方差 $s_1^2,s_2^2, \cdots, s_r^2$ 的(加权)算术平均数. 而相应的 $r$ 个样本方差的几何平均数记为 $GMS_e$, 它是:
\begin{equation*}
GMS_e = [(s_1^2)^{f_1}(s_2^2)^{f_2} \cdots (s_r^2)^{f_r}]^{1/f_e}
\end{equation*}
其中 $f_e = f_1 + f_2 + \cdots + f_r = \sum_{i=1}^r(m_i - 1) = n-r$.
由于几何平均数总不会超过算术平均数,故有
\begin{equation}
GMS_e \leq MS_e
\end{equation}
其中等号成立当且仅当诸 $s_i^2$ 系彼此相等,若诸 $s_i^2$ 间的差异愈大, 则此两个平均值相差也愈大. 由此可见,当诸总体方差相等时,其样本方差间不应相差较大,从而比值 $MS_e/GMS_e$ 接近于1.反之,在比值 $MS_e/GMS_e$ 较大时,就意味着诸样本方差差异较大,从而反映诸总体方差差异也较大.这个结论对此比值的对数也成立.从而检验~\eqref{eq:8.3.1} 表示的一对假设的拒绝域应是
\begin{equation}\label{eq:8.3.4}
W=\left\{\ln \left(M S_{e} / G M S_{e}\right)>d\right\}
\end{equation}
Bartlett 证明了: 在大样本场合, $\ln(MS_e/GMS_e)$ 的某个函数近似服从自由度为 $r-1$ 的 $\chi^2$ 分布, 具体是:
\begin{equation}\label{eq:8.3.5}
B=\frac{f_{e}}{C}(\ln M S_{e}-\ln G M S_{e}) \sim \chi^{2}(r-1).
\end{equation}
其中
\begin{equation}\label{eq:8.3.6}
C = 1 + \frac{1}{3(r-1)} \left[\sum_{i=1}^{r} \frac{1}{f_{i}}-\frac{1}{f_{e}}\right]
\end{equation}
等号成立当且仅当诸
且 $C$ 通常会大于 1. 根据上述结论,可取
\begin{equation}\label{eq:8.3.7}
B=\frac{1}{C}\left[f_{e} \ln M S_{e}-\sum_{i=1}^{r} f_{i} \ln s_{i}^{2}\right]
\end{equation}
作为检验统计量,对给定的显著性水平 $\alpha$,检验的拒绝域为
\begin{equation}
\boldsymbol{W}=\{ B>\chi_{1-\alpha}^{2}(r-1) \}
\end{equation}
考虑到这里 $\chi^2$ 分布是近似分布,在诸样本量 $m_i$ 均不小于 5 时使用上述检验是适当的.