-
Notifications
You must be signed in to change notification settings - Fork 38
/
chapter2.tex
4313 lines (3523 loc) · 177 KB
/
chapter2.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
% !TeX root = main.tex
% Edit by: CamuseCao
\setcounter{chapter}{1}
\chapter{随机变量及其分布}
为了进行定量的数学处理,必须把随机现象的结果数量化.这就是引进随机变量的原因随机变量的引进使得对随机现象的处理更简单与直接,也更统一而有力.本章我们将主要讨论一维随机变量及其分布.
\section{随机变量及其分布}
在第一章中我们曾提及随机变量,在那里我们把“用来表示随机现象结果的变量“称为随机变量,其中“表示”一词的含义是什么?这是要进一步探讨的问题.
\subsection{随机变量的概念}
在随机现象中有很多样本点本身就是用数量表示的,由于样本点出现的随机性,其数量呈现为随机变量,譬如
\begin{itemize}
\item 掷一颗散子,出现的点数$X$是一个随机变量.
\item 每天进入某超市的顾客数$Y$;顾客购买商品的件数 $U$;顾客排队等候付款的时间 $V,Y,LU,V$ 是三个不同的随机变量,
\item 电视机的寿命$T$是一个随机变量.
\item 测量的误差 $\varepsilon $ 是一个随机变量.
\end{itemize}
在随机现象中还有不少样本点本身不是数,这时可根据研究需要设计随机变量,譬如
\begin{itemize}
\item 检查一个产品,只考察其合格与否,则其样本空间为$\Omega=\{$合格品,不合格品$\}$, 这时可设计一个随机变量 $X$ 如下:
\end{itemize}
\begin{table}[htbp]
\centering
\begin{tabular}{ccc}
样本点 & & $X$的取值 \\\hline
合格品 & $ \longrightarrow $ & 0 \\
不合格品 & $ \longrightarrow $ & 1 \\
\end{tabular}%
\end{table}%
在此可将 $ X $ 解释为“检查一个产品中不合格品数”.若此种产品的不合格品率为$ p $,则$ X $取各种值的概率可列表如下:
\begin{table}[htbp]
\centering
\begin{tabular}{c|cc}
$ X $ & $ 0 $ & $ 1 $ \\\hline
$ P $ & $ 1-p $ & $ p $ \\
\end{tabular}%
\end{table}%
\begin{itemize}
\item 检查三个产品,则有8个样本点,若记$X$为“三个产品中的不合格品数”,则$ X $与样本点之间有如下对应关系:
\end{itemize}
\begin{table}[htbp]
\centering
\begin{tabular}{ccc}
样本点 & & $ X $的取值 \\\hline
$ \omega_1=(0,0,0) $ & $ \longrightarrow $ & 0 \\
$ \omega_2=(1,0,0) $ & $ \longrightarrow $ & 1 \\
$ \omega_3=(0,1,0) $ & $ \longrightarrow $ & 1 \\
$ \omega_4=(0,0,1) $ & $ \longrightarrow $ & 1 \\
$ \omega_5=(0,1,1) $ & $ \longrightarrow $ & 2 \\
$ \omega_6=(1,0,1) $ & $ \longrightarrow $ & 2 \\
$ \omega_7=(1,1,0) $ & $ \longrightarrow $ & 2 \\
$ \omega_8=(1,1,1) $ & $ \longrightarrow $ & 3 \\
\end{tabular}%
\end{table}%
这样$ X $取各种值就是如下的互不相容的事件:
\begin{equation}
\begin{array}{ll}
{ \{ X=0 \}=\{\omega_{1}\} ;} & \{ X=1 \}=\{\omega_{2}, \omega_{3}, \omega_{4} \}; \\
{ \{ X=2 \}=\{\omega_{5}, \omega_{6}, \omega_{7}\}};\quad &{\{ X=3\}=\{ \omega_{8} \}}.
\end{array}
\end{equation}
若此种产品的不合格品率为$ p $,则$ X $取各种值的概率可列表如下:
\[
\begin{array}{c|cccc}{x} & {0} & {1} & {2} & {3} \\ \hline P & {(1-p)^{3}} & {3 p(1-p)^{2}} & {3 p^{2}(1-p)} & {p^{3}}\end{array}
\]
\begin{definition}{}{}
定义在样本空间$\Omega$上的实值函数$ X=X(\omega) $称为\textbf{随机变量}, \index{S!随机变量}常用大写字母$ X,Y,Z $等表示随机变量,其取值用小写字母$ x,y,z$等表示.假如一个随机变量仅取有限个或可列个值,则称其为\textbf{离散随机变量}. \index{S!随机变量!离散随机变量}假如一个随机变量的可能取值充满数轴上的一个区间$ (a,b) $, 则称其为\textbf{连续随机变量}, \index{S!随机变量!连续随机变量}其中$ a $可以是$ -\infty ,b $可以是$ +\infty $.
\end{definition}
这个定义表明:随机变量$ X $是样本点$ \omega $的一个函数,这个函数可以是不同样本点对应不同的实数,也允许多个样本点对应同一个实数.这个函数的自变量(样本点)可以是数,也可以不是数,但因变量一定是实数.
与微积分中的变量不同,概率论中的随机变量$ X $是一种“随机取值的变量”.以认识离散随机变例,我们不仅要知道$ Y $取哪些值,而且还要知道它取这些值的概率各是多少,这就需要分布的概念.有没有分布是区分一般变量与随机变量的主要标志.
\subsection{随机变量的分布函数}
随机变量$ X $是样个点$ \omega $的一个值函数.若$ B $是某些实数组成的集合,即$ B\subset \MR , \MR $表示实数集、则$ X\in B $表示如下的随机事件
\[
\{\omega: X(\omega)\in B\} \subset \Omega
\]
这就是我们可以用随性变立量得某些取值来表示随机事件的依据.臂如
\begin{itemize}
\item 记$ X $表示掷一颗骰子出现的点数,明$ X $的可能取值为$ 1,2,\cdots ,6 $.这是一个离散随机变量.事件$A=$“点数小于等于3”,可以表示为$ A=\{X\leq 3\} $.
\item 记$ Y $表示一天内到达某商场的顾客数.则$ Y $的可能取值为$ 0,1,2\dotsc ,n\dotsc $这也是一个离散随机变量.事件$B=$“至少来1000位顾客”,可以表示为$ B=\{ X\geq 1000 \} $.
\item 记$ T $表示某电器品的使目寿命,则$T$的可能取值充满区间$ [0,+o\infty ) $.这楚一个连续随机变量.事件$C=$“使用寿命在40000至50000小时之间”,可以表示为$ C=\{ 40000 \le T\le 50000 \} $.
\end{itemize}
为了掌握$ X $的统计规律性,我们只要掌握$ X $取各种值的概率.由于
\[
\{a < X \leq b \} = \{ X \leq b\} - \{x\leq a\},
\]
因此只要对任意实数$ x $,知道了件$ X\geq x $的概率就够了,这个概率具有累积特性,常用$ F $表示.另外这个概率与$ x $有关,不同的$ x $,此累积概率的值也不同,为此记
\[
F(x) = P(X\leq x),
\]
于是$ F(x) $所有$ x\in(-\infty,+\infty) $都有定义,而$ F(x) $是定义在$ (\infty,+\infty ) $上、取值于$ [0,1] $的一个函数.这就是我们下面要引入的分布函数.
\begin{definition}{}{}
设$ X $是一个随机变量,对任意实数$ x $,称
\begin{equation}
F(x)=P(X \leqslant x) \label{2.1.1}
\end{equation}
为随机变量$ X $的\textbf{分布函数}\index{S!随机变量!分布函数}.且称$ X $服从$ F(x) $,记为$ X\sim F(x) $.有时也可用$F_{X}(x)$以表明是$ X $的分布函数(把$ X $作为$ F $的下标).
\end{definition}
\begin{example}
向半径为$ r $的圆内随机抛一点,求此点到圆心之距离$ X $的分布函数$ F(x) $,并求$P\left(X>\frac{2 r}{3}\right)$.
\end{example}
\begin{solution}
事件“$ X\le x $”表示所抛之点落在半径为$x(0 \leqslant x \leqslant r)$的圆内,故由几何概率知
\[
F(x)=P(X \leqslant x)=\frac{\pi x^{2}}{\pi r^{2}}=\left(\frac{x}{r}\right)^{2},
\]
从而
\[
P\left(X>\frac{2 r}{3}\right)=1-P\left(X \leqslant \frac{2 r}{3}\right)=1-\left(\frac{2}{3}\right)^{2}=\frac{5}{9}.
\]
\end{solution}
从分布函数的定义可见,任一随机变量$ X $(离散的或连续的)都有一个分布函数.有了分布函数,就可据此算得与随机变量$ X $有关事件的概率.下面先证明分布函数的三个基本性质.
\begin{theorem}{}{}
任一分布函数$F(x)$都具有如下三条基本性质:
\begin{enumerate}
\item \textbf{单调性} $ F(x) $是定义在整个实数轴$ (-\infty,+\infty ) $上的单调非减函数,即对任意的$ x_1<x_2 $,有$ F(x_1)\leq F(x_2) $.
\item 有界性对任意的$ x $,有$ 0\leq F(x)\leq 1 $,且
\[
\begin{array}{l}{F(-\infty)=\lim _{x \rightarrow-\infty} F(x)=0}, \\ {F(+\infty)=\lim _{x \rightarrow+\infty} F(x)=1}.\end{array}
\]
\item 右连续性$ F(x) $是$ x $的右连续函数,即对任意的$ x_0 $,有
\[
\lim _{x \rightarrow x_{0}+} F(x)=F\left(x_{0}\right),
\]
即
\[
F\left(x_{0}+0\right)=F\left(x_{0}\right)
\]
\end{enumerate}
\end{theorem}
\begin{proof}
(1)是显然的,下证(2).由于$ F(x) $是事件$\{X \leqslant x\}$的概率,所以$ 0\leq
F(x)\leq 1 $.由$ F(x) $的单调性知,对任意整数$ m $和$ n $,有
\[
\lim _{x \rightarrow-\infty} F(x)=\lim _{m \rightarrow-\infty} F(m), \lim _{x \rightarrow+\infty} F(x)=\lim _{n \rightarrow+\infty} F(n)
\]
都存在.又由概率的可列可加性得
\begin{align*}
1 & = P(-\infty<X<+\infty) = P\left(\bigcup_{i=-\infty}^{+\infty}\{i-1<X \leqslant i\}\right) \\ & = \sum_{i=-\infty}^{+\infty} P(i-1<X \leqslant i)=\lim _{n \rightarrow+\infty \atop m \rightarrow-\infty} \sum_{i =m}^{n} P(i-1<X \leqslant i) \\
&=\lim _{n \rightarrow+\infty} F(n)-\lim _{m \rightarrow-\infty} F(m)
\end{align*}
再证(3),因为$ F(x) $是单调有界非降函数,所以其任一点$ x_0 $的右极限$ F(x_0+0) $必存在.为证右连续性,只要对单调下降的数列$x_{1}>x_{2}>\cdots>x_{n}>\cdots>x_{0}$,当$x_{n} \rightarrow x_{0}(n \rightarrow+\infty)$时,证明$\lim _{n \rightarrow+\infty} F\left(x_{n}\right)=F\left(x_{0}\right)$成立即可.因为
\begin{align*}
F\left(x_{1}\right)-F\left(x_{0}\right) & =P\left(x_{0}<X \leqslant x_{1}\right)=P\left(\bigcup_{r=1}^{+\infty}\left\{x_{i+1}<X \leqslant x_{i}\right\}\right) \\
&=\sum_{i=1}^{+\infty} P\left(x_{i+1}<X \leqslant x_{i}\right)=\sum_{i=1}^{+\infty}\left[F\left(x_{i}\right)-F\left(x_{t+1}\right)\right] \\
&=\lim _{n \rightarrow \infty}\left[F\left(x_{1}\right)-F\left(x_{n}\right)\right]=F\left(x_{1}\right)-\lim _{n \rightarrow \infty} F\left(x_{n}\right)
\end{align*}
\end{proof}
由此得
\[
F\left(x_{0}\right)=\lim _{x \rightarrow+\infty} F\left(x_{n}\right)=F\left(x_{0}+0\right)
\]
至此三条基本性质全部证得.
以上三条基本性质是分布函数必须具有的性质,还可以证明:满足这三个基本性质的函数一定是某个随机变量的分布函数.从而这三个基本性质成为判别某个函数是否能成为分布函数的充要条件.
有了随机变量$ X $的分布函数,那么有关$ X $的各种事件的概率都能方便地用分布函数来表示了,例如,对任意的实数$ a $与$ b $,有
\begin{align*}
&P(a<X \leqslant b) = F(b)-F(a),\\
&P(X=a) = F(a)-F(a-0), \\
&P(X \geqslant b) = 1-F(b-0), \\
&P(X>b) = 1-F(b), \\
&P(a<x<b) = F(b-0)-F(a), \\
&P(a \leqslant X \leqslant b) = F(b)-F(a-0), \\
&P(a \leqslant X<b) = F(b-0)-F(a-0).
\end{align*}
特别当$ F(x) $在$ a $与$ b $处连续时,有
\[
F(a-0)=F\langle a), \quad F(b-0)=F(b).
\]
这些公式将会在今后的概率计算中经常遇到.
\begin{example}
设有一反正切函数
\[
F(x)=\frac{1}{\pi}\left[\arctan x+\frac{\pi}{2}\right], \quad-\infty<x<+\infty
\]
它在整个数轴上是连续、单调严增函数,且$F(+\infty)=1, F(-\infty)=0$.由于此$ F(x) $满足分布函数的三个基本性质,故$ F(x) $是一个分布函数.称这个分布函数为柯西分布函数,其图形见图~\ref{fig:2-1-1}.
\begin{figure}[!ht]
\centering
\begin{tikzpicture}[>=Stealth,xscale=1.3,yscale=2,semithick]
\draw[->](-2,0)--(0,0)node[below left]{$O$}--(2,0)node[below]{$x$};
\draw[->](0,-0.5)--(0,1.3)node[left]{$F(x)$};
\draw[dashed](-2,1)--(2,1)(1,0)node[below]{$1$}--(1,0.75)--(0,0.75)node[left]{$F(1)$}
(-1,0)node[below]{$-1$}--(-1,0.25)--(0,0.25)node[right]{$F(-1)$};
\draw[thick,domain=-2:2,samples=100]plot(\x,{(atan(\x))/180+0.5});
\end{tikzpicture}
\caption{柯西分布函数}\label{fig:2-1-1}
\end{figure}
若$X$服从柯西分布,则
\[
\begin{aligned} P(-1 \leqslant X \leqslant 1) &=F(1)-F(-1) \\ &=\frac{1}{\pi}[\arctan (1)-\arctan (-1)] \\ &=\frac{1}{\pi}\left[\frac{\pi}{4}-\left(-\frac{\pi}{4}\right)\right]=\frac{1}{2} \end{aligned}
\]
\end{example}
\subsection{离散随机变量的概率分布列}
对离散随机变量而言,常用以下定义的分布列来表示其分布.
\begin{definition}{}{}
设$ X $是一个离散随机变量,如果$ X $的所有可能取值是$ x_1,x_{2}, \cdots, x_{n}, \cdots$ 则称$ X $取$ x_i $, 的概率
\begin{equation}
p_{i}=p\left(x_{i}\right)=P\left(X=x_{i}\right), i=1,2, \cdots, n, \cdots \label{eq:2.1.2}
\end{equation}
为$ X $的概率分布列或简称为分布列,记为$X \sim\left|p_{t}\right|$,分布列也可用如下列表方式来表示:
\[
\begin{array}{c|ccccc}
X & x_{1} & x_{2} & \cdots & x_{n} & \cdots \\ \hline
P & p(x_1) & p(x_2) & \cdots & p(x_n) & \cdots \\
\end{array}
\]
或记成
\[
\left( \begin{array}{ccccc}{x_{1}} & {x_{2}} & {\cdots} & {x_{n}} & {\cdots} \\ {p\left(x_{1}\right)} & {p\left(x_{2}\right)} & {\cdots} & {p\left(x_{n}\right)} & {\cdots}\end{array}\right]
\]
\end{definition}
第一章中我们已见过多个分布列,不同的离散随机变量可能有不同的分布列,甚至在一个样本空间上可以定义几个服从不同分布列的随机变量,这要看我们的研究需要,下面就是在同一样本空间上给出几个不同随机变量的具体例子.
\begin{example}
掷两颗骰子,其样本空间$\Omega$含有36个等可能的样本点
\[
\Omega=\{(x, y) ; x, y=1,2, \cdots, 6\}
\]
在$ \Omega $上定义如下3个随机变量$ X,Y $和$ Z $:
\begin{itemize}
\item $ X $为点数之和,其可能取值为$2,3, \cdots, 12$等共11个值,其定义见~\ref{fig:2-1-2}(a)
\item $ Y $为6点的个数,其可能取值为$ 0,1,2 $等共$ 3 $个值,其定义见图~\ref{fig:2-1-2}(b).
\item $ Z $为最大点数,其可能取值为$1,2, \cdots, 6$等共$ 6 $个值,其定义见图~\ref{fig:2-1-2}(c)
\end{itemize}
\end{example}
\begin{figure}[!ht]
\centering
\subfloat[点数之和$X$的定义]{
\begin{tikzpicture}[scale=0.5]
\draw(-0.5,0)--(8,0)(0,-0.5)--(0,7);
\foreach \x in{1,2,3,4,5,6}
\draw(\x,0)node[below]{$\x$}--(\x,0.12)(0,\x)node[left]{$\x$}--(0.12,\x);
\foreach \x in{1,2,3,4,5,6}\foreach \y in{1,2,3,4,5,6}
\fill(\x,\y)circle(2pt);
\foreach \x in{1.2,2.2,...,6.2}
\draw[rounded corners=1.5pt,xshift=-0.1cm,yshift=-0.1cm](\x,0.7)--(\x+0.2,1)--(1,\x+0.2)--(0.7,\x)--cycle;
\foreach \x in{1.2,2.2,...,5.2}
\draw[semithick,rounded corners=1.5pt,xshift=0.1cm,yshift=0.1cm,rotate around={180:(3.5,3.5)}]
(\x,0.7)--(\x+0.2,1)--(1,\x+0.2)--(0.7,\x)--cycle;
\foreach\x in{2,3,5}\node[fill=white,font=\footnotesize,inner sep=0pt]at(0.82,\x-1.5){$X=\x$};
\foreach \x in{4,6}\node[fill=white,font=\footnotesize,inner sep=0pt]
at(\x-1,0.42){$X=\x$};
\foreach \x in{7,...,12}\node[fill=white,font=\footnotesize,inner sep=0pt]
at(7.3,\x-6){$X=\x$};
\end{tikzpicture}
}\hfill
\subfloat[$6$点的个数$Y$的定义]{
\begin{tikzpicture}[scale=0.5]
\draw(-0.5,0)--(8,0)(0,-0.5)--(0,7);
\foreach \x in{1,2,3,4,5,6}
\draw(\x,0)node[below]{$\x$}--(\x,0.2)(0,\x)node[left]{$\x$}--(0.2,\x);
\foreach \x in{1,2,3,4,5,6}\foreach \y in{1,2,3,4,5,6}
\fill(\x,\y)circle(2pt);
\draw[rounded corners=1.5pt,semithick](0.8,0.8)--(5.2,0.8)--(5.2,5.2)--(0.8,5.2)--cycle;
\draw[rounded corners=1.5pt,semithick](0.8,5.7)--(0.8,6.3)[sharp corners]--(5.1,6.3)--
(6.3,5.1)[rounded corners=1.5pt]--(6.3,0.8)--(5.7,0.8)[sharp corners]--(5.7,5.1)
--(5.1,5.7)[rounded corners=1.5pt]--cycle;
\draw[semithick,rounded corners=1.5pt,xshift=0.1cm,yshift=0.1cm,rotate around={180:(3.5,3.5)}]
(1.2,0.7)--(1.4,1)--(1,1.4)--(0.7,1.2)--cycle;
\node[fill=white,font=\footnotesize,inner sep=0pt]at(3,3.5){$Y=0$};
\node[fill=white,font=\footnotesize,inner sep=0pt]at(7.3,3.5){$Y=1$};
\node[fill=white,font=\footnotesize,inner sep=0pt]at(7.3,6){$Y=2$};
\end{tikzpicture}
}\hfill
\subfloat[最大点数$Z$的定义]{
\begin{tikzpicture}[scale=0.5]
\draw(-0.5,0)--(8,0)(0,-0.5)--(0,7);
\foreach \x in{1,2,3,4,5,6}
\draw(\x,0)node[below]{$\x$}--(\x,0.2)(0,\x)node[left]{$\x$}--(0.2,\x);
\foreach \x in{1,2,3,4,5,6}\foreach \y in{1,2,3,4,5,6}
\fill(\x,\y)circle(2pt);
\draw[semithick](1,1)circle(0.25cm);
\foreach \x in {2,3,4,5,6}
\draw[rounded corners=1.5pt](1,\x-0.25)arc(270:90:0.25)--(\x+0.25,\x+0.25)
--(\x+0.25,1)arc(0:-180:0.25)--(\x-0.25,\x-0.25)--cycle;
\node[fill=white,font=\footnotesize,inner sep=0pt]at(1,0.4){$Z=1$};
\foreach \x in {2,3,4,5,6}
\node[fill=white,font=\footnotesize,inner sep=0pt]at(\x-0.54,\x-0.4){$Z=\x$};
\end{tikzpicture}
}
\caption{同一样本空间上不同随机变量}\label{fig:2-1-2}
\end{figure}
这三个随机变量的分布列可用古典方法算得如下:
·.
% Table generated by Excel2LaTeX from sheet '1'
\begin{table}[htbp]
\centering
\begin{tabular}{c|cccccrrrrrr}
X & 2 & 3 & 4 & 5 & 6 & \multicolumn{1}{c}{7} & \multicolumn{1}{c}{8} & \multicolumn{1}{c}{9} & \multicolumn{1}{c}{10} & \multicolumn{1}{c}{11} & \multicolumn{1}{c}{12} \\\hline
P & $ \frac{1}{36} $ & $ \frac{2}{36} $ & $ \frac{3}{36} $ & $ \frac{4}{36} $ & $ \frac{5}{36} $ & $ \frac{6}{36} $ & $ \frac{5}{36} $ & $ \frac{4}{36} $ & $ \frac{3}{36} $ & $ \frac{2}{36} $ & $ \frac{1}{36} $\\
\end{tabular}%
\begin{tabular}{c|ccc}
$ Y $ & 0 & 1 & 2 \\\hline
$ P $ & $ \frac{25}{36} $ & $ \frac{10}{36} $ & $ \frac{1}{36} $ \\
\end{tabular}%
\begin{tabular}{c|rccccc}
$ Z $ & 1 & 2 & 3 & 4 & 5 & 6 \\\hline
$ P $ & $ \frac{1}{36} $ & $ \frac{3}{36} $ & $ \frac{5}{36} $ & $ \frac{7}{36} $ & $ \frac{9}{36} $ & $ \frac{11}{36} $\\
\end{tabular}%
\end{table}%
类似地,还可以在这个样本空间上定义其他的离散随机变量.
分布列的基本性质
(1)非负性:$: p\left(x_{t}\right) \geqslant 0, i=1,2, \cdots$;
(2)正则性:$\sum_{i=1}^{\infty} p\left(x_{i}\right)=1$.
以上两条基本性质是分布列必须具有的性质,也是判别某个数列是否成为分布列的充要条件
由离散随机变量X的分布列很容易写出X的分布函数:
\[
F(x)=\sum_{x_{1} \leqslant x} p\left(x_{i}\right)
\]
它的图形是有限级(成无穷级)的阶梯函数,具体见下面的例子.不过在离散场合,常用来描述其分布的是分布列,很少用到分布函数.因为求离散随机变量X的有关事件的概率时,用分布列比用分布函数来得更方便.
\begin{example}
设离散随机变量 $X$ 的分布列为
\[
\begin{array}{c|ccc}
x & -1 & 2 & 3 \\\hline
P & 0.25 & 0.5 & 0.25 \\
\end{array}
\]
试求$P(X \leqslant 0.5), P(1.5<X \leqslant 2.5)$,并写出$ X $的分布函数.
\end{example}
\begin{solution}
\[
\begin{array}{l}{P(X \leqslant 0.5)=P(X=-1)=0.25} \\ {P(1.5<X \leqslant 2.5)=P(X=2)=0.5}\end{array}
\]
\[
F(x) = \begin{cases}
0, & x<-1; \\
0.25, & -1 \leqslant x<2; \\
0.25 + 0.5 = 0.75, & 2 \leqslant x < 3; \\
0.25 + 0.5 + 0.25 = 1, & x \geqslant 3.
\end{cases}
\]
$ F(x) $的图形如图~\ref{fig:2-1-3} 所示,它是一条阶梯形的曲线,在$ X $的可能取值$-1,2,3$处有跳跃点,其跳跃度分别为$ 0.25,0.5,0.25 $ .
特别, 常量$ c $可看作仅取一个值的随机变量$X$, 即
\begin{figure}
\centering
\begin{tikzpicture}[>=Stealth]
\draw[->](-2,0)--(0,0)node[below left]{$O$}--(3.5,0)node[below=1pt]{$x$};
\draw[->](0,-0.5)--(0,2.5)node[left]{$F(x)$};
\draw[thick](-2,0)--(-1,0)(-1,0.5)--(2,0.5)(2,1.5)--(3,1.5)(3,2)--(3.5,2);
\fill(-1,0.5)circle(1pt);\fill(2,1.5)circle(1pt);\fill(3,2)circle(1pt);
\filldraw[fill=white](-1,0)node[below]{$-1$}circle(1pt);\filldraw[fill=white](2,0.5)circle(1pt);
\filldraw[fill=white](3,1.5)circle(1pt);
\foreach \x in{1,2,3}\draw(\x,0.07)--(\x,0)node[below]{$\x$};
\foreach \x in{1,1.5,2}\draw(0.07,\x)--(0,\x);
\node[left]at(0,2){$1$};
\end{tikzpicture}
\caption{离散随机变量的分布函数}\label{fig:2-1-3}
\end{figure}
\[
P(X=c)=1
\]
这个分布常称为单点分布或退化分布,它的分布函数是
\begin{equation}
F(x)= \begin{cases}
0, & x < c; \\
1, & x \geqslant c.
\end{cases} \label{eq:2.1.3}
\end{equation}
其图形为
\begin{figure}[!ht]
\centering
\begin{tikzpicture}[>=Stealth]
\draw[->](-0.3,0)--(0,0)node[below left]{$O$}--(4,0)node[below]{$x$};
\draw[->](0,-0.3)--(0,3)node[left]{$F(x)$};
\draw[thick](-0.3,0)--(0.8,0)node[below]{$c$}
(0.8,2)--(3.5,2);
\draw[dashed,semithick](0.8,0)--(0.8,2)--(0,2)node[left]{$1$};
\filldraw[fill=white](0.8,0)circle(1pt);
\fill(0.8,2)circle(1pt);
\end{tikzpicture}
\caption{单点分布函数}\label{fig:2.1.4}
\end{figure}
\end{solution}
以下例子说明:在具体求离散随机变量$ X $的分布列时,关键是求出$ X $的所有可能取值及取这些值的概率.
\begin{example}
一汽车沿一街道行驶,需要经过3个设有红绿信号灯的路口,若设每个信号灯显示红绿两种信号的时间相等,且各个估号灯工作相互独立.以$X$表示该汽车首次遇到红灯前已通过的路口数.试求$ X $的概率分布列.
\end{example}
\begin{solution}
由题设可知,$ X $的可能取值为$ 0,1.2.3 $又记$ A= $“汽车在第i个路口遇到红灯”,$ i=1,2,3 $.因为$ A_1,A_2,A_3 $相互独立,且
\[
P\left(A_{t}\right)=P\left(A_{t}\right)=\frac{1}{2}, \quad i=1.2 .3
\]
所以得
\[
\begin{array}{l}
{P(X=0)=P\left(A_{1}\right)=\frac{1}{2}} \\
{P(X=1)=P\left(\overline{A}_{1} A_{2}\right)=P\left(\overline{A}_{1}\right) P\left(\Lambda_{2}\right)=\frac{1}{4}} \\
{P(X=2)=P\left(\overline{A}_{1} \overline{A}_{2} A_{3}\right)=P\left(A_{1}\right) P\left(\dot{A}_{2}\right) P\left(A_{J}\right)=\frac{1}{8}}\\
{P(X=3)=P\left(\overline{A}_{1} \overline{A}_{2} \overline{A}_{3}\right)=P\left(\overline{A}_{1}\right) P\left(\overline{A}_{2}\right) P\left(\overline{A}_{2}\right)=\frac{1}{8}}
\end{array}
\]
故$ X $的分布列如下:
% Table generated by Excel2LaTeX from sheet '1'
\begin{table}[htbp]
\centering
\begin{tabular}{c|cccc}
$ X $ & 0 & 1 & 2 & 3 \\\hline
$ P $ & 1/2 & 1/4 & 1/8 & 1/8 \\
\end{tabular}%
\end{table}%
\end{solution}
\subsection{连续随机变量的概率密度函数}
连续随机变量的一切可能取值是充满某个区间$ (a,b) $,在这个区间内有无穷不可列个实数,因此描述连续随机变量的概率分布不能再用分布列形式表示,而要改用概率密度函数表示.下面用一个实例来导出概率密度函数的由来.
\begin{example}
新生婴儿的体重X是一个随机变量.假如记录很多个(例如:十万个)新生婴儿的体重,我们将各种体重的频率用直方图形式表示出来,$x$轴表示体重(单位:$ 500g $),$ y $轴表示单位长度上的频率,则以下图~\ref{fig:2-1-5} 的(a)至(c)
表明:当$\Delta x=1$越来越小,其频率直方图形越来越光滑.
\begin{enumerate}
\item 当$\Delta x=1$ ,体重的频率直方图见图~\ref{fig:2-1-5}(a).注意,图中矩形宽度为1,高度为频率,所以所有矩形面积之和为1.此时体重$ X $的取值为$1,2, \cdots $,即$ X $是一个离散随机变量.
\item 当 $\Delta x=0.1$ ,体重的频率直方图见图~\ref{fig:2-1-5}(b).注意,图中矩形宽度为
$ 0.1 $,高度为:频率$ /0.1 $,所有小矩形面积之和仍为1.
\item 当 $\Delta x \rightarrow 0$ 则体重的频率图趋于图~\ref{fig:2-1-5}(c)所示的一条光滑的曲线,其高度为概率密度值.如果记这条曲线为$ p(x) $,则$ p(x) $与$ x $轴所夹面积仍为1.此时体重$ X $的取值充满了某一区间,即X是一个连续随机变量.图中$ p(x) $就是连续随机变量X的概率密度函数.
\end{enumerate}
\end{example}
\begin{figure}[!ht]
\centering
\subfloat[$\Delta x=1$]{
\begin{tikzpicture}[>=Stealth,yscale=0.8,xscale=0.7]
\draw[decorate,decoration={snake,segment length=1mm,amplitude=0.5mm}]
(0,0)node[below]{$O$}--(0.6,0);
\draw[->](0.6,0)--(6.8,0)node[below]{$x$};
\draw[->](0,0)--(0,3)node[right]{$P/\Delta x$};
\draw[semithick](0.6,0)--(0.6,0.3)--(1.4,0.3)(1.4,0)--(1.4,0.7)--(2.2,0.7)
(2.2,0)--(2.2,1.7)(2.2,0)--(2.2,2.4)--(3,2.4)--(3,0)(3,1.7)--(3.8,1.7)--(3.8,0)
(3.8,0.8)--(4.6,0.8)--(4.6,0)(4.6,0.5)--(5.4,0.5)--(5.4,0)
(5.4,0.4)--(6.2,0.4)--(6.2,0);
\draw(1,0)--(1,-0.08)node[below]{$4$};\draw(1.8,0)--(1.8,-0.08)node[below]{$5$};
\draw(2.6,0)--(2.6,-0.08)node[below]{$6$};\draw(3.4,0)--(3.4,-0.08)node[below]{$7$};
\draw(4.2,0)--(4.2,-0.08)node[below]{$8$};\draw(5,0)--(5,-0.08)node[below]{$9$};
\draw(5.8,0)--(5.8,-0.08)node[below]{$10$};
\end{tikzpicture}
}\hfill
\subfloat[$\Delta x=0.1$]{
\begin{tikzpicture}[>=Stealth,yscale=0.8,xscale=0.6]
\draw[decorate,decoration={snake,segment length=1mm,amplitude=0.5mm}]
(0,0)node[below]{$O$}--(1,0);
\draw[->](1,0)--(6,0)node[below]{$x$};
\draw[->](0,0)--(0,3)node[right]{$P/\Delta x$};
\foreach \x in{5,6,7,8,9}\draw(\x-4,0)node[below]{$\x$}--(\x-4,-0.08);
\draw[semithick,domain=0.3:5.7,samples=100]plot(\x,{2*e^(-(\x-3)^2/2)+0.2});
\foreach \x in{1,1.1,...,5}
\draw(\x,0)--(\x,{2*e^(-(\x-3)^2/2)+0.2})--(\x+0.1,{2*e^(-(\x-3)^2/2)+0.2})
--(\x+0.1,0);
\end{tikzpicture}
}\hfill
\subfloat[$\Delta x\to 0$]{
\begin{tikzpicture}[>=Stealth,yscale=0.8,xscale=0.6]
\draw[decorate,decoration={snake,segment length=1mm,amplitude=0.5mm}]
(0,0)node[below]{$O$}--(1,0);
\draw[->](1,0)--(6,0)node[below]{$x$};
\draw[->](0,0)--(0,3)node[right]{$p(x)$};
\foreach \x in{5,6,7,8,9}\draw(\x-4,0)node[below]{$\x$}--(\x-4,-0.08);
\draw[semithick,domain=0.3:5.7,samples=100]plot(\x,{2*e^(-(\x-3)^2/2)+0.2});
\draw[dashed,semithick](2,0)--(2,1.37)(4,1.32)--(4,0);
\end{tikzpicture}
}
\caption{新生婴儿体重$X$的频率分布}\label{fig:2-1-5}
\end{figure}
下面给出连续随机变量的概率密度函数的定义.
\begin{definition}{}{}
设随机变量$ X $的分布函数为$ F(x) $,如果存在实数轴上的一个非负可积函数$ p(x) $,使得对任意实数$ x $有
\begin{equation}
F(x)=\int_{-\infty}^{x} p(t) \dd t, \label{eq:2.1.4}
\end{equation}
从~\ref{eq:2.1.4}式可以看出,在$ F(x) $导数存在的点上有
\begin{equation}
F^{\prime}(x) = p(x), \label{eq:2.1.5}
\end{equation}
$ F(x) $是(累积)概率函数,其导数$ F'(x) $是概率密度函数,由此可看出$ p(x) $被称为概率密度函数的理由.
由~\eqref{eq:2.1.5} 式,可从分布函数求得密度函数.譬如例2.1.2给出的柯西分布函数处处可导,故柯西分布的密度函数为
\[
p(x)=\frac{1}{\pi} \frac{1}{1+x^{2}},-\infty < x < +\infty.
\]
\end{definition}
\textbf{密度函数的基本性质 }
(1)非负性:$p(x) \geqslant 0$;
(2)正则性:$: \int_{-\infty}^{+\infty} p(x) \dd x=1$.
以上两条基本性质是密度函数必须具有的性质,也是确定或判别某个函数是否成为密度函数的充要条件.譬如已知某个函数$ p(x) $为密度函数,若$ p(x) $中有待定常数,则该常数必定是利用正则性$\int_{-\infty}^{+\infty} p(x) \dd x=1$来确定的,见下面例子.
\begin{example}
已知随机变量X的密度函数为
\[
p(x) = \begin{cases}
c, & -1 \leqslant x \leqslant 1; \\
0, & \text{其他}.
\end{cases}
\]
试求常数$ c $.
\end{example}
\begin{solution}
由密度函数的正则性知
\[
1=\int_{-\infty}^{+\infty} p(x) \dd x=\int_{-1}^{1} c \dd x=2 c.
\]
所以由$ 2c=1 $得$ c=0.5 $.利用分段积分,我们还可求出$ X $的分布函数.
当$ x<-1 $时,
\[
F(x)=\int_{-\infty}^{x} 0 \dd t=0.
\]
当$-1 \leqslant x<1$时,
\[
F(x)=\int_{-3}^{x} 0.5 \dd t=(x+1) / 2.
\]
当 $x \geqslant 1$ 时,
\[
F(x)=\int_{1}^{1} 0.5 \dd t+\int_{1}^{x} 0 \dd t=1.
\]
所以得$ X $的分布函数为
\[
F(x) = \begin{cases}
0, & x<-1 ;\\
\frac{x+1}{2}, & -1 \leqslant x<1 ; \\
1, & x \geqslant 1.
\end{cases}
\]
\end{solution}
由密度函数求分布函数的关键是;分布函数是一种“累积”概率,所以在计算积分时要注意积分限的合理运用.此例密度函数和分布函数的图形如图 \ref{fig:2-1-6} (a)与(b)所示, 这个分布称为区间$(-1,1)$上的均匀分布, 记为$U(-1,1)$.
\begin{figure}[!ht]
\centering
\subfloat[$p(x)$的图形]{
\begin{tikzpicture}[>=Stealth,xscale=2,yscale=4]
\draw[->](-1.3,0)--(0,0)node[below left]{$O$}--(1.3,0)node[below]{$x$};
\draw[->](0,-0.1)--(0,0.7)node[right]{$p(x)$};
\draw[thick](-1,0.4)--(0,0.4)node[above right]{$0.5$}--(1,0.4);
\draw[dashed,semithick](-1,0.4)--(-1,0)node[below]{$-1$}(1,.4)--(1,0)node[below]{$1$};
\end{tikzpicture}
}\hspace{2cm}
\subfloat[$F(x)$的图形]{
\begin{tikzpicture}[>=Stealth,xscale=1.8,yscale=2]
\draw[->](-1.4,0)--(0,0)node[below left]{$O$}--(1.4,0)node[below]{$x$};
\draw[->](0,-0.2)--(0,1.4)node[right]{$F(x)$};
\draw[thick](-1,0)node[below]{$-1$}--(1,1)--(1.3,1);
\draw[dashed,semithick](0,1)node[left]{$1$}--(1,1)--(1,0)node[below]{$1$};
\end{tikzpicture}
}
\caption{均匀分布$U(-1,1)$的密度函数和分布函数的图形}\label{fig:2-1-6}
\end{figure}
\begin{example}
设随机变量$X$的密度函数为
\[
p(x) = \begin{cases}
x, & 0 \leqslant x<1; \\
2 - x, & 1 \leqslant x<2; \\
0, & \text{其他}.
\end{cases}
\]
试求$ X $的分布函数$ F(x) $.
\end{example}
\begin{solution}
当$ x<0 $时,
\[
F(x)=\int_{-\infty}^{x} p(x) \dd x=0
\]
当 $0 \leqslant x<1$ 时,
\[
F(x)=\int_{0}^{x} x \dd x=\frac{x^{2}}{2}
\]
当 $1 \leqslant x<2$时,
\[
F(x)=\int_{-\infty}^{x} p(x) \dd x=\int_{0}^{1} x \dd x+\int_{1}^{x}(2-x) \dd x=-\frac{x^{2}}{2}+2 x-1
\]
当 $\mathrm{I} \leqslant x<2$ 时,
\[
F(x)=\int_{-\infty}^{x} p(x) \dd x=\int_{0}^{1} x \dd x+\int_{1}^{2}(2-x) \dd x=1
\]
综上所述,得$ X $的分布函数为
\[
F(x)=\left\{\begin{array}{ll}
{0,} & {x<0} \\
{\frac{x^{2}}{2},} & {0 \leqslant x<1} \\
{-\frac{x^{2}}{2}+2 x-1,} & {1 \leqslant x<2} \\
{1,} & {x \geqslant 2}
\end{array}\right.
\]
\end{solution}
这个分布被称为辛普森分布或三角分布,其密度函数$ p(x) $和分布函数$ F(x) $的图形见下图~\ref{fig:2-1-7}.从图形上可看出:在区间$ (0,1) $上$ F(x) $是下凸函数,在区间$ (1,2) $上$ F(x) $是上凸函数.
\begin{figure}[!ht]
\centering
\subfloat[$p(x)$的图形]{
\begin{tikzpicture}[>=Stealth,scale=2]
\draw[->](-0.2,0)--(0,0)node[below left]{$O$}--(2.4,0)node[below]{$x$};
\draw[->](0,-0.2)--(0,1.4)node[right]{$p(x)$};
\draw[thick](0,0)--(1,1)--(2,0)node[below]{$2$};
\draw[dashed,semithick](0,1)node[left]{$1$}--(1,1)--(1,0)node[below]{$1$};
\end{tikzpicture}
}\hspace{2cm}
\subfloat[$F(x)$的图形]{
\begin{tikzpicture}[>=Stealth,xscale=1.8,yscale=2,samples=100]
\draw[->](-0.2,0)--(0,0)node[below left]{$O$}--(2.4,0)node[below]{$x$};
\draw[->](0,-0.2)--(0,1.4)node[right]{$F(x)$};
\draw[thick,domain=0:1]plot(\x,{(\x)^2/2});
\draw[thick,domain=1:2]plot(\x,{-(\x)^2/2+2*\x-1});
\draw[thick](2,1)--(2.4,1);
\draw[dashed,semithick](0,1)node[left]{$1$}--(2,1)--(2,0)node[below]{$2$};
\draw(1,0.05)--(1,0)node[below]{$1$};
\end{tikzpicture}
}
\caption{辛普森分布}\label{fig:2-1-7}
\end{figure}
以下我们对密度函数与分布列的异同点作一些说明.
在离散随机变量场合,
\[
P(a<X \leqslant b)=\sum_{a<x_{i} \leqslant b} p\left(x_{i}\right)
\]
其中诸$ x_i $;为$ X $的可能取值.
而在连续随机变量场合,
\[
P(a<X \leqslant b)=\int_{a}^{b} p(x) \dd x
\]
其含义见下图.
\begin{figure}[!ht]
\centering
\begin{tikzpicture}[>=Stealth,xscale=2.2,yscale=2,samples=100]
\draw[->](-0.2,0)--(0,0)node[below left]{$O$}--(2.4,0)node[below]{$x$};
\draw[->](0,-0.2)--(0,1.4)node[right]{$p(x)$};
\draw[thick,domain=-0.2:2.3]plot(\x,{e^(-3*(\x-1.05)^2)});
\filldraw[thick,fill=gray!30,domain=0.5:1.6](0.5,0)node[below]{$a$}--(0.5,{e^(-3*(0.5-1.05)^2)})--
plot(\x,{e^(-3*(\x-1.05)^2)})--(1.6,{e^(-3*(1.6-1.05)^2)})--(1.6,0)node[below]{$b$}--cycle;
\node at(1.05,0.2){$P(a<X\leq b)$};
\end{tikzpicture}
\caption{连续随机变量场合的概率}\label{fig:2.1.8}
\end{figure}
从这个意义上讲,概率密度函数与概率分布列所起的作用是类似的,但它们之间的差别也是明显的,具体有
\begin{enumerate}
\item 离散随机变量的分布函数F(x)总是右连续的阶梯函数,而连续随机变量的分布函数$ F(x) $一定是整个数轴上的连续函数,因为对任意点$ x $的增量$\Delta x$,相应分布函数的增量总有
\[
F(x+\Delta x)-F(x)=\int_{x}^{x+\Delta x} p(x) \dd x \longrightarrow 0, \quad(\Delta x \rightarrow 0)
\]
\item 离散随机变量$ X $在其可能取值的点$x_{1}, x_{2}, \cdots, x_{n}, \cdots$上的概率不为$ 0 $,而连续随机变量$ X $在$(-\infty,+\infty)$上任一点$ a $的概率恒为$ 0 $,即
\[
P(X=a)=\int_{a}^{a} p(x) \dd x=0
\]
这表明:不可能事件的概率为$ 0 $,但概率为0的事件不一定是不可能事件;类似地,必然事件的概率为$ 1 $,但概率为$ 1 $的事件不一定是必然事件.
\item 由于连续随机变量$ X $仅取一点的概率恒为$ 0 $,从而在事件“$a \leqslant X \leqslant b$”
中减去$ x=a $或减去$ X=b $,不影响其概率,即
\[
P(a \leqslant x \leqslant b)=P(a<X \leqslant b)=P(a \leqslant X<b)=P(a<X<b)
\]
这给计算带来很大方便.而这个性质在离散随机变量场合是不存在的,在离散随机变量场合计算概率要“点点计较”.
\item 由于在若干点上改变密度函数$ p(x) $的值并不影响其积分的值,从而不影响其分布函数$ F(x) $的值,这意味着一个连续分布的密度函数不唯一.譬如在例2.1.7中,改变$ x=-1 $和x=1处$ p(x) $的值如下:
\[
p_{1}(x)=\left\{\begin{array}{ll}{0.5,} & {-1 \leqslant x \leqslant 1} \\ {0,} & {\text{其他} \text { th }}\end{array}\right. p_{2}(x)=\left\{\begin{array}{ll}{0.5,} & {-1<x<1} \\ {0} & { \neq 4}\end{array}\right.
\]
它们都是$ (-1,1) $上均匀分布的密度函数.但仔细考察这两个函数$ p_1(x) $和$ p_2(x) $,可以发现
\[
P\left(p_{1}(x) \neq p_{2}(x)\right)=P(X=-1)+P(X=1)=0
\]
可见这两个函数在概率意义上是无差别的,在此称$ p_1(x) $与$ p_2(x) $是“几乎处处相等”,其含义是:它们不相等处的点组成集合的概率为$ 0 $.这就是概率论与微积分不同之处,也是概率论的魅力之处.
除了离散分布和连续分布之外,还有既非离散又非连续的分布,见下例.
\end{enumerate}
\begin{example}
以下的函数$ F(x) $确是一个分布,它的图形如图~\ref{fig:2-1-9}所示.
\[
F(x)=\left\{\begin{array}{ll}{0,} & {x<0} \\ {\frac{1+x}{2},} & {0 \leqslant x<1} \\ {1,} & {x \geqslant 1}\end{array}\right.
\]
从图上可以看出:它既不是阶梯函数,又不是连续图~\ref{fig:2-1-9}既非离散、又非函数,所以它既非离散的又非连续的分布.它是新的一连续的分布函数示例类分布,本书将不研究此类分布,只让大家知道山外有山,需要不断学习与研究.
\end{example}
下面我们再给出一些连续随机变量的例子.
\begin{figure}[!ht]
\centering
\begin{tikzpicture}[>=Stealth,scale=2]
\draw[->](-0.3,0)--(0,0)node[below left]{$O$}--(1.6,0)node[below]{$x$};
\draw[->](0,-0.2)--(0,1.4)node[right]{$F(x)$};
\draw[thick](0,0.5)node[left]{$0.5$}--(1,1)--(1.5,1)(-0.3,0)--(0,0);
\filldraw[fill=white](0,0)circle(0.5pt);
\fill(0,0.5)circle(0.5pt);
\draw[semithick,dashed](0,1)node[left]{$1$}--(1,1)--(1,0)node[below]{$1$};
\end{tikzpicture}
\caption{既非离散、又非连续的分布函数示例}\label{fig:2-1-9}
\end{figure}
\begin{example}
某种型号电子元件的寿命$ X $(以小时计)具有以下的概率密度函数
\[
p(x) = \begin{cases}
\frac{1000}{x^2}, &x>1000;\\
0, & \text{其他}.
\end{cases}
\]
现有一大批此种元件(设各元件工作相互独立),问
\begin{enumerate}
\item 任取1只,其寿命大于1500小时的概率是多少?
\item 任取4只,4只寿命都大于1500小时的概率是多少?
\item 任取4只,4只中至少有1只寿命大于1500小时的概率是多少?
\item 若已知一只元件的寿命大于1500小时,则该元件的寿命大于2000小时的概率是多少?
\end{enumerate}
\end{example}
\begin{solution}
\begin{enumerate}
\item \[
P\{X>1500\}=\int_{1500}^{+\infty} \frac{1000}{x^{2}} \dd x=\left(-\frac{1000}{x}\right)_{1500}^{+\infty}=\frac{2}{3}
\]
\item 各元件工作独立,因此所求概率为
\[
P\{\text{四只原件寿命都大于}1500\}=[P(X>1500)]^{4}=\left(\frac{2}{3}\right)^{4}=\frac{16}{81}
\]
\item 所求概率为
\[\begin{gathered}
P\{\text{四只中至少一只寿命大于}1500\} \hfill \\
=1-P\{4\text{只元件寿命都小于等于}1500\} \hfill \\
=1-\left(1-\frac{2}{3}\right)^{4}=\frac{80}{81} \hfill \\
\end{gathered} \]
\item 这是求条件概率$P\{X>2000 | X>1500\}$ ,记
\[
A=\{X>1500|, B=\{X>2000\}
\]
因为$P(A)=2 / 3, P(B)=1 / 2$,且$B \subset A$,所以
\[
P(B | A)=\frac{P(A B)}{P(A)}=\frac{P(B)}{P(A)}=\frac{3}{4}
\]
\end{enumerate}
\end{solution}
\begin{example}
向区间$ (0,a) $上任意投点, 用$X$表示这个点的坐标.设这个点落在$ (0,a) $中任一小区间的概率与这个小区间的长度成正比,而与小区间位置无关.求$ X $的分布函数和密度函数.
\end{example}
\begin{solution}
记$ X $的分布函数为$ F(x) $,则
当$ x<0 $时,因为$\{X \leqslant x\}$是不可能事件,所以$F(x)=P(X \leqslant x)=0$;
当$x \geqslant a$时,因为$\{ X \leqslant x \}$是必然事件,所以$F(x)=P(X \leqslant x)=1$;
当$0 \leqslant x<a$时,有$F(x)=P(X \leqslant x)=P(0 \leqslant X \leqslant x)=k x$,其中$ k $为比例系数.因为$ 1=F(a)=ka $,所以得$ k=1/a $.
于是$ X $的分布函数为
\[
F(x) = \begin{cases} 0, & {x<0} \\
\frac{x}{a}, & 0 \leqslant x<a \\
1, & x \geqslant a
\end{cases}
\]
下求$ X $的密度函数$ p(x) $.
当$ x<0 $或$ x>a $时,$ p(x)=F'(x)=0 $;
当$ 0<x<a $时,$ p(x)=F'(x)=1/a $;
而在$ x=0 $和$ x=a $处, $ p(x) $可取任意值,一般就近取值为宜,这不会影响概率的计算,因为它们是几乎处处相等的密度函数.于是$ x $的密度函数为
\[
p(x)=\begin{cases}
\frac{1}{a}, & 0<x<a; \\
0, & \text{其他}.
\end{cases}
\]
这个分布就是区间$ (0,a) $上的均匀分布,记为$ U(0,a) $,其密度函数$ p(x) $
和分布函数$ F(x) $的图形见下图~\ref{fig:2-1-10}.
\end{solution}
\begin{figure}[!ht]
\centering
\subfloat[$p(x)$的图形]{
\begin{tikzpicture}[>=Stealth,scale=2]
\draw[->](-0.3,0)--(0,0)node[below left]{$O$}--(2.1,0)node[below]{$x$};
\draw[->](0,-0.2)--(0,1.4)node[right]{$p(x)$};
\draw[thick](1.6,0.9)--(0,0.9)node[left]{$\frac1a$};
\draw[dashed,semithick](1.6,0.9)--(1.6,0)node[below]{$a$};
\end{tikzpicture}
}\hspace{2cm}
\subfloat[$F(x)$的图形]{
\begin{tikzpicture}[>=Stealth,scale=2,thick]
\draw[->](-0.3,0)--(0,0)node[below left]{$O$}--(2.1,0)node[below]{$x$};
\draw[->](0,-0.2)--(0,1.4)node[right]{$F(x)$};
\draw[thick,dashed](1.6,1)--(0,1)node[left]{$1$};
\draw[dashed,semithick](1.6,1)--(1.6,0)node[below]{$a$};
\draw (0,0) -- (1.6,1) -- ++ (0.3,0);
\end{tikzpicture}
}
\caption{$(0,a)$上的均匀分布}\label{fig:2-1-10}
\end{figure}
其实此例就是第一章中所说的几何概率,这也建立了几何概率与均匀分布的联系.
\begin{example}
设连续随机变量X的密度函数为
\[
p(x) = \begin{cases}
4 x^3, & 0 < x < 1 ; \\
0, & \text{其他}.
\end{cases}
\]
\begin{enumerate}[label=(\arabic*)]
\item 已知$ P(X<a)=P(X>a) $,试求常数$ a $(此$ a $称为该分布的中位数).
\item 已知$ P(X>b)=0.05 $,试求常数$ b $.
\end{enumerate}
\end{example}
\begin{solution}
\begin{inparaenum}[(1)]
\item 因为$ X $为连续随机变量,所以有$ P(X=a)=0 $,从而
\[
P(X < a) + P(X > a) = 1.
\]
由$ P(X<a)=P(X>a) $,可以得$ P(X<a)=0.5 $.而
\[
P(X < a) = \int_{0}^{a} 4 x^{3} \dd x=a^{4},
\]
所以从$ a^4=0.5 $解得$a=\sqrt[4]{0.5}=0.8409$.这里的$ a=0.8409 $把该分布的密度函数下的面积分为两部分,$ a $点左侧与右侧面积各为$ 0.5 $,故称a点为该分布的中位数(详见2.7.4).
\item 因为
\[
P (X > b) = \int_{b}^{1} 4 x^{3} \dd x = 1 - b^{4},
\]
所以从$1-b^{4}=0.05$解得$b=\sqrt[4]{0.95}=0.9873$.
\end{inparaenum}
\end{solution}
\begin{xiti}
\item 口袋中有$ 5 $只球,编号为$ 1,2,3,4,5 $.从中任取$ 3 $只,以X表示取出的$ 3 $只球中的最大号码.
\begin{enumerate}
\item 试求$ X $的分布列;
\item 写出$ X $的分布函数,并作图.
\end{enumerate}
\item 一颗骰子撇两次,以$ X $表示两次中所得的最小点数.
\begin{enumerate}
\item 试求$ X $的分布列;
\item 写出X的分布函数.
\end{enumerate}
\item 口袋中有$ 7 $个白球、$ 3 $个黑球.
\begin{enumerate}
\item 每次从中任取一个不放回,求首次取出白球的取球次数$ X $的概率分布列;
\item 如果取出的是黑球则不放回,而另外放入一个白球,此时$ X $的概率分布列如何.
\end{enumerate}
\item 有$ 3 $个盒子,第一个盒子装有1只白球、$ 4 $只黑球;第二个盒子装有$ 2 $只白球、3只黑球;第三个盒子装有$ 3 $只白球、$ 2 $只黑球.现任取一个盒子,从中任取3只球.以$ X $表示所取到的白球数.
\begin{enumerate}
\item 试求$ X $的概率分布列;
\item 取到的白球数不少于2只的概率是多少?
\end{enumerate}