Nội dung bài giảng Bài 3: Phân phối siêu bội sau đây sẽ giúp các bạn tìm hiểu về bài toán tổng quát dẫn đến phân phối siêu bội, định nghĩa, các tham số đặc trưng.
Tóm tắt lý thuyết
1. Bài toán tổng quát dẫn đến phân phối siêu bội
Từ một tập hợp gồm N phần tử (trong đó có M phần tử có tính chất A nào đó), lấy ngẫu nhiên không hoàn lại ra n phần tử . Gọi X là số phần tử có tính chất A có trong n phần tử lấy ra, thì X là đại lượng ngẫu nhiên rời rạc có thể nhận các giá trị trong khoảng [n1, n2], với các xác suất tương ứng:
\({P_x} = P(X = x) = \frac{{C_M^xC_{N - M}^{n - x}}}{{C_N^n}}\)
x phải thoả mãn điều kiện: \(x \in \left[ {{n_1},{n_2}} \right]\)
\({n_1} = M{\rm{ax}}\left\{ {0;M + n - N} \right\};\,\,{n_2} = Min\{ n;M{\rm{\} }}\)
2. Định nghĩa
Đại lượng ngẫu nhiên rời rạc X có thể nhận các giá trị nguyên, không âm với các xác suất tương ứng được tính theo công thức (3.12) thì X có phân phối siêu bội với các tham số: N, M, n.
Đai lượng ngẫu nhiên X có phân phối siêu bội với các tham số N, M, n được ký hiệu là: X ~ H (N, M, n).
Thí dụ: Một hộp có 10 sản phẩm (trong đó có 7 sản phẩm loại A). Lấy ngẫu nhiên (không hoàn lại) từ hộp ra 5 sản phẩm. Gọi X là số sản phẩm loại A có trmg 5 sản phẩm lấy ra, thì X ~ H(10, 7, 5).
n1 = Max{0 ; 7 + 5 -10} = 2; n2= Min{5;7}=5
Các giá trị X có thể nhận là 2, 3, 4, 5, với các xác suất tương ứng được tính như sau:
\(\begin{array}{l} P(X = 2) = \frac{{C_7^2C_3^3}}{{C_{10}^5}} = \frac{{21}}{{252}} = \frac{1}{{12}}\\ P(X = 3) = \frac{{C_7^3C_3^2}}{{C_{10}^5}} = \frac{{105}}{{252}} = \frac{5}{{12}}\\ P(X = 4) = \frac{{C_7^4C_3^1}}{{C_{10}^5}} = \frac{{105}}{{252}} = \frac{5}{{12}}\\ P(X = 5) = \frac{{C_7^5}}{{C_{10}^5}} = \frac{{21}}{{252}} = \frac{1}{{12}} \end{array}\)
Nếu X ~ H (N, M, n), để tính P(X = x) ta có thể dùng hàm HYPGEOMDIST trong Excel
P(X = x) =HYPGEOMDIST(x,n,M,N)
Thí dụ: Cho X ~ H (20, 14, 8), tính P(X = 5)
Ta có: P(X = 5) =HYPGEOMDIST(5,8,14,20) = 0,317853
3. Các tham số đặc trưng
Ta có thể chứng minh được rằng: Nếu X ~ H (N, M, n), thì: (với \(p=\frac{M}{N}\))
\(V{\rm{ar}}(X) = npq\frac{{N - n}}{{N - 1}}\)
Trong thực tế, phân phối siêu bội được dùng để tính xác suất có X phần tử mang dấu hiệu A nào đó khi lấy ngẫu nhiên n phần tử theo phương thức không hoàn lại từ một tập hợp gồm N phần tử. Chẳng hạn, để kiểm ha chất lượng của một lô sản phẩm, người ta thường lấy ra từ lô đó ra n sản phẩm theo phương thức không hoàn lại và tính xác suất để có X phế phẩm (hoặc chính phẩm).
Ta có thể chứng minh rằng: Khi n là rất bé so với N thì ta có công thức xấp xỉ sau đây:
\(\frac{{C_M^xC_{N - M}^{n - x}}}{{C_N^n}} \approx C_n^x{p^x}{q^{n - x}}\)
Chứng minh:
Xét vế trái của (3.15) ta có:
\(C_M^x = \frac{{M!}}{{x!(M - x)!}} = \frac{{M(M - 1)(M - 2)....(M - x + 1)}}{{x!}}\)
\(C_{N - M}^{n - x} = \frac{{(N - M)!}}{{(n - x)!(N - M - n + x)!}}\)
\( = \frac{{(N - M)(N - M - 1)....(N - M - n + x + 1)}}{{(n - x)!}}\)
\(C_N^n = \frac{{N!}}{{n!(N - n)!}} = \frac{{N(N - 1)....(N - n + 1)}}{{n!}}\)
Thay các biểu thức trên vào vế ứái của (3.15) và sắp xếp lại ta được:
\(VT = C_n^xB\)
Trong đó: VT là ký hiệu vế trái của (3.15); B là biểu thức dưới đây:
\(\frac{{M(M - 1)...(M - x + 1)(N - M)(N - M - 1)...(N - M - n + x + 1)}}{{N(N - 1)(N - 2)...(N - n + 1)}}\)
Để ý rằng, tử số và mẫu số của biểu thức trên đều có n thừa số. Chia cả tử số và mẫu số của biểu thức đó cho Nn ta được:
\(B = \frac{{QR}}{S}\)
Trong đó:
\(Q = \frac{M}{N}\left( {\frac{M}{N} - \frac{1}{N}} \right)....\left( {\frac{M}{N} - \frac{{x - 1}}{N}} \right)\)
\(R = \left( {1 - \frac{M}{N}} \right)\left( {1 - \frac{M}{N} - \frac{1}{N}} \right)...\left( {1 - \frac{M}{N} - \frac{{n - x - 1}}{N}} \right)\)
\(S = 1.\left( {1 - \frac{1}{N}} \right)\left( {1 - \frac{2}{N}} \right)....\left( {1 - \frac{{n - 1}}{N}} \right)\)
Đặt: \(\frac{M}{N} = p;\,\,\, \Rightarrow \left( {1 - \frac{M}{N}} \right) = 1 - p = q\)
Khi N lớn, n rất nhỏ so với N thì: \(Q \approx {p^x};\,\,R \approx {q^{n - X}};\,\,s \approx 1\)
Từ đó ta suy ra điều cần phải chứng minh
Trong thực tế, công thức (3.15) thường được áp dụng như sau: Nếu lấy n phần tử từ một tập hợp gồm N phần tử theo phương thức không hoàn lại và n là rất nhỏ so với N. Gọi X là số phần tử có tính chất A nào đó có trong n phần tử lấy ra thì ta có thể xem X ~ B(n, p). Với p là tỉ lệ phần tử có tính chất A của tập hợp.
Thí dụ: Một lô hàng gồm 1000 sản phẩm, trong đó có 800 sản phẩm loại A và 200 sản phẩm loại B. Lây ngẫu nhiên (không hoàn lại) từ lô hàng đó 10 sản phẩm để kiểm ưa. Tìm xác suất để có ít nhất 8 sản phẩm loại A ưong 10 sản phẩm lấy ra kiểm tra.
Giải: Gọi X là số sản phẩm loại A có trong 10 sản phẩm lấy ra kiểm ưa. Vì lấy không hoàn lại nên X ~ H(1000, 800, 10). Nhưng vì lấy ít (10) từ một tập hợp có số phần tử lớn (1000) nên ta có thể coi X ~ B(n, p), với n = 10 và \(p = \frac{{800}}{{1000}} = 0,8\)
Xác suất cần tìm là P(X \(\le\) 8).
Ta có:
\(\begin{array}{l} P(X = 8) = C_{10}^8{(0,8)^8}{(0,2)^2} = 0,30199\\ P(X = 9) = C_{10}^9{(0,8)^9}{(0,2)^2} = 0,268435\\ P(X = 10) = {(0,8)^{10}} = 0,107374 \end{array}\)
Vậy: P(X \(\ge \) 8) = P(X = 8) + P(X = 9) + P(X = 10) = 0,6778
Chú ý: Ngoài cách tính trên, ta có thể dùng hàm HYPGEOMDIST để tính như sau:
P(X = 8) =HYPGEOMDIST(8,10,800,1000) = 0,30351
P(X = 9) =HYPGEOMDIST(9,10,800,1000) = 0,268431
P(X = 10) =HYPGEOMDIST(10,10,800,1000) = 0,106164
P(X \(\ge\) 8) = 0,30351 + 0,268431 + 0,106164 = 0,678105
Ta thấy kết quà của hai cách tính xâ'p xỉ nhau.