Mời các bạn cùng tham khảo nội dung bài giảng Bài 4: Phân phối chuẩn sau đây để tìm hiểu về định nghĩa, các tham số đặc trưng, phân phối chuẩn chính tắc, các công thức tính xác suất, phân phối xác suất của tổng các đại lượng ngẫu nhiên độc lập có cùng phân phối xác suất, sự hội tụ của phân phối nhị thức và phân phối Poisson về phân phối chuẩn, ứng dụng của phân phối chuẩn.
Tóm tắt lý thuyết
1. Định nghĩa
Đại lượng ngẫu nhiên liên tục X nhận giá trị trong khoảng
Nếu tiến hành khảo sát hàm này ta thấy: f(x) > 0
Khi
Hàm số có 2 điểm uốn:
Đồ thị của hàm f(x) có dạng như hình chuông, đối xứng qua đường thẳng
Thí dụ: Với
Chú ý: Để tính giá trị của hàm f(x) và vẽ đồ thị của hàm này ta có thể sử dụng các hàm trong Excel (xem phụ lục 1, phần phân phối chuẩn)
2. Các tham số đặc trưng
Kỳ vọng toán: Nếu đại lượng ngẫu nhiên X có phân phối chuẩn với hàm mật độ như trên thì:
Chứng minh: Theo định nghĩa kỳ vọng toán của đại lượng ngẫu nhiên liên tục, ta có:
Đặt:
Để ý rằng khi đổi sang biến t thì cận lấy tích phân không thay đổi.
Vậy ta có:
Theo giải tích ta có:
Do đó: E(X) =
Phương sai: Nếu X là đại lượng ngẫu nhiên có phân phối chuẩn với hàm mật độ như trên thì:
Chứng minh: Theo định nghĩa phương sai của đại lượng ngẫu nhiên liên tục ta có:
Vì X có phân phối chuẩn nên: E(X) =
Áp dụng phương pháp tích phân từng phần:
Đặt
Khi đó:
Áp dụng phương pháp tích phân từng phần;
Đặt:
Ta có:
Ta thấy:
Vậy ta có:
Đại lượng ngẫu nhiên X có phân phối chuẩn với kỳ vọng toán là
Phân phối chuẩn do nhà toán học Đức Karl Gauss tìm ra nên còn gọi là phân phối Gauss.
3. Phân phối chuẩn chính tắc
Giả sử đại lượng ngẫu nhiên X có phân phối chuẩn với kỳ vọng toán là
Đại lượng ngẫu nhiên z nhận giá trị trong khoảng
Đồ thị của hàm f(z) củng có dạng hình chuông, đối xứng qua trục tung, (hình 3.17)
Có thể chứng minh được rằng: Nếu đại lượng ngẫu nhiên z có phân phối chuẩn chính tắc thì:
E(Z) = 0 và Var(Z) = 1
Đại lượng ngẫu nhiên Z có phân phôi chuẩn chính tắc được ký hiệu là Z ~ N(0,1)
Ta ký hiệu
Nếu minh hoạ trên đồ thị ta thấy diện tích của miền hình học giới hạn bởi đường cong hàm mật độ và trục hoành bằng 1 đơn vị thì za là một điểm nằm trên trục hoành sao cho diện tích của miền gạch chéo trên hình vẽ bằng
Cho trước a ta có thể tính được các giá trị za.
4. Các công thức tính xác suất
Nếu
Trong đó:
Trong đó:
Chứng minh: Thật vậy, ta có:
Theo tính chất hàm mật độ (tính chất 2) ta có:
Đồ thị của hàm
Cách tính giá trị hàm Laplace được trình bày ở phụ lục 1 (phần phân phối chuẩn)
Các giá trị của hàm
Trong bảng chỉ tính
Minh họa hình học giá trị hàm
Thí dụ:
Thí dụ 1: Trọng lượng của một loại sản phẩm là đại lượng ngẫu nhiên có phân phối chuẩn với họng lượng trung bình
Giải: Gọi X là trọng lượng của loại sản phẩm này. Theo giả thiết thì
Tỷ lệ sản phẩm có trọng lượng từ 4,9 đến 5,2 kg chính là: P(4,9
Áp dụng công thức (3.16) ta được:
Tức tỷ lệ những sản phẩm có trọng lượng từ 4,9 đến 5,2 kg là 82%
Chú ý: Nếu dùng hàm NORMDIST để tính xác suất trên thì:
P(4,9
Thí dụ 2: Đường kính của một loại trục máy do một nhà máy sản suất là đại lượng ngẫu nhiên có phân phối chuẩn với đường kính trung bình (theo như thiết kế) là
Giải: Gọi X là đường kính của trục máy. Theo giả thiết
Áp dụng công thức (3.17) ta có:
Chú ý: Nếu dùng hàm NORMSDIST thì:
5. Phân phối xác suất của tổng các đại lượng ngẫu nhiên độc lập có cùng phân phối xác suất
Giả sử X1 và X2 là hai đại lượng ngẫu nhiên độc lập. X1 có phân phối chuẩn với kỳ vọng toán là
Tính chất trên cũng có thể mở rộng cho một số bất kỳ các đại lượng ngẫu nhiên với nhau và cùng có phân phối chuẩn.
Ngoài ra nếu X1, X2, . . . , Xn là n đại lượng ngẫu nhiên độc lập và cùng phân phối xác suất nào đó (không nhất thiết là phân phối chuẩn) với các kỳ vọng toán E(X1), E(X2), . . . , E(Xn) và phương sai var(X1), var(X2), . . . ,var(Xn) đã biết thì đại lượng ngẫu nhiên:
Khi n khá lớn (n > 30)
Tính chất trên thường được gọi là định lý giới hạn trung tâm của Liapunốp.
6. Sự hội tụ của phân phối nhị thức và phân phối Poisson về phân phối chuẩn
Khi sử dụng phân phối nhị thức, nếu n khá lớn thì việc tính toán theo công thức Bemoulli sẽ gặp khó khăn, lúc đó nếu p nhỏ đến mức
Khi n lớn và p không quá gần 0 và không quá gần 1 thì đại lượng ngẫu nhiên X ~ B(n, p) có thể coi X phân phối xấp xỉ chuẩn với kỳ vọng toán
Trong đó:
Công thức (3.24) được gọi là công thức địa phương Laplace.
Khi n lớn, xác suất p không quá gần 0 và không quá gần 1 thì ta có thể dùng công thức xấp xỉ sau đây để tính toán:
Công thức (3. 25) được gọi là công thức tích phân Laplace.
Thí dụ: Xác suất để một máy sản xuất được sản phẩm loại A là 0,8. Tìm xác suất để trong 400 sản phẩm do máy sản xuất ra có:
a. 336 sản phẩm loại A
b. Có từ 304 đến 328 sản phẩm loại A
Giải: Gọi X là số sản phẩm loại A có trong 400 sản phẩm do máy sản xuất. X ~ B(400, 0,8). Vì n = 400 khá lớn, p = 0,8 không quá gần 0 và không quá gần 1, nên ta có thể áp dụng công thức (3.24)
a.
Dùng máy tính ta tính được:
Vậy:
b. Ta cần tính P(304
Trong đó:
Tra bảng hàm
Vậy:
Chú ý: Với thí dụ trên, nếu ta dùng Excel để tính thì:
P(X = 336) =BINOMDIST(336, 400, 0.8,0) = 0,043239
=BINOMDIST(328,400,0.8,1 ) - BINOMDIST(303,400,0.8,1 )=0,83505
Ta thấy kết quả của hai cách tính có chênh lệch nhau, tất nhiên tính bằng Excel sẽ cho kết quả chính xác hơn, vì vậy nếu có thể ta nên tính bằng Excel.
Đối với phân phối Poisson thì quá trình hội tụ về phân phối chuẩn sẽ diễn ra khi
7. Ứng dụng của phân phối chuẩn
Phân phối chuẩn là phân phối xác suất dược áp dụng rộng rãi trong thực tế. Trong nhiều lĩnh vực của khoa học và đời sống ta thường gặp những đại lượng ngẫu nhiên có phân phối chuẩn. Chẳng hạn trong công nghiệp, kích thước của các chi tiết do máy sản xuất ra; trọng lượng của những sản phẩm cùng loại là những đại lượng ngẫu nhiên có phân phối chuẩn nếu quá trình sản xuất diễn ra bình thường. Trong nông nghiệp, năng suất của một loại cây trồng ở những thửa ruộng khác nhau; trọng lượng của gia súc cùng độ tuổi và cùng điều kiện chăm sóc cũng là những đại lượng ngẫu nhiên phân phối chuẩn.
Lý do của sự phổ biến đó đã được nhà toán học người Nga là Li-a-pu-nốp giải thích trong định lý “giới hạn trung tâm”mà một hệ quả của nó là: Nếu đại lượng ngẫu nhiên X là tổng của một số lớn các đại lượng ngẫu nhiên độc lập và mỗi đại lượng ngẫu nhiên có ảnh hưởng rất nhỏ đối với tổng đó thì X sẽ có phân phối xấp xỉ chuẩn.
Thảo luận về Bài viết