Nội dung bài giảng Bài 3: Kiểm định giả thiết bằng p-value sau đây sẽ giúp các bạn tìm hiểu về giả thiết bằng p-value gồm có ví dụ chứng minh cụ thể. Mời các bạn cùng tham khảo!
Tóm tắt lý thuyết
Thủ tục kiểm định trình bày ở trên có tính chất truyền thống và theo cách tiếp cận cổ điển. Trong những năm gần đây, nhiều nhà nghiên cứu thường sử dụng một cách tiếp cận khác. Thay vì kiểm định giả thiết với một giá trị \(\alpha\) định trước thì họ cho rằng ta nên định rõ các giả thiết H0 và H1, sau đó thu thập số liệu mẫu và tính giá trị của tiêu chuẩn kiểm định. Từ đó có thể xác định được xác suất mắc phải sai lầm loại I nếu ta bác bỏ giả thiết H0. Xác suất này thương được gọi là giá trị p (p-value) của kiểm định.
Chúng ta sẽ minh họa cách tính p-value qua thí dụ sau:
Thí dụ: Trọng lượng của những con gà khi xuất chuồng là đại lượng ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là 0,32. Trước đây trọng lượng trung bình khi xuất chuồng của một con gà ở trại chăn nuôi này là 3,4 kg. Năm nay người ta áp dụng thử một phương pháp chăn nuôi mới. Sau một thời gian áp dụng thử, người ta chọn ngẫu nhiên 50 con đem cân và tính được trung bình mẫu là 3,5 kg. Hãy cho biết phương pháp chăn nuôi mới có tác dụng làm tăng trọng lượng của gà khi xuất chuồng hay không ?
a. Hãy xác định p-value của kiểm định ?
b. p-value sẽ thay đổi như thế nào nếu trung bình mẫu không phải là 3,5 mà là 3,6 ?
Giải:
a) Gọi \(\mu\) là trọng lượng của một con gà khi xuất chuồng của trại chăn nuôi sau khi áp dụng phương pháp chăn nuôi mới (\(\mu\) chưa biết). Ta cần kiểm định giả thiết:
\({H_0}:\mu = 3,4;{H_1}:\mu > 3,4\)
Đây là bài toán kiểm định giả thiết về trung bình tổng thể (kiểm định giả thiết một phía), \({\sigma ^2}\) chưa biết.
Từ các giả thiết của bài toán, ta tính được giá trị của tiêu chuẩn kiểm định :
\(z = \frac{{\left( {\overline x - {m_0}} \right)\sqrt n }}{\sigma } = \frac{{(3,5 - 3,4)\sqrt {50} }}{{0,32}} = 2,21\)
p-value của kiểm định (tức là xác suất mắc phải sai lầm loại 1 nếu ta bác bỏ giả thiết H0) chính là : P(Z > 2,21)
Để tính xác suất này ta có thể dùng bảng hàm Laplace hoặc dùng hàm NORMSDIST trong Excel.
- Nếu dùng bảng hàm Laplace thì:
\(p - value = P\left( {Z > 2,21} \right) = 0,5 - {\rm{ }}\varphi (2,21) = 0,5 - 0,48645 = 0,01355\)
- Nếu dùng hàm NORMSDIST thì:
\(p-value = P(Z > 2,21) = 1- NORMSDIST(2,21) = 0,01355\)
Ta có thể minh họa giá trị p-value trên đồ thị như sau:
Như vậy, với mẫu đã cho ở thí dụ này, nếu ta bác bỏ giả thiết H0, tức cho rằng việc áp dụng phương pháp chăn nuôi mới có tác dụng làm tăng trọng lượng trung bình của gà khi xuất chuồng thì khả năng mắc phải sai lầm loại 1 là 0,01355 (hay 1,355%).
Nếu trung bình mẫu là 3,6 , tức \(\overline X = 3,6\), khi đó ta tính được:
\(z = \frac{{\left( {\overline x - {m_0}} \right)\sqrt n }}{\sigma } = \frac{{(3,6 - 3,4)\sqrt {50} }}{{0,32}} = 4,419\)
Khi đó ta có:
p-value = P(Z > 4,419) = 1-NORMSDIST(4.419) = 4.962E-06.
4.962E-06 = 4,962x 10-6 = 0,000004962 < 0,00001. Tức p-value ứng với z = 4,419 rất nhỏ (có thể coi bằng 0 nếu là lấy 5 số thập phân).
Như vậy p-value càng nhỏ thì mức độ khẳng định của mẫu về việc bác bỏ giả thiết H0 càng rõ rệt hơn, nói cách khác, giả thiết H0 càng kém tin cậy hơn. Chẳng hạn p-value = 0,01 cho thấy mức độ khẳng định để bác bỏ giả thiết H0 càng rõ ràng hơn so với giá trị p-value = 0,1.
Ở trên là p-value trong kiểm định một phía (phía bên phải). Nếu kiểm định già thiết về phía bên trái hoặc kiểm định giả thiết hai phía thì ta cũng tìm được giá trị p-value tương ứng.
Công thức tính p-value cho kiểm định giả thiết về trung bình tổng thể như sau:
Trường hợp đã biết \({\sigma ^2}\).
- Nếu \({H_1}:\mu > {m_0}\) thì p-value = P(Z>z) (8.4)
- Nếu \({H_1}:\mu < {m_0}\) thì p-value = P(Z
- Nếu \({H_1}:\mu \ne {m_0}\) thì p-value = P(Z>|z|) (8.6)
Trường hợp chưa biết \({\sigma ^2}\).
- Nếu \({H_1}:\mu > {m_0}\) thì p-value = P(T>t) (8.7)
- Nếu \({H_1}:\mu < {m_0}\) thì p-value = P(T
(8.8) - Nếu \({H_1}:\mu \ne {m_0}\) thì p-value = P(T>|t|) (8.9)
Trong thực tế, việc kiểm định giả thiết theo p-value thường được theo nguyên tắc sau:
- Nếu p-value >0,1 thì thường người ta thừa nhận H0
- Nếu 0,05 < p-value \(\le\) 0,1 thì cần cân nhắc cẩn thận trước khi bác bỏ giả thiết H0.
- Nếu 0,01 \(\le\) p-value \(\le\) 0,05 thì nghiêng về hướng bác bỏ giả thiết H0 nhiều hơn.
- Nếu 0,001 \(\le\) p-value \(\le\) 0,01 thì ít băn khoăn khi bác bỏ H0.
- Nếu p-value < 0,001 thì có thể hoàn toàn yên tâm khi bác bỏ H0.
Mặt khác, nếu quy định trước mức ý nghĩa a thì có thể dùng p-value để kết luận theo \(\alpha\). Khi đó ta có thể áp dụng quy tắc kiểm định như sau:
- Nếu p-value < \(\alpha\) thì bác bỏ H0, thừa nhận H1.
- Nếu p-value \(\ge \alpha\) thì chưa có cơ sở để bác bỏ H0.
Theo cách kiểm định này thì việc sử dụng p-value lại chính là kiểm định theo cách tiếp cận truyền thống.
Thí dụ: Nếu máy đóng bao hoạt động bình thường thì trọng lượng của các bao gạo do máy này sản xuất là đại lượng ngẫu nhiên có phân phối chuẩn với trọng lượng trung bình là 50 kg. Nghi ngờ các bao gạo do máy này sản xuất không đủ trọng lượng qui định, người ta tiến hành cân thử 25 bao và tính được: \(\overline X = 49,68{\rm{ }}kg\) và s = 0,5. Hãy cho kết luận về điều nghi ngờ trên?
Giải: Gọi X là trọng lượng các bao gạo do máy đóng bao sản xuất. \(X \sim N(\mu ,{\sigma ^2})\). Ta cần kiểm định giả thiết:
\(H_0: \mu = 50\); với giả thiết đối \(H_1: \mu < 50\)
Đây là bài toán kiểm định giả thiết về trung bình tổng thể, \({\sigma ^2}\) chưa biết và không quy định trước mức ý nghĩa \(\alpha\).
Để kiểm định giả thiết trên, trước hết ta tính:
\(t = \frac{{\left( {\overline x - {m_0}} \right)\sqrt n }}{s} = \frac{{\left( {49,68 - 50} \right)\sqrt {25} }}{{0,5}} = - 3,2\)
Theo công thức (8.8) ta có:
\(p-value = P(T< t) = P(T < -3,2)\)
Ta có :
\(P(T < -3,2) = P(T > 3,2) = TDIST(3.2,24,1) = 0,00192\)
Như vậy 0,001 < p-value < 0,01 nên ta ít băn khoăn khi bác bỏ giả thiết Ho. Tức có thể kết luận máy đóng bao đã sản xuất ra các bao gạo có trọng lượng trung bình thấp hơn 50 kg.
Chú ý: Nếu ở thí dụ này ta cho trước mức ý nghĩa \(\alpha\) (chẳng hạn ta cho \(\alpha=0,01\)) thì theo kết quả tính p-value ta thấy:
\(p-value = 0,00192 < 0,01\)
nên ta bác bỏ giá thiết H0. Như vậy ta cũng đi đến cùng một kết luận như trên.