Bài 9: Kiểm định giả thiết về tính độc lập

Nội dung bài giảng Bài 9: Kiểm định giả thiết về tính độc lập sau đây sẽ giúp các bạn tìm hiểu về tính độc lập với các ví dụ minh họa cụ thể.

Tóm tắt lý thuyết

Giả sử quan sát đồng thời hai dấu hiệu A và B trên cùng một phần tử.

Dấu hiệu A có các dấu hiệu thành phần là: A1,A2,...,Ah;

Dấu hiệu B có các dấu hiệu thành phần là: B1,B2,...,Bk

Ta cần kiểm định giả thiết:

H0: A và B độc lập; H1: A và B không độc lập.

Lấy mẫu kích thước n và trình bày kết quâ quan sát dưới dạng bảng sau đây:

B B1 B2 .... Bk Tổng
A
A1 n11 n12 .... n1k n1
A2 n21 n22 .... n2k n2
... .... .... .... .... ....
Ah nh1 nh2 .... nhk nh
Tổng m1 m2 .... mk n

Trong đó:

ni=(i=1,h) là tổng số phần tử mang dấu hiệu thành phần Ai.

mj=(j=1,k) là tổng số phần tử mang dâu hiệu thành phần Bj

nij(i=1,h,j=1,k) là tổng số phần tử mang dấu hiệu thành phần Ai và Bj.

Gọi Ci là biến cố chọn được phần tử mang dấu hiệu Ai

Dj là biến cố chọn được phần tử mang dấu hiệu Bj

Khi n khá lớn, theo định nghĩa thống kê về xác suất ta có:

P(CiDj)=nijn;P(Ci)=nin;P(Dj)=mjn;

Nếu H0 đúng, tức A, B độc lập thì các dấu hiệu Ai, Bj cũng độc lập. Do đó:

P(Ci.Dj)=P(Ci)P(Dj)

Tức là:

nijn=nin.mjn

Từ đó ta có qui tắc quyết định như sau:

  • Lấy mẫu kích thước n, từ mẫu này tính:

χ2=i=1hj=1k(nijnnin.mjn)2nin.mjn=n(i=1hj=1knij2ni.mj1)

  • Với mức ý nghĩa a đã cho, tra bảng χ2 với bậc tự do (k1)(h1) để tìm χα2 (hoặc dùng hàm CHIINV trong Excel).
  • Nếu χ2>χα2 thì bác bỏ H0, thừa nhận H1
  • Nếu χ2χα2 thì có thể chấp nhận H0

Thí dụ: Làm thí nghiệm bón một loại phân theo 3 phương pháp khác nhau cho cùng một loại cây trồng và quan sát việc ra hoa của loại cây này, ta có kết quả cho ở bảng sau:

A Phương pháp 1 Phương pháp 2 Phương pháp 3 Tổng
B
Có ra hoa 40 75 63 178
Không ra hoa 15 12 12 39
Tổng 55 87 75 n=217

Với mức ý nghĩa α=0,05 hãy kết luận xem phương pháp bón phân khác nhau có ảnh hưởng tới việc ra hoa của loại cây đó không ?

Giải:

Đặt giả thiết H0: Phương pháp bón phân (dấu hiệu A) độc lập với việc ra hoa của cây (dấu hiệu B).

H1: Phương pháp bón phân không độc lập (có ảnh hưởng) đến việc ra hoa của cây.

Từ bảng số liệu đã cho, để tính χ2 trước hết ta tính các số hạng:

αij=nij2nimj(i,j)

Ở thí dụ ta đang xét, ứng với ô có nij=40 (tức i = 1 và j = 1) thì: 

α11=n112n1m1=402178.55=0,163432

Ứng với ô có nij=75 (tức i = 1 và j = 2) thì: 

α12=n122n1m2=752178.87=0,363231

Đối với các ô còn lại ta cũng tính tương tự. Kết quả tính toán được trình bày dưới dạng bảng như sau:

A Phương pháp 1 Phương pháp 2 Phương pháp 3 Tổng
B
Có ra hoa

0,163432

40

0,363231

75

0,297303

63
178
Không ra hoa

0,104895

15

0,04244

12

0,049231

12
39
Tổng 55 87 75 n=217

Từ các kết quả tính ở bảng trên, ta tính được: 

i=1hj=1knij2ni.mj=0,163432+0,363231+...+0,049231=1,020533

Vậy:

χ2=n(i=1hj=1knij2ni.mj1)=217(1,0205331)=4,45565

Với mức ý nghĩa α=0,05, tra bảng χ2 với bậc tự do:

V=(h1).(k1)=(31).(21)=2

ta được:

χα2=χ0,052=5,991

χα2=4,45565<χ0,052=5,991, nên ta chấp nhận giả thiết H0, tức phương pháp bón phân không ảnh hưởng đến việc ra hoa của loại cây này.

Tham khảo thêm

Bình luận

Thảo luận về Bài viết

Có Thể Bạn Quan Tâm ?