Skip navigation

Kiểm định về tính độc lập của hai biến định tính

Bài toán


Giả sử mỗi phần tử trong tổng thể có thể được phân loại theo hai đặc tính khác nhau, gọi là đặc tính X và Y. Có r phần tử trong tổng thể mang đặc tính X và s phần tử trong tổng thể có dặc tính Y. Gọi

  với i = 1, 2, ... , r và j = 1, 2, ... , s

 là xác suất chọn được phần tử trong tổng thể mang đặc tính X bằng  và đặc tính Y bằng .

Gọi

Trong đó   là xác suất chọn được phần tử trong tổng thể mang đặc tính X bằng  ,  là xác suất chọn được phần tử trong tổng thể mang đặc tính Y bằng 

Ta cần kiểm định xem X có độc lập với Y hay không?

Phát biểu giả thuyết

Khảo sát thực tế N phần tử, ta được bảng kết quả sau

  ...   Tổng hàng
...
...
... ... ... ... ... ...
...
Tổng cột ...

 trong đó các  gọi là tần số thực nghiệm.

Ước lượng của  và  lần lượt bằng

Gọi  là số phần tử  có đặc tính  trong phần tử khảo sát, thì . Khi đó,  khi  đúng.

Đặt  , gọi là tần số lý thuyết.

Với  và , biến ngẫu nhiên

sẽ hội tụ theo phân phối về biến ngẫu nhiên Chi bình phương  bậc tự do


Bây giờ, ta dùng SPSS để kiểm tra xem học sinh chọn khối thi có tùy thuộc vào giới tính hay không? (biến GT và biến KT có độc lập nhau hay không)

Bước 1: Trên thanh công cụ, chọn Analyze > Descriptive Statistics > Crosstabs

Bước 2: Sau khi cửa sổ Crosstabs hiện ra, ta đưa biến KT vào ô Row(s) và biến GT vào ô Column(s) (hoặc có thể làm ngược lại)

Bước 3: Bấm vào nút Statistics.. bên phải ô Column(s) và ô Row(s) , sau đó click chọn Chi-Square để tiến hành kiểm định Chi- bình phương, sau đó bấm nút Continue để quay lại cửa sổ trước.

Bước 4: Khi đã quay lại cửa sổ Crosstabs, ta bấm OK để nhận kết quả


Kết quả p-value=0.005 < 5% vì vậy ta bác bỏ giả thuyết  tại mức ý nghĩa 5% và kết luận rằng việc lựa chọn khối thi phụ thuộc vào giới tính.