Kiểm định về tính độc lập của hai biến định tính
Bài toán
Giả sử mỗi phần tử trong tổng thể có thể được phân loại theo hai đặc tính khác nhau, gọi là đặc tính X và Y. Có r phần tử trong tổng thể mang đặc tính X và s phần tử trong tổng thể có dặc tính Y. Gọi
với i = 1, 2, ... , r và j = 1, 2, ... , s
là xác suất chọn được phần tử trong tổng thể mang đặc tính X bằng và đặc tính Y bằng .
Gọi
Trong đó là xác suất chọn được phần tử trong tổng thể mang đặc tính X bằng , là xác suất chọn được phần tử trong tổng thể mang đặc tính Y bằng
Ta cần kiểm định xem X có độc lập với Y hay không?
Phát biểu giả thuyết
Khảo sát thực tế N phần tử, ta được bảng kết quả sau
... | Tổng hàng | ||||
... | |||||
... | |||||
... | ... | ... | ... | ... | ... |
... | |||||
Tổng cột | ... |
trong đó các gọi là tần số thực nghiệm.
Ước lượng của và lần lượt bằng
Gọi là số phần tử có đặc tính trong phần tử khảo sát, thì . Khi đó, khi đúng.
Đặt , gọi là tần số lý thuyết.
Với và , biến ngẫu nhiên sẽ hội tụ theo phân phối về biến ngẫu nhiên Chi bình phương bậc tự do |
Bây giờ, ta dùng SPSS để kiểm tra xem học sinh chọn khối thi có tùy thuộc vào giới tính hay không? (biến GT và biến KT có độc lập nhau hay không)
Bước 1: Trên thanh công cụ, chọn Analyze > Descriptive Statistics > Crosstabs
Bước 2: Sau khi cửa sổ Crosstabs hiện ra, ta đưa biến KT vào ô Row(s) và biến GT vào ô Column(s) (hoặc có thể làm ngược lại)
Bước 3: Bấm vào nút Statistics.. bên phải ô Column(s) và ô Row(s) , sau đó click chọn Chi-Square để tiến hành kiểm định Chi- bình phương, sau đó bấm nút Continue để quay lại cửa sổ trước.
Bước 4: Khi đã quay lại cửa sổ Crosstabs, ta bấm OK để nhận kết quả
Kết quả p-value=0.005 < 5% vì vậy ta bác bỏ giả thuyết tại mức ý nghĩa 5% và kết luận rằng việc lựa chọn khối thi phụ thuộc vào giới tính.