Kiểm định sai khác tỷ lệ cho 2 tổng thể
Trong phần này ta sẽ kiểm tra xem tỷ lệ nữ giữa khu vực 1 và khu vực 2 có bằng nhau tại mức ý nghĩa 5% hay không?
Trước hết ta phải tại biến GTF dựa trên biến GT, xem tại đây
Phát biểu giả thuyết thống kê với lần lượt là tỷ lệ nữ ở khu vực 1 và khu vực 2.
Bước 1: Trên thanh công cụ chọn Analyze > Compare Means > Independent-Samples T Test
Bước 2: Sau khi cửa sổ Independent-Samples T Test hiện lên, đưa biến GTF vào ô Test Variable(s), đưa biến KV vào ô Grouping Variable, và chỉnh độ tin cậy trong Options
Bước 3: Nhấn Define Groups để phân nhóm dữ liệu biến GTF theo biến KV như sau:
(Biến KV có 3 giá trị là : 1, 2 và 2NT, do ta đang kiểm định tỷ lệ nữ giữa khu vực 1 và 2 nên ta điền 1 vào Group1 và 2 vào Group2). Sau đó nhấn Continue để trở về cửa sổ trước, và bấm Ok để nhận kết quả
Ta thấy:
* Nếu giả sử phương sai 2 tổng thể bằng nhau: p-value = 0.031 < 0.05 nên ta bác bỏ giả thuyết tại mức ý nghĩa 5%.
* Nếu không giả sử phương sai 2 tổng thể bằng nhau: p-value = 0.032 < 0.05 nên ta bác bỏ giả thuyết tại mức ý nghĩa 5%.
Hơn nữa, ta nhận thấy khoảng tin cậy cho sai khác giữa hai tổng thể là khoảng chỉ chứa các giá trị âm, nên ta suy luận rằng tỷ lệ nữ của khu vực 1 ít hơn khu vực 2 là hợp lý. (Xem lại cách kiểm định giả thuyết 1 phía tại đây)
Bây giờ ta sẽ kiểm định giả thuyết tỷ lệ nữ của khu vực 1 ít hơn khu vực 2:
* Nếu giả sử phương sai của 2 tổng thể bằng nhau: df= 77
Ta có = -1.664885 > t = -2.202 nên ta sẽ bác bỏ giả thuyết và chấp nhận giả thuyết tại mức ý nghĩa 5%
(Ta tính giá trị bằng cách tra bảng hoặc dùng lệnh qt(df=77,0.95) trong phần mềm R)
* Nếu không giả sử phương sai 2 tổng thể bằng nhau: df=31.175
Ta có -= -1.695226 > t = -2.242 nên ta sẽ bác bỏ giả thuyết và chấp nhận giả thuyết tại mức ý nghĩa 5%.
(Ta cũng có thể tính = 1.695519 nếu dùng bảng tra)