Skip navigation

Kiểm định sai khác tỷ lệ cho 2 tổng thể

Trong phần này ta sẽ kiểm tra xem tỷ lệ nữ giữa khu vực 1 và khu vực 2 có bằng nhau tại mức ý nghĩa 5% hay không?

Trước hết ta phải tại biến GTF dựa trên biến GT, xem tại đây

Phát biểu giả thuyết thống kê  với  lần lượt là tỷ lệ nữ ở khu vực 1 và khu vực 2.

Bước 1: Trên thanh công cụ chọn Analyze > Compare Means > Independent-Samples T Test

Bước 2: Sau khi cửa sổ Independent-Samples T Test hiện lên, đưa biến GTF vào ô Test Variable(s), đưa biến KV vào ô Grouping Variable, và chỉnh độ tin cậy trong Options

Bước 3: Nhấn Define Groups để phân nhóm dữ liệu biến GTF theo biến KV như sau: 

(Biến KV có 3 giá trị là : 1, 2 và 2NT, do ta đang kiểm định tỷ lệ nữ giữa khu vực 1 và 2 nên ta điền 1 vào Group1 và 2 vào Group2). Sau đó nhấn Continue để trở về cửa sổ trước, và bấm Ok để nhận kết quả

Ta thấy:

* Nếu giả sử phương sai 2 tổng thể bằng nhau: p-value = 0.031 < 0.05 nên ta bác bỏ giả thuyết   tại mức ý nghĩa 5%.

* Nếu không giả sử phương sai 2 tổng thể bằng nhau: p-value = 0.032 < 0.05 nên ta bác bỏ giả thuyết   tại mức ý nghĩa 5%.

Hơn nữa, ta nhận thấy khoảng tin cậy cho sai khác giữa hai tổng thể là khoảng chỉ chứa các giá trị âm, nên ta suy luận rằng tỷ lệ nữ của khu vực 1 ít hơn khu vực 2 là hợp lý. (Xem lại cách kiểm định giả thuyết 1 phía tại đây)

Bây giờ ta sẽ kiểm định giả thuyết tỷ lệ nữ của khu vực 1 ít hơn khu vực 2:  

* Nếu giả sử phương sai của 2 tổng thể bằng nhau: df= 77

Ta có = -1.664885 > t = -2.202 nên ta sẽ bác bỏ giả thuyết  và chấp nhận giả thuyết  tại mức ý nghĩa 5%

(Ta tính giá trị  bằng cách tra bảng hoặc dùng lệnh qt(df=77,0.95) trong phần mềm R)

* Nếu không giả sử phương sai 2 tổng thể bằng nhau: df=31.175

Ta có -= -1.695226 > t = -2.242  nên ta sẽ bác bỏ giả thuyết  và chấp nhận giả thuyết  tại mức ý nghĩa 5%.

(Ta cũng có thể tính = 1.695519 nếu dùng bảng tra)