Pseudo R2 là gì

Nhóm Thạc Sĩ QTKD ĐH Bách Khoa giới thiệu về lý thuyết và cách thực hành, cách phân tích ý nghĩa kết quả hồi quy đa thức. Kèm theo file dữ liệu thực hành luôn nhé.

Lý thuyết hồi quy đa thức

Mô hình hồi quy đa thức, còn gọi là hồi quy logistic đa thức [Multinomial logistic regression] tương tự như mô hình hồi quy logistic nhị phân nhưng biến phụ thuộc là biến định tính có nhiều hơn 2 trạng thái.
Ví dụ: dùng hồi quy đa thức để xác định loại nước uống nào được thích hơn. Biến phụ thuộc : loại nước uống [ gồm 3 loại: Cafe, nước giải khát có gas Soft drink , trà và nước lọc], biến độc lập là độ tuổi[ là biến liên tục] và vùng miền[ là biến phân loại Bắc, Trung, Nam]

Như vậy, biến phụ thuộc là biến phân loại,còn biến độc lập có thể là biến phân loại hoặc là biến liên tục.

Cách thực hành phân tích hồi quy đa thức trên SPSS

Đầu tiên tạo 3 biến trong SPSS như sau:
Biến độc lập độ tuổi, là biến liên tục, ví dụ 30,31,32 tuổi.
Biến độc lập vùng miền, là biến phân loại: Nam, Trung, Bắc tương ứng với giá trị mã hóa 0 1 2
Biến phụ thuộc Loại nước uống yêu thích: Cafe, nước giải khát có gas Soft drink , trà và nước lọc. Tương ứng với mã hóa 0 1 2
Sau đó nhập các giá trị đã khảo sát vào, sẽ được như sau:

Các bạn có thể tải file thực hành hồi quy đa thức ở đây: www.phantichspss.com/filefordownload/phantichspss-hoi-quy-da-thuc.sav

Nhấn vào menu Analyze > Regression > Multinomial Logistic.


Cửa sổ phân tích hồi quy đa thức hiện ra như sau:

Đưa lần lượt các biến vào như sau
Biến phụ thuộc phân loại "Loại nước uống" Loainuocuong đưa vào ô Dependent.
Biến độc lập liên tục "Độ tuổi" Tuoi được đưa vào ô Covariate.
Biến độc lập phân loại "Vùng miền" Vungmien được đưa vào ô Factor[s].


Mặc định, nhóm tham chiếu của biến phụ thuộc là nhóm cuối cùng, ví dụ Loainuocuong[Last] như hình trên.
Nhấn vào nút Statistics, để hiện ra được bảng Multinomial Logistic Regression: Statistics như sau:


Chọn vào 2 checkboxes Classification table và Goodness-of-fit . Sau đó nhấn Continue
Nhấn nút OK để bắt đầu hiển thị kết quả phân tích hồi quy đa thức.

Cách đọc kết quả phân tích hồi quy đa thức trên SPSS

Bảng Goodness-of-Fit giả thích độ phù hợp của dữ liệu so với mô hình.


Dòng đầu tiên Pearson thể hiện kiểm định chi-square. Giá trị chi-square càng lớn thì mô hình càng kém phù hợp. Nếu sig.5% nên mô hình này phù hợp với dữ liệu.

Bảng Model Fitting Information

Dòng "Final" thể hiện có phải tất cả các hệ số trong mô hình bằng 0 hay không? Hiểu theo cách khác là nếu mô hình này có biến độc lập được thêm vào thì có tốt hơn là mô hình chỉ có hệ số chặn intercept hay không[ mô hình không có biến độc lập]. Ở đây giá trị sig.=0.00 < 5% nên ta kết luận mô hình với đầy đủ các biến độc lập dự đoán biến phụ thuộc tốt hơn so với mô hình chỉ có hệ số chặn intercept.

Bảng Pseudo R-Square và bảng Likelihood Ratio Tests


Trị số R bình phương giả pseudo-R2 gần như tương tự với R bình phương trong hồi quy tuyến tính.
Còn bảng Likelihood Ratio Tests cho ta thấy các biến độc lập có tác động có ý nghĩa thống kê đến biến phụ thuộc hay không? Nếu cột Sig.

Chủ Đề