Khác với tương quan Pearson, trong hồi quy đa biến các biến không có tính chất đối xứng như phân tích tương quan. Vai trò giữa biến độc lập và biến phụ thuộc là khác nhau. X và Y hay Y và X có tương quan với nhau đều mang cùng một ý nghĩa, trong khi đó với hồi quy, ta chỉ có thể nhận xét: X tác động lên Y hoặc Y chịu tác động bởi X.
Đối với phân tích hồi quy tuyến tính đa biến, chúng ta giả định các biến độc lập X1, X2, X3 sẽ tác động đến biến phụ thuộc Y. Ngoài X1, X2, X3… còn có rất nhiều những nhân tố khác ngoài mô hình hồi quy tác động đến Y mà chúng ta không liệt kê được.
1. Các tiêu chí trong phân tích hồi quy đa biến
1.1 Giá trị R2 (R Square), R2 hiệu chỉnh (Adjusted R Square)
Giá trị R2 và R2 hiệu chỉnh phản ánh mức độ giải thích biến phụ thuộc của các biến độc lập trong mô hình hồi quy. R2 hiệu chỉnh phản ánh sát hơn so với R2. Mức dao động của 2 giá trị này là từ 0 đến 1, tuy nhiên việc đạt được mức giá trị bằng 1 là gần như không tưởng dù mô hình đó tốt đến nhường nào. Giá trị này thường nằm trong bảng Model Summary. Cần chú ý, không có tiêu chuẩn chính xác R2 hiệu chỉnh ở mức bao nhiêu thì mô hình mới đạt yêu cầu, chỉ số này nếu càng tiến về 1 thì mô hình càng có ý nghĩa, càng tiến về 0 thì ý nghĩa mô hình càng yếu. Thường chúng ta chọn mức trung gian là 0.5 để phân ra 2 nhánh ý nghĩa mạnh/ý nghĩa yếu, từ 0.5 đến 1 thì mô hình là tốt, bé hơn 0.5 là mô hình chưa tốt. Tuy nhiên, tùy vào dạng nghiên cứu và dạng dữ liệu, không phải lúc nào cũng bắt buộc rằng mô hình hồi quy phải đạt giá trị R2 hiệu chỉnh lớn hơn 0.5 mới có ý nghĩa.
1.2 Kiểm định F
Giá trị sig của kiểm định F được sử dụng để kiểm định độ phù hợp của mô hình hồi quy. Nếu sig nhỏ hơn 0.05, ta kết luận mô hình hồi quy tuyến tính bội phù hợp với tập dữ liệu và có thể sử đụng được. Giá trị này thường nằm trong bảng ANOVA.
1.3 Hệ số Durbin Watson
Trị số Durbin – Watson (DW) dùng để kiểm tra hiện tượng tự tương quan chuỗi bậc nhất (kiểm định tương quan của các sai số kề nhau). DW có giá trị biến thiên trong khoảng từ 0 đến 4; nếu các phần sai số không có tương quan chuỗi bậc nhất với nhau thì giá trị sẽ gần bằng 2, nếu giá trị càng nhỏ, gần về 0 thì các phần sai số có tương quan thuận; nếu càng lớn, gần về 4 có nghĩa là các phần sai số có tương quan nghịch.
Theo Field (2009), nếu DW nhỏ hơn 1 và lớn hơn 3, chúng ta cần thực sự lưu ý bởi khả năng rất cao xảy ra hiện tượng tự tương quan chuỗi bậc nhất. Theo Yahua Qiao (2011), thường giá trị DW nằm trong khoảng 1.5 – 2.5 sẽ không xảy ra hiện tượng tự tương quan, đây cũng là mức giá trị tiêu chuẩn chúng ta sử dụng phổ biến hiện nay.
Để đảm bảo chính xác, chúng ta sẽ tra ở bảng thống kê Durbin-Watson (có thể tìm bảng thống kê DW trên Internet). Giá trị này thường nằm trong bảng Model Summary.
Hệ số k’ là số biến độc lập đưa vào chạy hồi quy, N là kích thước mẫu. Nếu N của bạn là một con số lẻ như 175, 214, 256, 311…. mà bảng tra DW chỉ có các kích thước mẫu làm tròn dạng 150, 200, 250, 300, 350… thì bạn có thể làm tròn kích thước mẫu với giá trị gần nhất trong bảng tra. Ví dụ: 175 làm tròn thành 200; 214 làm tròn 200; 256 làm tròn 250, 311 làm tròn 300…
1.4 Kiểm định t
Giá trị sig của kiểm định t được sử dụng để kiểm định ý nghĩa của hệ số hồi quy. Nếu sig kiểm định t của hệ số hồi quy của một biến độc lập nhỏ hơn 0.05, ta kết luận biến độc lập đó có tác động đến biến phụ thuộc. Nếu sig kiểm định t của biến độc lập lớn hơn 0.05, chúng ta kết luận biến độc lập đó không có sự tác động lên biến phụ thuộc, và không cần loại bỏ biến đó để chạy lại hồi quy lần tiếp theo. Mỗi biến độc lập tương ứng với một hệ số hồi quy riêng, do vậy mà ta cũng có từng kiểm định t riêng. Giá trị này thường nằm trong bảng Coefficients.
1.5 Đa cộng tuyến VIF
Hệ số phóng đại phương sai VIF dùng để kiểm tra hiện tượng đa cộng tuyến. Thông thường, nếu VIF của một biến độc lập lớn hơn 10 nghĩa là đang có đa cộng tuyến xảy ra với biến độc lập đó. Khi đó, biến này sẽ không có giá trị giải thích biến thiên của biến phụ thuộc trong mô hình hồi quy. Với các đề tài sử dụng thang đo Likert, nếu hệ số VIF > 2 thì khả năng rất cao đang xảy ra hiện tượng đa cộng tuyến giữa các biến độc lập. Giá trị này thường nằm trong bảng Coefficients.
2. Thực hành trên SPSS 20 với tập dữ liệu mẫu
Phần thực hành này tác giả có một tập data mẫu với biến phụ thuộc là Sự hài lòng của nhân viên (ký hiệu HL), các biến độc lập là:
- Lương, thưởng, phúc lợi: TN
- Bản chất công việc: CV
- Quan hệ với lãnh đạo: LD
- Môi trường làm việc: MT
- Đào tạo và thăng tiến: DT
Thực hiện phân tích hồi quy tuyến tính bội để đánh giá sự tác động của các biến độc lập này đến biến phụ thuộc HL.
Để thực hiện phân tích hồi quy đa biến trong SPSS 20, chúng ta vào Analyze > Regression > Linear…
Đưa biến phụ thuộc vào ô Dependent, các biến độc lập vào ô Indenpendents:
Vào mục Statistics, tích chọn các mục như trong ảnh và chọn Continue:
Vào mục Plots, tích chọn vào Histogram và Normal probability plot, kéo biến ZRESID thả vào ô Y, kéo biến ZPRED thả vảo ô X như hình bên dưới. Tiếp tục chọn Continue.
Ở mục Save, tích vào ô Standardized như hình bên dưới để xuất dữ liệu phần dư chuẩn hóa, phục vụ cho việc kiểm tra vi phạm giả định phương sai không đổi. Sau đó chọn Continue.
Các mục còn lại chúng ta sẽ để mặc định. Quay lại giao diện ban đầu, mục Method là các phương pháp chạy hồi quy, 2 method phổ biến nhất là Stepwise và Enter, thường thì sẽ chọn Enter. Chọn xong phương pháp, các bạn nhấp vào OK.
SPSS sẽ xuất ra rất nhiều bảng, những bảng các bạn cần sử dụng là: Model Summary, ANOVA, Coefficients.
→ Giá trị R2 hiệu chỉnh bằng 0.726 cho thấy biến độc lập đưa vào chạy hồi quy ảnh hưởng 72.6% sự thay đổi của biến phụ thuộc, còn lại 27.4% là do các biến ngoài mô hình và sai số ngẫu nhiên.
→ Hệ số Durbin – Watson = 1.998, nằm trong khoảng 1.5 đến 2.5 nên không có hiện tượng tự tương quan chuỗi bậc nhất xảy ra.
→ Sig kiểm định F bằng 0.00 < 0.05, như vậy, mô hình hồi quy tuyến tính bội phù hợp với tập dữ liệu và có thể sử đụng được.
→ Sig kiểm định t hệ số hồi quy của các biến độc lập đều nhỏ hơn 0.05, do đó các biến độc lập đều có ý nghĩa giải thích cho biến phụ thuộc, không biến nào bị loại khỏi mô hình.
(Lưu ý rằng SPSS ký hiệu .031 nghĩa là 0.031. SPSS tự động loại bỏ số 0 trước dấu phẩy phần thập phân một số bảng kết quả như tương quan, hồi quy,…)
→ Hệ số VIF của các biến độc lập đều nhỏ hơn 10 do vậy không có đa cộng tuyến xảy ra.
→ Các hệ số hồi quy đều lớn hơn 0. Như vậy tất cả các biến độc lập đưa vào phân tích hồi quy đều tác động cùng chiều tới biến phụ thuộc. Dựa vào độ lớn của hệ số hồi quy chuẩn hóa Beta, thứ tự mức độ tác động từ mạnh nhất tới yếu nhất của các biến độc lập tới biến phụ thuộc HL là: LD (0.394) > DT(0.370) > TN (0.369) > CV (0.323) > MT (0.079). Tương ứng với:
- Biến Lãnh đạo và cấp trên tác động mạnh nhất tới sự hài lòng của nhân viên.
- Biến Cơ hội đào tạo và thăng tiến tác động mạnh thứ 2 tới sự hài lòng của nhân viên.
- Biến Lương, thưởng, phúc lợi tác động mạnh thứ 3 tới sự hài lòng của nhân viên.
- Biến Bản chất công việc tác động mạnh thứ 4 tới sự hài lòng của nhân viên.
- Biến Điều kiện làm việc tác động yếu nhất tới sự hài lòng của nhân viên.
Kết luận, với 6 giả thuyết từ H1 đến H6 chúng ta đã đặt ra ban đầu ở mục Giả thuyết nghiên cứu (mục 1.3). Có 5 giả thuyết được chấp nhận là: H1, H2, H3, H5, H6 tương ứng với các biến: Lãnh đạo và cấp trên; Cơ hội đào tạo và thăng tiến; Lương, thưởng, phúc lợi; Bản chất công việc; Điều kiện làm việc. Riêng giả thuyết H4 bị bác bỏ, yếu tố Đồng nghiệp không tác động đến Sự hài lòng của nhân viên trong công việc tại công ty TNHH Nhãn Xanh, hay nói cách khác, biến Đồng nghiệp không có ý nghĩa trong mô hình hồi quy.
Phương trình hồi quy chuẩn hóa:
HL = 0.394*LD + 0.370*DT + 0.369*TN + 0.323*CV + 0.079*MT + e
Sự hài lòng của nhân viên = 0.394 * Lãnh đạo và cấp trên
+ 0.370 * Cơ hội đào tạo và thăng tiến
+ 0.369 * Lương, thưởng, phúc lợi
+ 0.323 * Bản chất công việc
+ 0.079 * Điều kiện làm việc
** Lưu ý: Khi viết phương trình hồi quy chuẩn hóa, nên sắp xếp các biến độc lập theo thứ tự hệ số hồi quy chuẩn hóa giảm dần để thuận tiện đọc kết quả từ phương trình.
--------
Nếu bạn gặp khó khăn khi thực hiện phân tích hồi quy đa biến trên SPSS vì số liệu khảo sát xấu, bạn có thể tham khảo
dịch vụ SPSS của mình
ở đây hoặc liên hệ trực tiếp email
phamlocblog@gmail.com. Dịch vụ từ Xử Lý Định Lượng sẽ giúp bạn khắc phục tình trạng biến bị loại quá nhiều ở hồi quy, hệ số R2 hiệu chỉnh dưới 50%, bị đa cộng tuyến, tự tương quan...