So sánh cặp stata có ý nghĩa gì

Hôm nay nhóm MBA bàn về hệ số tương quan r trong Stata và cách thực hiện phân tích tương quan cho từng cặp biến trong Stata.

-Hệ số tương quan (r) là một chỉ số thống kê đo lường mối liên hệ tương quan giữa hai biến số, như giữa MỨC ĐỘ HÀI LÒNG (y) và TIỀN LƯƠNG (x). Hệ số tương quan có giá trị từ -1 đến 1. Hệ số tương quan bằng 0 (hay gần 0) có nghĩa là hai biến số không có liên hệ gì với nhau; ngược lại nếu hệ số bằng -1 hay 1 có nghĩa là hai biến số có một mối liên hệ tuyệt đối. Nếu giá trị của hệ số tương quan là âm (r <0) có nghĩa là khi x tăng cao thì y giảm (và ngược lại, khi x giảm thì y tăng); nếu giá trị hệ số tương quan là dương (r > 0) có nghĩa là khi x tăng cao thì y cũng tăng, và khi x tăng cao thì y cũng giảm theo. -Có nhiều hệ số tương quan , hệ số tương quan thông dụng nhất: hệ số tương quan Pearson r, được định nghĩa như sau

Cho hai biến số x và y từ n mẫu, hệ số tương quan Pearson được ước tính bằng công thức sau đây:

Trong phân tích áp dụng cho luận văn, kiểm định hệ số tương quan Pearson dùng để kiểm tra mối liên hệ tuyến tính giữa các biến độc lập và biến phụ thuộc. Nếu các biến độc lập với nhau có tương quan chặt thì phải lưu ý đến vấn đề đa cộng tuyến khi phân tích hồi quy (giả thuyết H0: hệ số tương quan bằng 0). Cụ thể cách chạy như sau:

Thực hành tính hệ số tương quan trong Stata

Vào menu Statistics > Summaries, tables, and tests > Summary and descriptive statistics > Pairwise correlations

Bảng sau hiện ra:

Chọn các độc lập và phụ thuộc đưa vào ô Variales, đồng thời check vào ô Print Significance level for each entry, sau đó nhấn OK, kết quả phân tích tương quan như sau:

pwcorr TINCAY DAPUNG DAMBAO CAMTHONG HUUHINH MINHBACH HAILONG, sig

Giải thích ý nghĩa: ví dụ ta xem xét ô màu đỏ và màu xanh. Đó là giá trị tương quan giữa biến HAILONG và biến TINCAY.

– Ô màu đỏ giá trị là 0.5639 , đó là hệ số tương quan Pearson giữa biến HAILONG và TINCAY.

-Ô màu xanh: là mức ý nghĩa tương quan significant của kiểm định Pearson. Giả thuyết H0: hệ số tương quan bằng 0. Do đó nếu Sig. này bé hơn 5% ta có thể kết luận được là hai biến có tương quan với nhau. Hệ số tương quan càng lớn tương quan càng chặt. nếu Sig. này lớn hơn 5% thì hai biến không có tương quan với nhau.

-Vì một trong những điều kiện cần để phân tích hồi quy là biến độc lập phải có tương quan với biến phụ thuộc, nên nếu ở bước phân tích tương quan này biến độc lập không có tương quan với biến phụ thuộc thì ta loại biến độc lập này ra khỏi phân tích hồi quy.

-Kết quả phân tích tương quan Pearson cho thấy một số biến độc lập có sự tương quan với nhau(sig<5%). Do đó khi phân tích hồi quy cần phải chú ý đến vấn đề đa cộng tuyến. Các biến độc lập có tương quan với biến phụ thuộc và do đó sẽ được đưa vào mô hình để giải thích cho biến phụ thuộc.

Bài viết trình bài cách thực hành và sơ đồ tóm tắt đọc kết quả khi kiểm định phân tích phương sai Anova

Trong nhiều trường hợp chúng cần so sánh giá trị trung bình về một chỉ tiêu nghiên cứu nào đó giữa 2 hay nhiều đối tượng. Chúng ta có 2 biến tham gia trong một phép kiểm định trung bình: 1 biến định lượng để tính trung bình và 1 biến định tính có nhiều nhóm giá trị để so sánh. Thông thường chúng ta thường phân tích biến độc lập với các biến nhân khẩu học để tìm sự khác biệt giữa các nhóm có đặc điểm phân nhóm khác nhau. Ví dụ so sánh độ tuổi, trình độ học vấn, thu nhập,...với biến phụ thuộc Y.

Đối với các bài luận nghiên cứu, chúng ta thường sử dụng phép kiểm định giá trị trung bình để xem có sự khác nhau về động lực làm việc giữa 2 nhóm nhân viên nam và nữ hay không; kiểm định xem có hay không sự khác biệt về quyết định mua hàng của các khách hàng có độ tuổi khác nhau; kiểm tra xem có sự khác biệt sự hài lòng của các khách hàng có thời gian sử dụng dịch vụ khác nhau tại một ngân hàng hay không…

  • Independent Sample T-Test chúng ta sẽ áp dụng kiểm định sự khác biệt trung bình với trường hợp biến định tính có 2 giá trị. Ví dụ như biến giới tính (nam, nữ), biến thành phố (TPHCM, Hà Nội), biến vùng miền (Miền Bắc, Miền Nam)… Trường hợp biến định tính có 3 giá trị, chúng ta sẽ thực hiện 3 cặp so sánh (1-2, 1-3, 2-3). Tuy nhiên, việc so sánh từng cặp giá trị như vậy khá bất tiện và mất thời gian nếu số giá trị tăng lên 4, 5, 6… Các bạn xem bài viết hướng dẫn kiểm định Independent Sample T-Test.
  • ANOVA giúp chúng ta giải quyết trở ngại của Independent Sample T-Test. Phương pháp này giúp chúng ta so sánh trị trung bình của 2 nhóm trở lên. ANOVA có 3 phương pháp: ANOVA 1 chiều, ANOVA 2 chiều và MANOVA. Tuy nhiên, trong phạm vi tài liệu này chúng ta chỉ nói tới phương pháp ANOVA 1 chiều (One-Way ANOVA). ANOVA có thể thực hiện chức năng của Independent Sample T-Test, do vậy, để không phải sử dụng quá nhiều lý thuyết và phương pháp, các bạn chỉ nên sử dụng ANOVA cho toàn bộ các trường hợp biến định tính. Kết quả của ANOVA trường hợp biến định tính 2 giá trị cho ra kết quả hoàn toàn giống với Independent Test.

KIỂM ĐỊNH SỰ KHÁC BIỆT TRUNG BÌNH BẰNG PHƯƠNG PHÁP ONE-WAY ANOVA

Ví dụ điển hình:

Trên hình ảnh, các bạn có thể thấy biến nhóm tuổi có 5 value, như vậy như câu nói ban đầu của mình, hơn 2 value thì sẽ dùng ANOVA. Để dễ dàng cho việc trình bày, mình sẽ sử dụng biến Tuoi (nhóm tuổi) là biến định tính và biến SHL (sự hài lòng) là biến định lượng.

Cách thực hiện phân tích ANOVA như sau. Vào Analyze > Compare Means > One-Way ANOVA...

Giao diện hiện ra như sau, các bạn đưa biến phụ thuộc vào mục Dependent List, đưa biến định tính vào mục Factor.

Tiếp đến, sử dụng tùy chọn Options. Tích vào 3 mục như hình ảnh phía dưới. Sau đó chọn Continue.

Quay lại giao diện ban đầu, chọn OK để xuất kết quả ra Output:

Bảng bạn quan tâm đầu tiên đó là Test of Homogeneity of Variances, chúng ta sẽ xem xét sig của Levene Statistic.

1/ Trường hợp sig lớn hơn hoặc bằng 0.05

Nếu sig ở kiểm định này > 0.05 thì phương sai giữa các lựa chọn của biến định tính ở trên không khác nhau, xem tiếp kết quả ở bảng ANOVA.

Nếu sig ở bảng ANOVA < 0.05, chúng ta kết luận: Có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên thuộc các nhóm tuổi khác nhau.

Nếu sig ở bảng ANOVA >= 0.05, chúng ta kết luận: Không có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên thuộc các nhóm tuổi khác nhau.

2/ Trường hợp sig nhỏ hơn 0.05

Trường hợp sig Levene Statistic nhỏ hơn 0.05, giả thuyết phương sai đồng nhất giữa các nhóm giá trị biến định tính đã bị vi phạm. Nghĩa là phương sai giữa các nhóm bộ phận làm việc là không bằng nhau. Chúng ta không thể sử dụng bảng ANOVA mà sẽ đi vào kiểm định Welch cho trường hợp vi phạm giả định phương sai đồng nhất.

Để thực hiện kiểm định Welch, ta cần quay lại giao diện các tùy chọn One-way ANOVA. Tại mục Options, tích thêm vào mục Welch.

Kết quả xuất ra ở Output, chúng ta sẽ để ý đến bảng Robust Tests of Equality of Means.

- Nếu sig kiểm định Welch ở bảng Robust Tests < 0.05, chúng ta kết luận: Có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những nhân viên làm việc ở các bộ phận khác nhau.

- Nếu sig kiểm định Welch ở bảng Robust Tests ≥ 0.05, chúng ta kết luận: Không có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những nhân viên làm việc ở các bộ phận khác nhau.

Tóm lại quy trình phân tích One-way ANOVA (ANOVA một chiều sẽ thực hiện qua sơ đồ bên dưới:

Nếu bạn gặp khó khăn khi thực hiện phân tích One-way ANOVA bạn vui lòng liên hệ Hotline của Resdata để tư vấn hỗ trợ nha.

Chủ đề