Cách tính hệ số tương quan bằng máy tính

Tham khảo bài viết: Hồi quy tuyến tính để học hỏi cách tính hiệp phương sai và độ lệch chuẩn.

Xem thêm: Hiệp phương sai [covariance] là gì? | Độ lệch chuẩn là gì?

2. Hệ số tương quan pearson là gì?

Hệ số tương quan có một người anh em cũng cha khác mẹ là hệ số tương quan Pearson:

  • Hệ số tương quan Pearson [Tiếng Anh là Pearson product-moment Correlation Coefficient, được ký hiệu là r hay R, or Pearson’s r], cũng tương tự như hệ số tương quan chung thì tương quan Pearson cũng là hệ số dùng để đo lường mối quan hệ thống kê tương quan giữa hai biến số với nhau.

Ví dụ về mối quan hệ giữa 2 biến số x và y là thu nhập và thời gian làm việc; hay mối quan hệ giữa giá vàng với giá dầu trên thế giới, giữa 2 cổ phiếu, 2 mã chứng khoán … có rất nhiều mối quan hệ mà bạn cần phải kiểm định và cần dùng tới hệ số này để tìm ra kết quả.

  • Phương pháp sử dụng hệ số tương quan pearson được biết đến như là một phương pháp tốt nhất để đo lường mối quan hệ giữa các biến mà bạn quan tầm vì nó dựa trên công thức từ hiệp phương sai của biến. Hệ số tương quan pearson thể hiện cho ta biết về tầm quan trọng của mối liên hệ, tương quan và chiều hướng tác động nhân quả của biến.

Funfact: Đặc biệt, hệ số tương quan pearson còn giúp các bạn nhận biết sớm được hiện tượng đa cộng tuyến bằng dấu hiệu TQ của các biến độc lập với nhau.

Xem thêm: Hệ số tương quan spearman là gì?

3. Các tiêu chí trong hệ số tương quan Pearson

Hệ số tương quan Pearson [r] dao dộng giá trị từ -1 đến 1

[Để chính xác bạn cần tính ra p-value [sig] của r để xác định mqh]

Xem thêm: Cách tính p-value bằng tay

Khi r âm hoặc r dương Hệ số tương quan r có giá trị âm hoặc dương thì ta nói hai biến đấy có mối quan hệ nghịch biến [tương quan âm] hoặc mối quan hệ đồng biến [tương quan dương].
Khi r = 0 Tức không có mối quan hệ nào giữa 2 biến hoặc 2 biến có mối quan hệ phi tuyến với nhau
Khi r = 1 Tức thể hiện việc tương quan dương tuyệt đối giữa 2 biến.
Khi r = -1 Tức thể hiện việc tương quan âm tuyệt đối giữa hai biến
Khi r -> 0 Tức r gần tiến về 0 thì tương quan tuyến tính giữa 2 biến càng yếu

CỰC CHÚ Ý: Việc theo dõi từ Hệ số tương quan Pearson [r] chỉ cho bạn phỏng đoán trước giữa hai biến có mối quan hệ với nhau hay không và mối quan hệ đó là âm hay dương. Ngoài ra, để xác định chính xác chúng có mối tương quan với nhau hay không thì bạn cần phải tính ra p-value [sig] nếu nhỏ hơn mức ý nghĩa [significance level] 5% thì có tương quan và ngược lại thì không có tương quan giữa 2 biến so sánh.

Bonus thần chú: Giá trị r cao cận +1,00 thể hiện mối quan hệ trực tiếp mạnh mẽ, các giá trị r gần 0,50 được coi là vừa phải và các giá trị dưới r 0,30 được coi là cho thấy mối quan hệ yếu.

4. Phân tích hệ số tương quan pearson trong phần mềm Excel và Stata

4.1. Excel

Hàm CORREL trả về HSTQ của hai phạm vi ô. Dùng HSTQ để xác định mối quan hệ giữa hai thuộc tính.

Ví dụ, có thể kiểm tra mối quan hệ hay liên kết giữa 2 sự vật, sự việc nào đó.

Cú pháp:

CORREL[array1, array2]

Trong đó:

  • array1: dữ liệu nhập vào bắt buộc một phạm vi giá trị ô.
  • array2: dữ liệu nhập vào bắt buộc phạm vi thứ hai chứa các giá trị ô.

Ví dụ về HSTQ của hai tập dữ liệu trong các cột A và B.

Công thức tính hệ số tương quan

Ngoài ra bạn có thể tính HSTQ đơn giản bằng máy tính nữa nhé!

4.2. Stata

Trước khi thực hiện tải về bộ dữ liệu để thực hành lun nhé!

STATA 14 DOWNLOADTải ngay

Từ Menu các bạn chọn theo như sau: Statistics -> Summaries, tables, and tests -> Summary and descriptive statistics -> Pairwise correlations

Hệ số tương quan trong Stata

Sau đó sẽ hiện ra bảng dưới:

Hệ số tương quan trong Stata

Đưa vào ô Variales biến phụ thuộc và các biến độc lập, sau đó tích vào ô Don’t adjust significance và nhấn OK, kết quả phân tích tương quan như sau:

Xem thêm: Phân tích tương quan bằng sig. trong spss

Hình 3.1. Ma trận hệ số tương quan pearson trong Stata

Thực hiện tương tự bằng lệnh sau: pwcorr roa size cpi rgdp state, sig để hiện ra sig cho HSTQ.

Nếu không muốn có sig bạn đơn giản chỉ cần thực hiện theo lệnh: corr roa size cpi rgdp state

Xem thêm: Cách kiểm định hàm tự tương quan [autocorrelation] trong Stata

4.3. Đọc ý nghĩa hệ số tương quan pearson trong STATA

Từ Hình 3.1 Ma trận tương quan pearson phía trên có thể thấy phân tích như sau:

  • Hình vuông đen ở trên trong đó chỉ số bên trên là 0.4074 chính là HSTQ của biến cpibiến roa tức biến độc lập với biến phụ thuộc roa. Chỉ số ở dưới là 0.0000 thể hiện giá trị sig = 0.0000 < 0.05 [mức ý nghĩa – significance level 5%] nên ta kết luận giữa 2 biến cpiroa có mối tương quan với nhau và là tương quan dương.
  • Tương tự, hình vuông đen ở dưới trong đó chỉ số bên trên là 0.1735 là hệ số tương quan thể hiển biến độc lập rgdp có tương quan dương với biến độc lập size, giá trị sig = 0.0233 < 0.05 nên ta kết luận giữa 2 biến rgdpsize có mối tương quan với nhau.

Khi 2 biến độc lập có mối quan hệ với nhau điều này sẽ làm xuất hiện hiện tượng đa cộng tuyến trong mô hình và điều này là điều mà bạn không muốn nó xảy ra.

Lưu ý: Nếu các bạn muốn chỉ dựa vào HSTQ để đánh giá mối quan hệ thì nên dùng mốc r = 0.2 [hoặc -0.2] để xem xét [Ví dụ: khi r>0.2 or -0.2 thì có tương quan còn ngược lại càng tiến về 0 thì không có tương quan giữa 2 biến. Tuy nhiên cách này chỉ để giúp bạn đưa ra phỏng đoán nhanh và chỉ mang tính chính xác tương đối.

5. Ứng dụng của hệ số tương quan trong tài chính

Người ta thường xem xét tới độ mạnh yếu của mối quan hệ tương quan như sau:

  • Dù giá trị 0,2 cho kết quả tương quan đồng biến giữa 2 biến nhưng mối tương quan này yếu và thật sự không đáng kể
  • Tương quan mạnh thì r phải đạt ý nghĩa ít nhất với giá trị r là 0,8 trở lên.

Một số ứng dụng hệ số tương quan trong tài chính:

  • HSTQ xác định mối tương quan giữa giá cổ phiếu của một công ty sản xuất dầu với giá dầu thô vì đa phần các công ty dầu mỏ nhờ vào giá dầu tăng lên thì họ mới kiếm được lợi nhuận làm giá cổ phiểu tăng và mối quan hệ này là tương quan dương.
  • Các chỉ số tài chính như tỷ lệ đòn bẩy và lợi nhuận khi chúng có mối tương quan cùng chiều với nhau thì doanh nghiệp có thể tận dụng để phát triển kinh doanh vì khi doanh nghiệp sử dụng nhiều đòn bẩy mà làm cho lợi nhuận tăng thì họ nên cân nhắc gia tăng thêm việc vay vốn chẳng hạn để đầu tư kinh doanh.
  • Khi làm thống kê về mối tương quan nhà đầu tư có thể xác định khi nào mối tương quan giữa hai biến thay đổi để chủ động thực hiện theo kế hoạch của mình. Ví dụ: Lãi suất cho vay tính theo lãi suất thị trường và cổ phiếu của ngân hàng thường có mối quan hệ tích cực với nhau khi lãi suất cho vay tăng lên, thế nên nhà đầu tư có thể tận dụng điều này.

Nói sâu hơn về ví dụ 2 trong các ứng dụng tài chính: Khi nhà đầu tư cảm thấy giá cổ phiếu ngân hàng đang giảm trong khi lãi suất vay vẫn tăng thì có thể đặt ra nghi vấn về ngân hàng mình đang đầu tư liệu họ đang hoạt động không hiệu quả hay không. Điều này có thể chứng minh thong qua việc xem xét giá cổ phiếu của các ngân hàng tương tự cùng trong ngành để đưa ra kết luận có nên đầu tư tiếp hay không ở ngân hàng đấy.

6. Tổng kết

Nhìn chung MOSL đã cung cấp đến các bạn các phần sau:

  • Hệ số tương quan là gì? – Khái niệm, Ý nghĩa và cách tính
  • Các loại Hệ số tương quan
  • Giải thích Hệ số tương quan pearson là gì?
  • Các tiêu chí trong Hệ số tương quan pearson
  • Phân tích và đọc kết quả tương quan trong Stata và Excel
  • Ứng dụng của Hệ số tương quan

Đến đây, MOSL xin chúc các bạn tự do học tập và làm việc hiệu quả!

Xem thêm: Dịch vụ xử lý số liệu và hỗ trợ chạy Stata của Mosl.vn

Tag: phan tich tuong quan spss | đối tượng biểu mẫu trong hệ quản trị cơ sở dữ liệu access có thể dùng để làm gì | he so tuong quan pearson la gi | danh mục đầu tư | hstq trong kinh tế lượng | hstq bội | cach tinh he so tuong quan | hstq hạng spearman | yý nghĩa của hstq | hstq biến tổng lớn hơn 0.3 | cong thuc tinh he so tuong quan | bao nhiêu là đa cộng tuyến | tỷ suất sinh lời | ước lượng | số quan hệ tương đương | xác suất thống kê | cơ sở dữ liệu quan hệ đối tượng | thứ bậc | từng phần | bài tập có lời giải | không gian | excel 2007 | Sự suy giảm tq

Video liên quan

Chủ Đề