Giới thiệu

Covariance (Hiệp phương sai) với Correlation (Hệ số tương quan) là nhì khái niệm trong lĩnh vực xác suất những thống kê. Cả hai có mang này các nói đến quan hệ thân nhị biến với nhau, tốt nói theo cách khác nhị chỉ số này dùng để diễn đạt sự phụ thuộc thân nhì vươn lên là.

Bạn đang xem: Hiệp phương sai là gì

Covariance là gì?

Covariance diễn tả quan hệ giữa nhị biến cùng nhau, rất có thể là đồng đổi mới (positive covariance) hoặc nghịch thay đổi (negative sầu covariance).

Định nghĩa : Cho 2 biến đổi tình cờ X, Y cùng với kì vọng mu_X và mu_Y covariance của X, Y được xem bởi công thức :

Cov(X,Y) = E((X - mu_X )(Y - mu_Y))

Các đặc thù của Covariance :

Cov(aX + b, cY + d) = acCov(X,Y) với a, b, c, d mang lại trướcCov(X_1 + X_2, Y) = Cov(X_1, Y) + Cov(X_2, Y)Cov(X, X) = Var(X)Cov(X, Y) = E(XY) - mu_Xmu_YVar(X, Y) = Var(X) + Var(Y) + 2Cov(X, Y)Nếu X, Y tự do thì Cov(X, Y) = 0.

Xem thêm: Chữ Cái Sau Aebfc Là Gì ? Brain Out Chữ Cái Sau Aebfc Là Gì

Lưu ý :

Từ 3 cùng 4 ta có Var(X) = E(X^2) - mu^2_x. Nếu X, Y độc lập từ 5 rất có thể suy ra được Var(X, Y) = Var(X) + Var(Y).Với 6, điều ngược trở lại không đúng, nghĩa là Cov(X, Y) = 0 không Có nghĩa là X, Y độc lập với nhau. lấy ví dụ X = <-2 , -1 , 1 , 2> với Y = X^2 = <4 , 1, 1 , 4> lúc ấy Cov(X, Y) = 0

Correlation là gì?

Để miêu tả mối quan hệ giữa 2 trở thành là “mạnh” hay “yếu”, bọn họ áp dụng correlation thay mang đến covariance.

Xem thêm: ( Switching Cost Là Gì ? Có Những Loại Chi Phí Chuyển Đổi Nào?

Định nghĩa : Correlation coefficient của nhì biến X cùng Y được tính theo công thức

Cor(X, Y) = ho = fracCov(X, Y)sigma_Xsigma_Y

Các đặc thù của Corelation :

Correlation là Covariance được chuẩn hóa của nhì đổi thay X, YCorrelation miêu tả một tỉ lệ thành phần, cho nên vì thế nó không tồn tại đơn vị đo-1 leq ho leq 1 ho = -1 Khi còn chỉ lúc Y = aX + b với a cùng ho = 1 Khi và chỉ còn Khi Y = aX + b cùng a > 0

Chứng minc đặc điểm 3 :

0 leq Var(fracXsigma_X - fracYsigma_Y) = Var(fracXsigma_X) + Var(fracYsigma_Y) - 2Cov(fracXsigma_X, fracYsigma_Y) = 2 - 2 ho Rightarrow ho leq 1.

Tương tự 0 leq Var(fracXsigma_X + fracYsigma_Y) Rightarrow ho geqslant -1

Biểu diễn mối quan hệ X, và Y với giá trị rho (correlation)


*

So sánh thân covariance và correlation

Cả covariance cùng correlation các thể hiện quan hệ giữa nhị trở nên.Covariance bao gồm range từ -infty đến +infty . Correlation nằm trong sấp xỉ từ - 1 đến 1.Covariance thể hiện mối quan liêu hệ giữa hai biến, correlation thể hiện được mối quan liêu hệ giữa nhì hoặc nhiều biến.

Ví dụ

Tập dữ liệu view của 2 kênh truyền hình tại 1 thời điểm (20h - 21h thứ năm mỗi tuần) trong một tháng là

X = (50772, 73756, 74251, 77601)Y = (102492, 100406, 97762, 98191)

Ta thực hiện tính những thông số cơ bản

Mean_X = (50772 + 73756 + 74251 + 77601)/ 4 = 69095.00Mean Y = 99712.75std_X^2 = ((50772 - Mean_X)^2 +(73756 - Mean_X)^2 +… ) / 4 = 114098405.5 => std_X = 10681.69std_Y = 1892.48

Từ kia ta tính covariance với correlation

Cov(X, Y) = ((50772 - 69095.00) * (102492 - 99712.75) + (73756 - 69095.00) * (100406 - 99712.75) + …) / 4 = -17673758.0Corr (X,Y ) = Cov(X, Y) / (std_X * std_Y) = -17673758.0 / ( 10681.69 * 1892.48) = -0.87