Meet Our Team
home

Independent and Uncorrelated

오태호 (Taeho Oh)
오태호 (Taeho Oh)
안녕하세요. 오태호입니다.
이번 글에서는 Independent와 Uncorrelated에 관해서 설명해 드리도록 하겠습니다. Independent와 Uncorrelated는 다른 개념인데 같다고 착각하는 사람도 많아서 어떤 차이가 있고 어떤 관계가 있는지 살펴보도록 하겠습니다.

Independent

Random Variable XX와 YY가 Independent하다는 것은 다음과 같이 정의합니다.
P(X,Y)=P(X)P(Y)P(X,Y)=P(X)P(Y)
XX와 YY의 joint pdf를 fXY(x,y)f_{XY}(x,y)라고 하고 XX와 YY의 각각의 pdf를 fY(y)f_Y(y)라고 한다면 XX와 YY가 Independent일 때 다음과 같은 성질을 가집니다.
fXY(x,y)=fX(x)fY(y)f_{XY}(x,y)=f_X(x)f_Y(y)

Uncorrelated

Random Variable XX와 YY가 Uncorrelated하다는 것은 다음과 같이 정의합니다.
E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)
Random Variable XX와 YY의 Covariance는 아래와 같이 정의합니다.
Cov(X,Y)=E((XE(X))(YE(Y)))=E(XYE(Y)XE(X)Y+E(X)E(Y))=E(XY)E(X)E(Y)\begin{aligned}Cov(X,Y)&=E((X-E(X))(Y-E(Y))) \\&=E(XY-E(Y)X-E(X)Y+E(X)E(Y)) \\&=E(XY)-E(X)E(Y)\end{aligned}
Random Variable XX와 YY가 Uncorrelated하면 Covariance는 아래와 같이 00이 됩니다.
Cov(X,Y)=E(XY)E(X)E(Y)=E(X)E(Y)E(X)E(Y)=0\begin{aligned}Cov(X,Y)&=E(XY)-E(X)E(Y) \\&=E(X)E(Y)-E(X)E(Y) \\&=0\end{aligned}

Independent and Uncorrelated

Random Variable XX와 YY가 Independent일 때, XX와 YY는 Uncorrelated하다는 것은 다음과 같이 증명합니다.
XX와 YY의 pdf를 각각 fX(x)f_X(x)fY(y)f_Y(y)라고 하면 E(X)E(X)E(Y)E(Y)E(XY)E(XY)는 다음과 같이 구할 수 있습니다.
E(X)=xfX(x)dxE(Y)=yfY(y)dyE(XY)=xyfXY(x,y)dxdy\begin{aligned} E(X)&=\int_{-\infty}^\infty xf_X(x)dx \\E(Y)&=\int_{-\infty}^\infty yf_Y(y)dy \\E(XY)&=\int_{-\infty}^\infty \int_{-\infty}^\infty xyf_{XY}(x,y)dxdy \\ \end{aligned}
XX와 YY가 Independent하면 fXY(x,y)=fX(x)fY(y)f_{XY}(x,y)=f_X(x)f_Y(y)이므로 아래와 같이 정리할 수 있습니다.
E(XY)=xyfXY(x,y)dxdy=xyfX(x)fY(y)dxdy=xfX(x)dxyfY(y)dy=E(X)E(Y)\begin{aligned}E(XY)&=\int_{-\infty}^\infty \int_{-\infty}^\infty xyf_{XY}(x,y)dxdy \\&=\int_{-\infty}^\infty \int_{-\infty}^\infty xyf_X(x)f_Y(y)dxdy \\&=\int_{-\infty}^\infty xf_X(x)dx\int_{-\infty}^\infty yf_Y(y)dy \\&=E(X)E(Y)\end{aligned}
즉, Random Variable XX와 YY가 Independent하면 XX와 YY는 Uncorrelated합니다.
하지만 Random Variable XX와 YY가 Uncorrelated할 때 XX와 YY가 Independent하다는 보장은 없습니다. (Independent할 수도 있고 하지 않을 수도 있습니다.) 다음과 같이 XX와 YY가 Uncorrelated면서 Indepepdent하지 않은 상황이 존재할 수 있습니다.
Random Variable AA와 BB가 A Bernoulli(12)A \sim ~ Bernoulli(\frac{1}{2})B Bernoulli(12)B \sim ~ Bernoulli(\frac{1}{2})와 같이 Bernoulli Distribution을 따르고 Independent하다고 할 때 XX와 YY를 다음과 같이 정의합니다.
X=A+BY=AB\begin{array}{c} X=A+B \\Y=\left | A-B \right | \end{array}
이때 XX와 YY의 분포는 아래와 같이 정리할 수 있습니다. 각각의 상황이 발생할 확률은 1414입니다.
A
B
X
Y
P
0
0
0
0
1/4
0
1
1
1
1/4
1
0
1
1
1/4
1
1
2
0
1/4
XX와 YY가 Uncorrelated하다는 것은 다음과 같이 확인할 수 있습니다.
E(X)=0×14+1×14+1×14+2×14=1E(Y)=0×14+1×14+1×14+0×14=12E(XY)=0×0×14+1×1×14+1×1×14+2×0×14=12E(XY)=E(X)E(Y)\begin{aligned} &E(X)=0\times\frac{1}{4}+1\times\frac{1}{4}+1\times\frac{1}{4}+2\times\frac{1}{4}=1 \\ &E(Y)=0\times\frac{1}{4}+1\times\frac{1}{4}+1\times\frac{1}{4}+0\times\frac{1}{4}=\frac{1}{2} \\ &E(XY)=0\times0\times\frac{1}{4}+1\times1\times\frac{1}{4}+1\times1\times\frac{1}{4}+2\times0\times\frac{1}{4}=\frac{1}{2} \\ &E(XY)=E(X)E(Y) \end{aligned}
XX와 YY가 Independent하지 않다는 것은 다음과 같이 확인할 수 있습니다.
P(X=0)=14P(Y=0)=12P(X=0,Y=0)=14P(X=0,Y=0)≠P(X=0)P(Y=0)
P(X=0)=14P(Y=0)=12P(X=0,Y=0)=14P(X=0,Y=0)P(X=0)P(Y=0)\begin{aligned} & P(X=0)=\frac{1}{4} \\ & P(Y=0)=\frac{1}{2} \\ & P(X=0,Y=0)=\frac{1}{4} \\ & P(X=0,Y=0) \neq P(X=0)P(Y=0) \end{aligned}
즉, XX와 YY가 Uncorrelated하지만 Independent하지 않은 경우가 존재합니다. 그래서 Random Variable XX와 YY가 Uncorrelated할 때 반드시 XX와 YY가 Independent하다고 말할 수 없습니다. (Independent할 수도 있고 하지 않을 수도 있습니다.)

Bivariate Normal Distribution

Random Variable XX와 YY가 Bivariate Normal Distribution을 따른다면 fX(x)f_X(x)fY(y)f_Y(y)fXY(x,y)f_{XY}(x,y)는 아래와 같습니다.
fX(x)=1σX2πexp((xμX)22σX2)fY(y)=1σY2πexp((yμY)22σY2)fXY(x,y)=12πσXσY1ρ2exp(12(1ρ2)((xμXσX)2+(yμYσY)22ρ(xμX)(yμY)σXσY))\begin{aligned} f_X(x)&=\frac{1}{\sigma_X\sqrt{2\pi}}\exp\left (-\frac{(x-\mu_X)^2}{2\sigma_X^2}\right ) \\f_Y(y)&=\frac{1}{\sigma_Y\sqrt{2\pi}}\exp\left (-\frac{(y-\mu_Y)^2}{2\sigma_Y^2}\right ) \\f_{XY}(x,y)&=\frac{1}{2\pi\sigma_X\sigma_Y\sqrt{1-\rho^2}}\exp\left (-\frac{1}{2(1-\rho^2)}( (\frac{x-\mu_X}{\sigma_X})^2 + (\frac{y-\mu_Y}{\sigma_Y})^2 - 2\rho\frac{(x-\mu_X)(y-\mu_Y)}{\sigma_X\sigma_Y})\right ) \end{aligned}
XX와 YY가 Uncorrelated하다면 ρ=Cov(X,Y)σXσY=0\rho=\frac{Cov(X,Y)}{\sigma_X\sigma_Y}=0이 되어서 아래와 같이 됩니다.
fXY(x,y)=12πσXσYexp(12((xμXσX)2+(yμYσY)2))=fX(x)fY(y)\begin{aligned}f_{XY}(x,y)&=\frac{1}{2\pi\sigma_X\sigma_Y}\exp\left (-\frac{1}{2}( (\frac{x-\mu_X}{\sigma_X})^2 + (\frac{y-\mu_Y}{\sigma_Y})^2)\right ) \\&=f_X(x)f_Y(y)\end{aligned}
즉, Random Variable XX와 YY가 Bivariate Normal Distribution을 따르고 XX와 YY가 Uncorrelated하다면 XX와 YY는 Independent합니다.

Normal Distribution

XN(0,1)X \sim N(0,1)이고 WW가 Rademacher Distribution을 따르고 Y=WXY=WX이라고 해 봅시다. 이 경우 YY도 YN(0,1)Y \sim N(0,1)이 되어 XX와 YY는 둘 다 Normal Distribution을 따르게 됩니다.
XX와 YY는 Uncorrelated하다는 것을 다음과 같이 증명할 수 있습니다.
E(X)=0E(Y)=0Cov(X,Y)=E(XY)E(X)E(Y)=E(XY)0=E(X2W)=E(X2)E(W)=E(X2)0=0\begin{aligned} E(X)=0 \\E(Y)=0 \\Cov(X,Y)&=E(XY)-E(X)E(Y) \\&=E(XY)-0 \\&=E(X^2W) \\&=E(X^2)E(W) \\&=E(X^2) \cdot 0 \\&=0\end{aligned}
XX와 YY가 Independent하지 않다는 것은 다음과 같이 확인할 수 있습니다.
P(X=12)=0P(Y=12)=0P(X=12,Y=12)=12P(X=12,Y=12)P(X=12)P(X=12)\begin{aligned} &P(X=\frac{1}{2})=0 \\&P(Y=\frac{1}{2})=0 \\&P(X=\frac{1}{2},Y=\frac{1}{2})=\frac{1}{2} \\&P(X=\frac{1}{2},Y=\frac{1}{2}) \neq P(X=\frac{1}{2})P(X=\frac{1}{2}) \end{aligned}
즉, Random Variable XX와 YY가 각각이 Normal Distribution을 따를 때 XX와 YY가 Uncorrelated하면서 XX와 YY가 Independent하지 않은 경우가 존재합니다. 그래서 Random Variable XX와 YY가 각각이 Normal Distribution을 따를 때 XX와 YY가 Uncorrelated하다고 해서 반드시 XX와 YY가 Independent하지는 않습니다. (Independent할 수도 있고 하지 않을 수도 있습니다.)

맺음말

Random Variable XX와 YY가 Independent하면 XX와 YY는 Uncorrelated합니다.
Random Variable XX와 YY가 Uncorrelated하다고 해서 반드시 XX와 YY가 Independent하지는 않습니다. (Independent할 수도 있고 하지 않을 수도 있습니다.)
XX와 YY가 Bivariate Normal Distribution을 따르고 XX와 YY가 Uncorrelated하면 XX와 YY는 Independent합니다.
XX와 YY가 각각 Normal Distribution을 따르고 XX와 YY가 Uncorrelated하다고 해서 반드시 XX와 YY가 Independent하지는 않습니다. (Independent할 수도 있고 하지 않을 수도 있습니다.)
작성자
관련된 글 더 보기