통계, IT, AI

공분산과 누적분포함수 간의 관계 본문

통계

공분산과 누적분포함수 간의 관계

Harold_Finch 2017. 1. 5. 23:35

1. 들어가며 

얼마전에 모표준편차를 추정하기 위하여 표본의 범위와 표본의 표준편차 중 무엇을 사용하는 것이 더 나은지 포스팅한 적이 있다. 그것을 밝히기 위해서 여러가지 공식을 증명했었지만 내용과 관련이 없는 것은 적지 않았다. 그렇게 증명한 것 중에 버리기 아까운 것을 적는다. 


어떤 확률 변수 XY의 결합누적분포함수(Joint Cumulative Distribution Function; Joint CDF)를 FXY(x,y)라 하고 XY의 CDF를 각각 FX(x), FY(y)라고 하면 XY의 공분산(Covariance)과 CDF는 아래와 같은 관계를 갖는다.

Cov(X,Y)=R×RFXY(x,y)FX(x)FY(y)dxdy

2. 증명

2Cov(X,Y)=2(E(XY)E(X)E(Y))=E(X1Y1)E(X1)E(Y2)E(X2)E(Y1)+E(X2Y2)=E[(X1X2)(Y1Y2)]=E[R×R(I(uX1)I(uX2))(I(vY1)I(vY2))dudv]=E[R×RI(uX1)I(vY1)I(uX1)I(vY2)I(uX2)I(vY1)+I(uX2)I(vY2)dudv]=2R×RE[I(uX1)I(vY1)]E[I(uX1)]E[I(vY2)]dudv=2R×RP(uX,vY))P(uX)P(vY)dudv=2R×RFXY(x,y)FX(x)FY(y)dxdy

3. 마치며

직관적으로 와닿지 않는 관계라서 증명하는데 시간이 오래 걸렸다. 증명하고 나서도 "의미"를 꼬집어 말하기 어렵다.

'통계' 카테고리의 다른 글

[Bayes] 베이지안 문제(몬티홀 등)  (0) 2018.02.03
작성중  (0) 2017.03.01
주성분분석(Principal Component Analysis; PCA)에 관하여  (0) 2017.01.30
표본 분산의 분산  (5) 2017.01.16
표본 범위와 표본 표준편차 비교  (0) 2016.10.12
Comments