logo

공분산 행렬

공분산 행렬은 임의 벡터의 두 항목 간의 공분산 값을 설명하는 데 사용되는 행렬 유형입니다. 각 요소의 분산은 행렬의 주대각선을 따라 표시되고 공분산은 비대각선 요소 간에 표시되므로 분산-공분산 행렬이라고도 합니다. 공분산 행렬은 일반적으로 정사각 행렬입니다. 또한 양의 준확정형이고 대칭형입니다. 이 매트릭스는 확률론적 모델링 및 주성분 분석에 유용합니다.

공분산 행렬이란 무엇입니까?

그만큼 변화 -공분산 행렬은 정사각 행렬 분산을 나타내는 대각선 요소와 공분산을 나타내는 비대각선 구성 요소가 있습니다. 변수의 공분산은 양수, 음수 또는 0과 같은 실수 값을 취할 수 있습니다. 양의 공분산은 두 변수가 양의 관계를 가지고 있음을 나타내고, 음의 공분산은 그렇지 않음을 나타냅니다. 두 요소가 함께 변하지 않으면 공분산이 0입니다.



더 알아보기, 대각선 행렬

공분산 행렬 예

2개의 데이터 세트 X = [10, 5]와 Y = [3, 9]가 있다고 가정해 보겠습니다. 집합 X의 분산은 12.5이고 집합 Y의 분산은 18입니다. 두 변수 간의 공분산은 -15입니다. 공분산 행렬은 다음과 같습니다.

egin{bmatrix} Variance~of~Set~X & Coorelation~of~Both~Sets Coorelation~of~Both~Sets& Variance~of~Set~Y end{bmatrix}=egin{bmatrix} 12.5 & -15 -15& 18 end{bmatrix}

공분산 행렬 공식

공분산 행렬의 일반적인 형태는 다음과 같습니다.

공분산 행렬

어디,

  • 표본 분산: 여기서 (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}
  • 샘플 공분산: (엑스1, 그리고1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • 인구 차이: 여기서 (xN) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • 인구 공분산: (엑스N, 그리고N) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

여기, 인구 평균

3분기

overline x 표본의 평균입니다

N 관찰 횟수

엑스 데이터 세트 x의 관찰입니다.

2 ⨯ 2와 3 ⨯ 3의 공분산 행렬 형식을 살펴보겠습니다.

2 2 공분산 행렬

우리는 2 ⨯ 2라는 것을 알고 있습니다. 행렬 두 개의 행과 두 개의 열이 있습니다. 따라서 2 ⨯ 2 공분산 행렬은 다음과 같이 표현될 수 있습니다.egin{bmatrix}mathrm{var(x)}& mathrm{cov(x,y)} \mathrm{cov(x,y)} &mathrm{var(y)}end{bmatrix}

3 공분산 행렬

3⨯3 매트릭스에는 3개의 행과 3개의 열이 있습니다. 공분산 행렬에서 대각선 요소는 분산이고 비대각선 요소는 공분산이라는 것을 알고 있습니다. 따라서 3⨯3 공분산 행렬은 다음과 같이 주어질 수 있습니다.egin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

공분산 행렬을 찾는 방법은 무엇입니까?

공분산 행렬의 차원은 주어진 데이터 세트의 변수 수에 따라 결정됩니다. 세트에 변수가 두 개만 있는 경우 공분산 행렬에는 두 개의 행과 두 개의 열이 있습니다. 마찬가지로, 데이터 세트에 세 개의 변수가 있는 경우 공분산 행렬에는 세 개의 행과 세 개의 열이 있습니다.

데이터는 심리학 및 역사 분야에서 Anna, Caroline, Laura가 득점한 점수와 관련이 있습니다. 공분산 행렬을 만듭니다.

학생 심리학(X) 연혁(Y)
안나 80 70
여자 이름 63 이십
로라 100 오십

다음 단계를 따라야 합니다.

1 단계: 변수 X의 평균을 구합니다. 변수 X의 모든 관측값을 합산하고 얻은 합계를 용어 수로 나눕니다. 따라서 (80 + 63 + 100)/3 = 81입니다.

2 단계: 모든 관측치에서 평균을 뺍니다. (80 – 81), (63 – 81), (100 – 81).

3단계: 위에서 구한 차이의 제곱을 구한 후 합산하세요. 따라서 (80 – 81)2+ (63 – 81)2+ (100 – 81)2.

4단계: 3단계에서 얻은 값을 총 관측치 수보다 작은 1로 나누어 X의 분산을 구합니다. var(X) = [(80 – 81)2+ (63 – 81)2+ (100 – 81)2] / (3 – 1) = 343.

5단계: 마찬가지로 1~4단계를 반복하여 Y의 분산을 계산합니다. Var(Y) = 633.

10의 6승

6단계: 변수 쌍을 선택합니다.

7단계: 모든 관측치에서 첫 번째 변수(X)의 평균을 뺍니다. (80 – 81), (63 – 81), (100 – 81).

8단계: 변수 Y에 대해 동일한 작업을 반복합니다. (70 – 47), (20 – 47), (50 – 47).

9단계: 해당 항을 곱합니다: (80 – 81)(70 – 47), (63 – 81)(20 – 47), (100 – 81)(50 – 47).

10단계: 이들 값을 더하고 (n – 1)로 나누어 공분산을 구합니다. Cov(X, Y) = (80 – 81)(70 – 47) + (63 – 81)(20 – 47) + (100 – 81)(50 – 47)/3-1 = 481.

11단계: 공분산 행렬의 일반 공식을 사용하여 항을 정렬합니다. 행렬은 다음과 같습니다.egin{bmatrix} 343 & 481 481& 633 end{bmatrix}

공분산 행렬의 속성

공분산 행렬의 속성은 다음과 같습니다.

  • 공분산 행렬은 항상 정사각형입니다. 즉, 공분산 행렬의 행 수는 항상 열 수와 같습니다.
  • 공분산 행렬은 항상 대칭입니다. 바꾸어 놓다 공분산 행렬은 항상 원래 행렬과 같습니다.
  • 공분산 행렬은 항상 양수이고 준정부호입니다.
  • 그만큼 고유값 공분산 행렬의 행렬은 항상 실수이고 음수가 아닙니다.

더 읽어보기,

  • 행렬 유형
  • 행렬 곱셈
  • 분산 및 표준편차

공분산 행렬에 대한 해결된 예

예 1: 물리학과 생물학에서 3명의 학생이 받은 점수는 다음과 같습니다.

학생물리학(X)생물학(Y)
92 80
60 30
100 70

위 데이터로부터 공분산 행렬을 계산합니다.

해결책:

표본 공분산 행렬은 다음과 같이 주어진다.frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

여기서, μ엑스= 84, n = 3

부락 오즈시비트

변수(x) = [(92 – 84)2+ (60 – 84)2+ (100 – 84)2] / (3 – 1) = 448

그래서, μ그리고= 60, n = 3

변수(y) = [(80 – 60)2+ (30 – 60)2+ (70 – 60)2] / (3 – 1) = 700

이제, cov(x, y) = cov(y, x) = [(92 – 84)(80 – 60) + (60 – 84)(30 – 60) + (100 – 84)(70 – 60)] / (3 – 1) = 520.

모집단 공분산 행렬은 다음과 같이 지정됩니다.egin{bmatrix} 448 & 520 520& 700 end{bmatrix}

예 2. 다음 표에서 모집단 공분산 행렬을 준비합니다.

나이인원수
29 68
26 60
30 58
35 40

해결책:

인구 분산은 다음과 같이 주어진다.frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n} .

여기서, μ엑스= 56.5, n = 4

var(x) = [(68 – 56.5)2+ (60 – 56.5)2+ (58 – 56.5)2+ (40 – 56.5)2] / 4 = 104.75

그래서, μ그리고= 30, n = 4

마이크리켓라이브

변수(y) = [(29 – 30)2+ (26 – 30)2+ (30 – 30)2+ (35 – 30)2] / 4 = 10.5

이제, cov(x, y) =frac{sum_{1}^{4}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{4}

cov(x, y) = -27

모집단 공분산 행렬은 다음과 같이 지정됩니다. egin{bmatrix} 104.7 &-27 -27& 10.5 end{bmatrix}

예 3. 다음 공분산 행렬을 해석합니다.

egin{bmatrix} & X & Y & Z X & 60 & 32 & -4 Y & 32 & 30 & 0 Z & -4 & 0 & 80 end{bmatrix}

해결책:

  1. 대각선 요소 60, 30 및 80은 각각 데이터 세트 X, Y 및 Z의 분산을 나타냅니다. Y는 가장 낮은 분산을 표시하고 Z는 가장 높은 분산을 표시합니다.
  2. X와 Y의 공분산은 32입니다. 이는 양수이므로 X가 증가(또는 감소)하면 Y도 증가(또는 감소)한다는 의미입니다.
  3. X와 Z의 공분산은 -4입니다. 음수이므로 X가 증가하면 Z는 감소하고 그 반대의 경우도 마찬가지입니다.
  4. Y와 Z의 공분산은 0입니다. 이는 두 데이터 세트 간에 예측 가능한 관계가 없음을 의미합니다.

예 4. 다음 데이터에 대한 표본 공분산 행렬을 찾습니다.

엑스그리고와 함께
75 10.5 넷 다섯
65 12.8 65
22 7.3 74
열 다섯 2.1 76
18 9.2 56

해결책:

표본 공분산 행렬은 다음과 같이 주어진다.frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

n = 5, m엑스= 22.4, var(X) = 321.2 / (5 – 1) = 80.3

그리고= 12.58, var(Y) = 132.148 / 4 = 33.037

와 함께= 64, var(Z) = 570 / 4 = 142.5

cov(X, Y) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( y_{i}-12.58 ight ) }{5-1} = -11.76

cov(X, Z) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( z_{i}-64 ight ) }{5-1} = 34.97

cov(Y, Z) = frac{sum_{1}^{5}left ( y_{i} -12.58 ight )left ( z_{i}-64 ight ) }{5-1} = -40.87

자바 문자열을 json으로

공분산 행렬은 다음과 같이 지정됩니다.

egin{bmatrix} 80.3 & -13.865 &14.25 -13.865 & 33.037 & -39.5250 14.25 & -39.5250 & 142.5 end{bmatrix}

공분산 행렬에 대한 FAQ

1. 공분산 행렬 정의

공분산 행렬은 임의 벡터의 두 항목 간의 공분산 값을 설명하는 데 사용되는 행렬 유형입니다.

2. 공분산 행렬의 공식은 무엇입니까?

공분산 행렬의 공식은 다음과 같습니다.

left[egin{array}{ccc} operatorname{Var}left(x_1 ight) & ldots ldots & operatorname{Cov}left(x_n, x_1 ight) vdots & ldots & vdots vdots & ldots & vdots operatorname{Cov}left(x_n, x_1 ight) & ldots ldots & operatorname{Var}left(x_n ight) end{array} ight]

어디, 표본 분산: 여기서 (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}

  • 샘플 공분산: (엑스1, 그리고1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • 인구 차이: 여기서 (xN) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • 인구 공분산: (엑스N, 그리고N) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

3. 3 ⨯ 3 공분산 행렬의 일반적인 형태는 무엇입니까?

3 ⨯ 3 공분산 행렬의 일반적인 형태는 다음과 같습니다:

egin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

4. 공분산 행렬의 속성은 무엇입니까?

공분산 행렬은 정사각 행렬이며 본질적으로 대칭이기도 합니다. 즉, 원래 행렬의 전치로 인해 원래 행렬 자체가 제공됩니다.

5. 공분산행렬(Covariance Matrix)을 사용할 수 있는 분야는 무엇입니까?

공분산 행렬은 수학, 기계 학습, 금융 및 경제 분야에서 사용됩니다. 공분산 행렬은 수학적 모델을 생성하는 데 사용되는 몬테카를로 시뮬레이션을 수행하기 위해 콜스키 분해에서 사용됩니다.