logo

변화

변화 데이터 세트의 평균 또는 평균값을 기준으로 데이터가 어떻게 퍼져 있는지 알아보는 데 사용되는 측정값입니다. 분포 데이터가 평균 또는 평균값에 대해 어떻게 퍼져 있는지 찾는 데 사용됩니다. 분산을 정의하는 데 사용되는 기호는 σ입니다.2. 표준편차의 제곱입니다.

통계에 사용되는 분산에는 두 가지 유형이 있습니다.



  • 표본 분산
  • 인구 차이

모집단 분산은 특정 모집단의 각 데이터 포인트가 어떻게 변동하거나 분산되는지 확인하는 데 사용되는 반면, 표본 분산은 평균에서 제곱된 편차의 평균을 찾는 데 사용됩니다.

이 기사에서는 다음에 대해 알아볼 것입니다. 분산(표본, 모집단), 해당 공식, 속성 및 기타 세부정보입니다.

내용의 테이블



분산이란 무엇입니까?

우리는 데이터의 다양한 값을 측정하고 이러한 값은 다양한 목적으로 사용됩니다. 데이터는 두 가지 유형의 그룹화된 데이터 또는 그룹화되지 않은(이산) 데이터로 제공될 수 있습니다. 데이터가 클래스 간격 형태로 제공되면 그룹화된 데이터라고 하며, 데이터가 단일 데이터 포인트 형태로 제공되면 이산 또는 그룹화되지 않은 데이터 포인트라고 합니다. 분산은 데이터의 평균값에 대한 데이터 분산의 척도입니다. 주어진 데이터 값에 데이터가 어떻게 분산되어 있는지 알려줍니다. 그룹화된 데이터와 그룹화되지 않은 데이터 모두에 대한 표본 분산과 모집단 분산을 쉽게 계산할 수 있습니다.

분산 정의

변화 데이터 포인트 세트의 확산 또는 분산을 정량화하는 통계적 척도입니다. 데이터 세트의 개별 데이터 포인트가 데이터 세트의 평균(평균)과 얼마나 다른지 나타냅니다.

분산의 유형

주어진 데이터의 분산을 두 가지 유형으로 정의할 수 있습니다.



  • 인구 차이
  • 표본 분산

이제 자세히 알아보겠습니다.

인구 차이

모집단 분산은 주어진 모집단의 확산을 찾는 데 사용됩니다. 인구는 사람들의 그룹으로 정의되며 해당 그룹의 모든 사람들은 인구의 일부입니다. 이는 한 그룹의 인구가 평균 인구에 대해 어떻게 변하는지를 알려줍니다.

그룹의 모든 구성원을 인구라고 합니다. 주어진 모집단의 각 데이터 포인트가 어떻게 변하거나 퍼져 있는지 확인하려면 모집단 분산을 사용합니다. 이는 모집단 평균에서 각 데이터 포인트의 거리 제곱을 제공하는 데 사용됩니다.

표본 분산

모집단 데이터가 매우 크면 데이터 세트의 모집단 분산을 계산하기가 어려워집니다. 이 경우, 주어진 데이터 세트에서 데이터 샘플을 가져와 샘플 분산이라고 하는 해당 데이터 세트의 분산을 찾습니다. 표본 평균을 계산하는 동안 표본 평균, 즉 모집단 평균이 아닌 표본 데이터 세트의 평균을 계산해야 합니다. 표본 분산은 표본 데이터 포인트와 표본 평균 간의 차이의 제곱의 평균으로 정의할 수 있습니다.

차이 기호

분산 기호는 일반적으로 모집단 분산을 나타낼 때 그리스 문자 시그마 제곱(σ²)으로 표시됩니다. 표본 분산의 경우 종종 s²로 표시됩니다.

분산 예

아래에 설명된 예를 통해 분산의 개념을 이해할 수 있습니다.

데이터 {4,6,8,10}의 모집단 분산을 찾습니다.

해결책:

평균 = (4+6+8+10)/4 = 7

4 (4-7)2 9
6 (6-7)2 1
8 (8-7)2 1
10 (10-7)2 9

분산 = (9+1+1+9)/4 = 20/4 = 5

따라서 데이터의 분산은 5입니다.

분산 공식

데이터 세트의 분산은 기호 σ로 표시됩니다.2. 모집단 데이터의 경우 해당 공식은 평균과 데이터 항목의 차이 제곱합을 항목 수로 나눈 값과 같습니다. 샘플 데이터의 경우 분자 값을 항목 수와 단위 수의 차이로 나눕니다.

표본 분산 공식

데이터 세트가 표본인 경우 분산 공식은 다음과 같습니다.

2 = ∑ (엑스 – x̄) 2 /(n – 1)

어디,

  • 엑스 샘플 데이터 세트의 평균입니다
  • N 총 관측치 수입니다.

인구분산 공식

인구 데이터 세트가 있는 경우 공식은 다음과 같이 작성됩니다.

2 = ∑ (엑스 – x̄) 2 /N

어디,

  • 엑스 인구 데이터 세트의 평균입니다
  • N 총 관측치 수입니다.

그룹화된 데이터 세트와 그룹화되지 않은 데이터 세트의 분산을 계산할 수도 있습니다. 분산에 대한 다양한 공식은 다음과 같습니다.

bash 환경 변수가 설정되어 있는지 확인

그룹화된 데이터의 분산 공식

그룹화된 데이터의 경우 분산 공식은 아래에서 설명됩니다.

그룹화된 데이터에 대한 표본 분산 공식(σ 2 ) = ∑f(m – x̄) 2 /(n-1)

그룹화된 데이터에 대한 모집단 분산 공식 (피 2 ) = ∑f(m – x̄) 2 /N

어디,

  • 에프 각 간격의 빈도입니다.
  • i의 중간점이다간격
  • 엑스 그룹화된 데이터의 평균입니다.

그룹화된 데이터의 경우 평균은 다음과 같이 계산됩니다.

평균 = ∑ (f 엑스 ) / ∑ f

그룹화되지 않은 데이터의 분산 공식

그룹화되지 않은 데이터의 경우 분산 공식이 아래에 설명되어 있습니다.

  • 그룹화되지 않은 데이터에 대한 표본 분산 공식 (피 2 ) = ∑ (엑스 – x̄) 2 /(n-1)
  • 그룹화되지 않은 데이터에 대한 모집단 분산 공식 (피 2 ) = ∑ (x – x̄) 2 /N

어디 엑스 그룹화된 데이터의 평균입니다.

분산 계산 공식

분산을 계산하는 데 사용되는 공식은 아래 이미지에 설명되어 있습니다.

분산 공식

차이를 계산하는 방법?

일반적으로 분산은 모집단 표준 분산을 의미합니다. 주어진 값 집합의 분산을 계산하는 단계는 다음과 같습니다.

1 단계: 공식(평균 = 관측치 합계/관찰치 수)을 사용하여 관측치의 평균을 계산합니다.

2 단계: 평균과 데이터 값의 차이 제곱을 계산합니다. (데이터 값 - 평균)2

3단계: 데이터 세트의 분산이라고 하는 주어진 값의 차이 제곱의 평균을 계산합니다.

(분산 = 차이 제곱의 합 / 관측치 수)

분산 및 표준편차

차이와 표준 편차 둘 다 데이터 세트의 값이 데이터 세트의 중앙 값 또는 평균 값과 관련하여 벗어나는 정도를 알려주는 데 사용되는 중심 경향의 측정값입니다.

특정 데이터 세트에 대한 분산과 표준 편차 사이에는 명확한 관계가 있습니다.

분산 = (표준편차) 2

분산은 표준 편차의 제곱으로 정의됩니다. 즉, 임의의 데이터 그룹에 대해 표준 편차의 제곱을 취하면 해당 데이터 세트의 분산이 제공됩니다. 분산은 기호를 사용하여 정의됩니다. 2 반면 데이터 세트의 표준 편차를 정의하는 데 사용됩니다. 데이터 세트의 분산은 제곱 단위로 표시되는 반면, 데이터 세트의 표준 편차는 데이터 세트의 평균과 유사한 단위로 표시됩니다.

더 알아보기: 분산 및 표준편차

이항 분포의 분산

이항 분포 n번 수행된 이항 실험에서 긍정적인 결과의 수를 알려주는 이산 확률 분포입니다. 이항 실험의 결과는 0 또는 1, 즉 양수 또는 음수입니다.

이항 실험에서는 N 시행 및 각 시행의 확률이 제공되는 곳 , 이항 분포의 분산은 다음을 사용하여 제공됩니다.

2 = np(1 – p)

어디 '예' 이항 분포 값의 평균으로 정의됩니다.

포아송 분포의 분산

독극물 분포 'x' 기간 내에 'n'개의 사건이 발생할 확률을 정의하는 데 사용되는 이산형 확률 분포로 정의됩니다. 포아송 분포의 평균은 기호로 정의됩니다. 엘.

포아송 분포에서는 주어진 데이터 세트의 평균과 분산이 동일합니다. 포아송 분포의 분산은 다음 공식을 사용하여 제공됩니다.

2 = λ

균일분포의 분산

균일 분포에서는 확률 분포 데이터가 연속적입니다. 이 실험의 결과는 특정 상한과 특정 하한 사이의 범위에 있으므로 이러한 분포를 직사각형 분포라고도 합니다. 상한 또는 최대 한도가 다음과 같은 경우 하한 또는 최소 경계가 a이면 균일 분포의 분산은 다음 공식을 사용하여 계산됩니다.

2 = (1/12)(b – a) 2

균일 분포의 평균은 다음 공식을 사용하여 제공됩니다.

평균 = (b + a) / 2

어디,

  • 균일 분포의 상한입니다.
  • 균일 분포의 하한입니다.

분산과 공분산

데이터 세트의 분산은 데이터 세트의 평균값에 대한 데이터 세트의 모든 값의 변동성을 정의합니다. 공분산은 확률 변수가 서로 어떻게 관련되어 있는지 알려주고 한 변수의 변화가 다른 변수의 변화에 ​​어떻게 영향을 미치는지 알려줍니다.

공분산은 양수 또는 음수일 수 있으며, 양수 공분산은 두 변수가 평균값을 기준으로 동일한 방향으로 이동한다는 것을 의미하고, 음수 공분산은 두 변수가 평균값을 기준으로 반대 방향으로 이동함을 의미합니다.

x가 종속 변수이고 y가 독립 변수인 두 개의 확률 변수 x와 y에 대해 공분산은 아래 첨부된 이미지에 언급된 공식을 사용하여 계산됩니다.

공분산 공식

분산 속성

분산은 수학, 통계 및 기타 과학 분야에서 다양한 목적으로 널리 사용됩니다. 분산은 다양한 문제를 해결하는 데 널리 사용되는 다양한 속성을 가지고 있습니다. 분산의 기본 속성 중 일부는 다음과 같습니다.

  • 데이터 세트의 분산은 음수가 아닌 수량이며 분산의 0 값은 데이터 세트의 모든 값이 동일함을 의미합니다.
  • 분산 값이 높을수록 데이터 세트의 모든 데이터 값이 널리 분산되어 있음을 나타냅니다. 즉, 데이터 세트의 평균값에서 멀리 떨어져 있습니다.
  • 분산 값이 낮을수록 데이터 세트의 모든 데이터 값이 서로 가깝다는 것을 알 수 있습니다. 즉, 데이터 세트의 평균값과 매우 가깝습니다.

임의의 상수 'c'에 대해

  • Var(x + c) = Var(x)

어디 엑스 무작위 변수입니다

  • Var(cx) = c2

어디 엑스 무작위 변수입니다

또한 만약에 그리고 상수 값이고 엑스 그러면 는 랜덤 변수이고,

  • Var(ax + b) = a2

독립변수 x의 경우1, x2, x…,엑스N우리는 그것을 알고 있습니다.

  • 어디에(x1+ 엑스2+… + 엑스N) = Var(x1) + 어디에(x2) +……..+어디(xN)

사람들은 또한 읽습니다:

  • 평균
  • 방법
  • 분산과 표준편차의 차이

분산 공식의 예

예 1: 표본 데이터의 분산을 계산합니다: 7, 11, 15, 19, 24.

해결책:

데이터는 7, 11, 15, 19, 24입니다.

데이터의 평균을 구합니다.

x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15.2

우리가 얻은 분산 공식을 사용하면,

2= ∑ (엑스– x̄)2/(n – 1)
= (67.24 + 17.64 + 0.04 + 14.44 + 77.44)/(5 – 1)
= 176.8/4
= 44.2

예 2: 데이터의 분산이 12이고 평균과의 데이터 차이 제곱의 합이 156인 경우 관측치 수를 계산합니다.

해결책:

우리는

(엑스– x̄)2= 156

2= 12

우리가 얻은 분산 공식을 사용하면,

2= ∑ (엑스– x̄)2/N

12 = 156/n

n = 156/12

n = 13

jlist

예시 3: 주어진 데이터에 대한 분산 계산

엑스

에프

10 1
4
6 5
8 1

해결책:

평균(x̄) = ∑(f엑스)/∑(f)

= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6

n = ∑(f) = 1+3+5+1 = 10

엑스

에프

에프엑스

(엑스– x̄)

(엑스– x̄)2

에프(엑스– x̄)2

10 1 10 4 16 16
4 12 -2 4 12
6 5 30 0 0 0
8 1 8 2 4 8

지금,

2 = (∑ N 에프 (엑스 – x̄) 2 /N)

= [(16 + 12 + 0 +8)/10]
= 3.6

분산(σ2) = 3.6

예시 4: 다음 데이터 테이블의 분산 찾기

수업

빈도

0-10
10-20 6
20-30 4
30-40 2
40-50 1

해결책:

수업

에프

에프×시

사이 – μ

(Xi – μ)2

f×(Xi – μ)2

0-10

5

char java의 문자열

열 다섯

-열 다섯

225

675

10-20

열 다섯

6

90

-5

25

150

20-30

25

4

100

5

25

100

30-40

35

2

70

열 다섯

225

450

40-50

넷 다섯

1

넷 다섯

25

625

625

16

320

2000

평균(μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20

2 = (∑ N 에프 (엑스 - 중) 2 /N)

= [(2000)/(16)]
= (125)

주어진 데이터 세트의 분산은 125입니다.

요약 - 분산

분산은 데이터 세트의 값이 평균과 얼마나 다른지 보여주는 통계적 척도입니다. 이는 데이터 포인트의 확산 또는 분산을 이해하는 데 도움이 됩니다. 분산에는 두 가지 주요 유형이 있습니다. 모집단 분산(전체 모집단의 데이터 포인트가 어떻게 퍼져 나가는지 측정)과 샘플 분산(샘플의 데이터 포인트가 어떻게 퍼져 나가는지 측정)입니다. 분산은 σ²로 표시되며 표준편차의 제곱입니다. 분산을 계산하려면 데이터의 평균을 구하고 각 데이터 포인트에서 평균을 뺀 다음 차이를 제곱한 다음 이 제곱된 차이의 평균을 구합니다. 분산은 데이터 세트 내의 변동성을 이해하는 데 도움이 되기 때문에 중요합니다. 분산이 크다는 것은 데이터 포인트가 넓게 분산되어 있다는 것을 나타내고, 분산이 낮다는 것은 데이터 포인트가 평균에 가깝다는 것을 의미합니다. 분산은 차이를 제곱하는 것과 관련되므로 항상 음수가 아닙니다.

분산에 관한 FAQ

통계의 차이란 무엇입니까?

분산은 데이터 세트의 평균값에 대한 데이터 세트 값의 확산으로 정의됩니다. 데이터 세트의 분산은 특정 데이터 세트의 값이 평균값에서 어느 정도 퍼져 있는지를 나타냅니다.

분산의 상징은 무엇입니까?

우리는 기호 σ를 사용합니다.2, s2 및 Var(x)는 데이터 세트의 분산을 나타냅니다.

분산의 공식은 무엇입니까?

데이터 세트의 분산은 다음 공식을 사용하여 계산됩니다.

2 = E[( X – m ) 2 ]

분산은 무엇을 말합니까?

분산은 데이터의 확산 정도를 찾는 데 사용됩니다. 즉, 데이터 세트의 값이 평균값과 관련하여 어떻게 확산되어 있는지 알려줍니다. 분산 값이 클수록 값은 평균값을 기준으로 넓게 퍼져 있고, 분산 값이 작을수록 값은 평균값을 기준으로 밀접하게 퍼져 있습니다.

분산과 표준편차의 관계는 무엇입니까?

주어진 데이터 세트에 대해 데이터 세트의 분산은 해당 데이터 세트의 표준 편차의 제곱입니다. 이 관계는 다음과 같이 표현된다.

분산 = (표준편차) 2

분산은 어떻게 계산하나요?

분산을 계산하려면 먼저 데이터 세트의 평균(평균)을 찾습니다. 그런 다음 각 데이터 포인트에서 평균을 빼고 결과를 제곱합니다. 마지막으로 이러한 제곱 차이의 평균을 구합니다.

왜 차이가 중요한가요?

분산은 데이터 세트 내의 데이터 분포를 이해하는 데 중요합니다. 이는 데이터 포인트가 평균값에서 얼마나 분산되어 있는지 결정하는 데 도움이 되며 데이터 내의 변동성 또는 일관성을 나타냅니다.

분산과 표준편차의 차이점은 무엇입니까?

분산과 표준편차 모두 데이터 분산을 측정하는 반면, 표준편차는 분산의 제곱근입니다. 표준편차는 데이터와 동일한 단위로 표현되므로 스프레드를 나타내는 데 더 쉽게 해석할 수 있습니다.

차이가 음수가 될 수 있나요?

아니요, 차이는 음수가 될 수 없습니다. 평균과의 차이를 제곱한 값의 평균으로 계산되므로 결과 값은 항상 음수가 아닙니다.