logo

평균, 분산, 표준편차

평균, 분산, 표준편차 중요한 통계적 척도입니다. 분산은 평균과의 데이터 포인트 편차를 수량화하고, 표준 편차는 데이터 분포를 측정합니다. 주요 차이점은 표준 편차가 평균과 동일한 단위인 반면 분산은 제곱 단위라는 것입니다. 정의, 공식, 예시를 통해 이러한 개념을 더 자세히 알아보세요.

평균

평균 주어진 데이터 세트의 평균입니다. 아래 예를 고려해 보겠습니다.

2, 4, 4, 4, 5, 5, 7, 9

이 8개 데이터 포인트의 평균(평균)은 5입니다.

frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.

공식 : mu=frac{sum_{i=1}^{N} x_{i}}{N}

어디 ? 는 의미가 있고 x1, x2, x…., 엑스요소입니다. 또한 평균은 때때로 다음과 같이 표시됩니다. egin{배열}{lll} (2-5)^2 = (-3)^2 = 9 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (- 1)^2 = 1 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (-1)^2 = 1 && (7-5)^2 = 2^2 = 4  (4-5)^2 = (-1)^2 = 1 && (9-5)^2 = 4^2 = 16.  end{배열}



변화

변화 모든 숫자와 평균 사이의 차이의 제곱의 합입니다.
위의 예에 대한 편차입니다. 먼저, 각 데이터 포인트의 평균과 편차를 계산하고 각각의 결과를 제곱합니다.

공식: sigma^{2}= frac { sum_{i=1}^{N} (x_{i}-mu)^{2}}{N}

분산 = 	extup{변동계수 } =frac{ 	extup{표준편차}}{평균}*100= 4.



어디 ? 는 평균이고, N은 총 요소 수 또는 분포 빈도입니다.


표준 편차

표준 편차 분산의 제곱근입니다. 데이터가 평균과 얼마나 다른지 측정하는 것입니다.

표준편차(위 데이터의 경우) = = 2

수학자들은 편차를 찾기 위해 왜 제곱을 선택한 다음 제곱근을 선택했고, 단순히 값의 차이를 취하지 않았습니까?
그 이유 중 하나는 평균의 정의에 따라 차이의 합이 0이 되기 때문입니다. 절대차의 합은 옵션이 될 수 있지만, 절대차를 사용하면 많은 좋은 정리를 증명하기가 어려웠습니다. [원천: MIT 비디오 강의 1:19]

  1. 입력의 모든 항목이 동일하면 표준 편차 값은 0입니다.
  2. 입력 세트의 모든 값에 7이라는 숫자를 더하거나 빼면 평균은 7만큼 증가(또는 감소)하지만 표준 편차는 변하지 않습니다.
  3. 입력 집합의 모든 값에 숫자 7을 곱하면 평균과 표준 편차 모두 7을 곱합니다. 그러나 모든 입력 값에 음수(예: -7)를 곱하면 평균에 -7을 곱하지만 표준편차에 7을 곱합니다.
  4. 표준편차와 분산은 숫자가 얼마나 퍼져 있는지를 나타내는 척도입니다. 분산은 대략적인 산포 아이디어를 제공하는 반면, 표준 편차는 더 구체적이어서 평균으로부터 정확한 거리를 제공합니다.
  5. 평균, 중앙값 및 최빈값은 데이터(그룹화 또는 그룹화 해제)의 중심 경향을 측정한 것입니다.

확인하다:

  • 분산 및 표준편차
  • 표준편차의 실제 응용
  • 분산과 표준편차의 차이

아래 질문은 전년도 GATE 시험에서 출제된 질문입니다. 참고자료:
https://en.wikipedia.org/wiki/Standard_deviation
http://staff.argyll.epsb.ca/jreed/math30p/statistics/standardDeviation.htm

평균, 분산, 표준편차 – FAQ

표준편차와 분산의 차이점은 무엇입니까?

표준편차와 분산은 모두 평균을 기준으로 데이터세트의 데이터 포인트 분포를 측정합니다. 주요 차이점은 분산은 평균과의 제곱 편차의 평균을 측정하는 반면, 표준편차는 분산의 제곱근을 의미하며 데이터와 동일한 단위로 확산 정도를 측정한다는 것입니다.

평균, 분산, 표준편차는 어떻게 계산하나요?

  • 평균: 모든 숫자를 더하고 숫자의 개수로 나눕니다.
  • 분산: 평균을 계산하고 각 숫자에서 평균을 뺀 다음 결과를 제곱하고 이 제곱된 결과를 합한 다음 숫자에서 1을 뺀 수로 나눕니다.
  • 표준편차: 분산의 제곱근을 구합니다.

평균, 분산, 표준편차가 중요한 이유는 무엇입니까?

이러한 통계적 측정은 데이터 분포를 이해하는 데 중요합니다. 평균은 중심 값을 제공하는 반면, 분산 및 표준 편차는 데이터의 변동성 또는 확산에 대한 통찰력을 제공하여 데이터 세트의 일관성 또는 변동성을 나타냅니다.

분산과 표준편차가 음수가 될 수 있나요?

아니요, 분산과 표준편차는 음수가 될 수 없습니다. 분산은 평균과의 차이 제곱의 평균으로 계산되므로 음수가 아닌 값이 생성됩니다. 표준편차는 분산의 제곱근이므로 음수가 될 수 없습니다.

이상치가 평균, 분산, 표준편차에 어떤 영향을 미칩니까?

이상값은 평균을 이상값 쪽으로 끌어당겨 평균에 큰 영향을 미칠 수 있으므로 데이터 세트의 중심 경향을 정확하게 반영하지 못합니다. 분산 및 표준 편차도 증가함에 따라 영향을 받습니다. 이는 이상치로 인해 데이터가 더 많이 분산된다는 것을 나타냅니다.