logo

R에서 표준편차를 찾는 방법은 무엇입니까?

이번 포스팅에서는 표준편차를 구하는 방법에 대해 알아보겠습니다. R 프로그래밍 언어 . 표준편차 R은 값의 분산을 측정한 것입니다. 분산의 제곱근으로 정의할 수도 있습니다.

표본 표준편차 공식:



s = sqrt{frac{1}{N-1}displaystylesumlimits_{i=1}^N(x_i-overline{x})^2 }

어디,

  • s = 표본 표준 편차
  • N = 엔터티 수
  • overline{x}= 개체의 평균

기본적으로 R 프로그래밍 언어에서 표준 편차를 계산하는 방법에는 두 가지가 있으며, 두 방법 모두 아래에서 설명합니다.



방법 1: 순진한 접근 방식

표준편차를 계산하는 이 방법에서는 R 언어에서 위의 표본 표준편차 표준 공식을 사용합니다.

예시 1:

아르 자형

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

산출:



[1]   25.53886>

예시 2:

아르 자형

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

산출:

[1] 2.676004>

방법 2: sd() 사용

sd() 함수는 표준편차를 반환하는 데 사용됩니다.

통사론: sd(x, na.rm = 거짓)

매개변수:

    x: 숫자형 벡터, 행렬 또는 데이터 프레임.na.rm: 누락된 값을 제거하시겠습니까?

반품: x의 표본 표준편차입니다.

예시 1:

아르 자형

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sd>(v)> print>(s)>
>
>

산출:

[1] 25.53886>

예시 2:

아르 자형

v <->c>(71,48,98,65,45,27,39,61,50,24,17)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

산출:

[1] 23.52175>

예시 3:

아르 자형

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

산출:

[1] 2.676004>

데이터 프레임의 표준 편차를 계산합니다.

두 가지 방법을 모두 사용하여 데이터 프레임의 표준 편차를 계산할 수 있습니다. 붓꽃 데이터세트를 가져와 모든 열에 대해 표준편차를 계산합니다.

예시 1:

아르 자형

data>(iris)> sd>(iris$Sepal.Length)> sd>(iris$Sepal.Width)> sd>(iris$Petal.Length)> sd>(iris$Petal.Width)>
>
>

산출:

[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377>

또한 적용 기능의 도움으로 전체 데이터 프레임에 대한 표준 편차를 계산할 수도 있습니다.

아르 자형

# Load the iris dataset> data>(iris)> # Calculate the standard deviation for each column> std_deviation <->apply>(iris[, 1:4], 2, sd)> # Display the standard deviation values> print>(std_deviation)>
>
>

산출:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377>

변수 측정값을 전달하는 숫자 열인 붓꽃 데이터세트의 열 1~4는 위 코드의 iris[, 1:4] 표현식을 사용하여 선택됩니다.

Git으로 결제하기

sd 함수는 적용 함수를 사용하여 붓꽃 ​​데이터세트에서 선택한 하위 집합의 각 열(2로 표시됨)에 적용됩니다. 결과 표준 편차 값은 각 열의 std_deviation 벡터에 저장됩니다.