이번 포스팅에서는 표준편차를 구하는 방법에 대해 알아보겠습니다. R 프로그래밍 언어 . 표준편차 R은 값의 분산을 측정한 것입니다. 분산의 제곱근으로 정의할 수도 있습니다.
표본 표준편차 공식:

어디,
- s = 표본 표준 편차
- N = 엔터티 수
-
= 개체의 평균
기본적으로 R 프로그래밍 언어에서 표준 편차를 계산하는 방법에는 두 가지가 있으며, 두 방법 모두 아래에서 설명합니다.
방법 1: 순진한 접근 방식
표준편차를 계산하는 이 방법에서는 R 언어에서 위의 표본 표준편차 표준 공식을 사용합니다.
예시 1:
아르 자형
v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)> |
>
>
산출:
[1] 25.53886>
예시 2:
아르 자형
v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)> |
>
>
산출:
[1] 2.676004>
방법 2: sd() 사용
sd() 함수는 표준편차를 반환하는 데 사용됩니다.
통사론: sd(x, na.rm = 거짓)
매개변수:
x: 숫자형 벡터, 행렬 또는 데이터 프레임.na.rm: 누락된 값을 제거하시겠습니까?
반품: x의 표본 표준편차입니다.
예시 1:
아르 자형
v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sd>(v)> print>(s)> |
>
>
산출:
[1] 25.53886>
예시 2:
아르 자형
v <->c>(71,48,98,65,45,27,39,61,50,24,17)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)> |
>
>
산출:
[1] 23.52175>
예시 3:
아르 자형
v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)> |
>
>
산출:
[1] 2.676004>
데이터 프레임의 표준 편차를 계산합니다.
두 가지 방법을 모두 사용하여 데이터 프레임의 표준 편차를 계산할 수 있습니다. 붓꽃 데이터세트를 가져와 모든 열에 대해 표준편차를 계산합니다.
예시 1:
아르 자형
data>(iris)> sd>(iris$Sepal.Length)> sd>(iris$Sepal.Width)> sd>(iris$Petal.Length)> sd>(iris$Petal.Width)> |
>
>
산출:
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377>
또한 적용 기능의 도움으로 전체 데이터 프레임에 대한 표준 편차를 계산할 수도 있습니다.
아르 자형
# Load the iris dataset> data>(iris)> # Calculate the standard deviation for each column> std_deviation <->apply>(iris[, 1:4], 2, sd)> # Display the standard deviation values> print>(std_deviation)> |
>
>
산출:
Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377>
변수 측정값을 전달하는 숫자 열인 붓꽃 데이터세트의 열 1~4는 위 코드의 iris[, 1:4] 표현식을 사용하여 선택됩니다.
Git으로 결제하기
sd 함수는 적용 함수를 사용하여 붓꽃 데이터세트에서 선택한 하위 집합의 각 열(2로 표시됨)에 적용됩니다. 결과 표준 편차 값은 각 열의 std_deviation 벡터에 저장됩니다.
= 개체의 평균