결측값이란 무엇입니까?
데이터 분석에서 결측값은 특정 변수나 관측값에 대한 데이터가 없음을 나타냅니다. 이러한 누락된 값은 일반적으로 R 및 기타 여러 프로그래밍 언어에서 NA(사용할 수 없음)로 표시되는 특수 기호나 코드로 표시됩니다.
R의 na.omit() 함수
그만큼na.omit()>기능하다 R 프로그래밍 언어 데이터 프레임, 행렬 또는 벡터에서 누락된 값(NA)을 제거하는 데 사용됩니다. na.omit이라는 이름은 생략 NA를 의미합니다. 이 함수는 결측값이 포함된 데이터 세트로 작업할 때 특히 유용하며 분석에서 결측 데이터가 있는 관측치를 제외하려고 합니다.
통사론:
na.생략(데이터)
매개변수:
데이터: 데이터 프레임, 행렬 또는 벡터의 지정된 값 집합입니다.
보고: NA 생략 후 값의 범위.
벡터에서 누락된 값 제거
아르 자형
# Create a vector with missing values> vector <->c>(1, 2,>NA>, 4, 5)> vector> # Use na.omit() to remove missing values> cleaned_vector <->na.omit>(vector)> # Display the cleaned vector> cleaned_vector> |
>
>
산출:
[1] 1 2 NA 4 5 [1] 1 2 4 5>
누락된 값 제거 행렬
아르 자형
네트워킹 및 유형
비제이 영화배우
# Create a matrix with missing values> mat<->c>(>NA>,1,2,>NA>,3,4,>NA>,5,6,>NA>,7,8)> var<->matrix>(mat,3,4)> var> # Use na.omit() to remove missing values> na.omit>(var)> |
>
>
산출:
[,1] [,2] [,3] [,4] [1,] NA NA NA NA [2,] 1 3 5 7 [3,] 2 4 6 8 [,1] [,2] [,3] [,4] [1,] 1 3 5 7 [2,] 2 4 6 8>
누락된 값 제거 데이터 프레임
아르 자형
# Create a data frame with missing values> data <->data.frame>(> >ID =>c>(1, 2, 3, 4),> >Value =>c>(5,>NA>, 7, 8)> )> data> # Use na.omit() to remove rows with missing values> cleaned_data <->na.omit>(data)> # Display the cleaned data> print>(cleaned_data)> |
>
>
산출:
ID Value 1 1 5 2 2 NA 3 3 7 4 4 8 ID Value 1 1 5 3 3 7 4 4 8>