이 기사에서는 R 프로그래밍 언어에서 선형 모델을 피팅하기 위해 lm() 함수를 사용하는 방법을 알아봅니다.
선형 모델은 독립 변수를 기반으로 알려지지 않은 변수의 값을 예측하는 데 사용됩니다. 주로 변수와 예측 간의 관계를 알아내는 데 사용됩니다. lm() 함수는 R 언어의 데이터 프레임에 선형 모델을 맞추는 데 사용됩니다. 데이터 프레임에 없는 데이터에 해당하는 값을 예측하기 위해 회귀 분석, 단일 계층 분산 분석, 공분산 분석을 수행하는 데 사용할 수 있습니다. 이는 부동산 가격 예측, 일기예보 등에 매우 도움이 됩니다.
다음을 사용하여 R 언어에서 선형 모델을 맞추려면 lm() 함수, 먼저 data.frame() 함수를 사용하여 회귀 함수를 사용하여 선형 모델에 맞춰야 하는 값이 포함된 샘플 데이터 프레임을 만듭니다. 그런 다음 lm() 함수를 사용하여 특정 함수를 주어진 데이터 프레임에 맞춥니다.
통사론:
lm(fitting_formula, 데이터프레임)
매개변수:
Fitting_formula: 선형 모델의 공식을 결정합니다. dataframe: 데이터가 포함된 데이터 프레임의 이름을 결정합니다.
그런 다음 summary() 함수를 사용하여 선형 모델의 요약을 볼 수 있습니다. summary() 함수는 선형 모델 분석에 가장 중요한 통계 값을 해석합니다.
ABS C 코드
통사론:
요약(선형_모델)
요약에는 다음과 같은 주요 정보가 포함됩니다.
- 잔여 표준 오류: 분산의 제곱근에서 n-1로 나누는 대신 n - 1 + 관련 변수 수를 빼는 오류의 표준 편차를 결정합니다. 다중 R-제곱: 모델이 데이터에 얼마나 잘 맞는지 결정합니다. 조정된 R-제곱: 보유한 샘플 수와 사용 중인 변수 수를 고려하여 다중 R-제곱을 정규화합니다. F-Statistic: 계수 중 하나 이상이 0이 아닌지 확인하는 전역 테스트입니다.
예: lm() 함수의 사용법을 보여주는 예입니다.
아르 자형
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)> |
>
>
산출:
부르다:
lm(수식 = y ~ x^2, 데이터 = df)
잔차:
1 2 3 4 5
2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00
계수:
추정 표준 오류 t 값 Pr(>|t|)
(절편) -7.0000 3.0876 -2.267 0.10821
x 6.0000 0.9309 6.445 0.00757 **
—
Signif. 코드: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' 1
잔여 표준 오차: 3자유도에서 2.944
다중 R-제곱: 0.9326, 조정된 R-제곱: 0.9102
F-통계량: 1 및 3 DF에서 41.54, p-값: 0.007575
진단 플롯
진단 플롯은 모델의 다양한 통계 값 간의 관계를 보는 데 도움이 됩니다. 이는 이상치의 정도와 적합 모델의 효율성을 분석하는 데 도움이 됩니다. 선형 모델의 진단 플롯을 보려면 R 언어의plot() 함수를 사용합니다.
통사론:
플롯(선형_모델)
예: 위의 적합 선형 모델에 대한 진단 플롯.
아르 자형
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)> |
>
>
산출:

선형 모델 플로팅
abline() 메서드를 사용하면 위의 적합 선형 모델을 시각화하여 잘 시각화할 수 있습니다. 먼저 데이터 포인트의 산점도를 그린 다음 abline() 함수를 사용하여 선형 모델의 abline 플롯과 오버레이합니다.
통사론:
플롯(df$x, df$y)
git pull 오리진 마스터아블린(선형_모델)
예: 선형 모델 플로팅
아르 자형
문자열을 int로
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)> |
>
>
산출:

적합 모델을 사용하여 알 수 없는 데이터 포인트의 값 예측
위의 적합 선형 모델을 사용하여 새로운 입력 값을 예측하기 위해 예측() 함수를 사용합니다. 예측() 함수는 알 수 없는 데이터 포인트가 있는 모델과 데이터 프레임을 가져와 피팅된 모델에 따라 각 데이터 포인트의 값을 예측합니다.
통사론:
예측(모델, 데이터)
매개변수:
model: 선형 모델을 결정합니다. data: 알 수 없는 데이터 포인트가 있는 데이터 프레임을 결정합니다.
예: 새로운 입력 예측
아르 자형
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )> |
>
>
산출:
1 2 3 83 89 95>