logo

선형 회귀와 로지스틱 회귀

선형 회귀 및 로지스틱 회귀는 지도 학습 기술을 사용하는 두 가지 유명한 기계 학습 알고리즘입니다. 두 알고리즘 모두 본질적으로 감독되므로 이러한 알고리즘은 레이블이 지정된 데이터 세트를 사용하여 예측을 수행합니다. 그러나 이들 사이의 주요 차이점은 사용 방법입니다. 선형 회귀는 회귀 문제를 해결하는 데 사용되는 반면 로지스틱 회귀는 분류 문제를 해결하는 데 사용됩니다. 두 알고리즘에 대한 설명은 차이점 표와 함께 아래에 제공됩니다.

선형 회귀와 로지스틱 회귀

선형 회귀:

  • 선형 회귀는 지도 학습 기술에 포함되고 회귀 문제를 해결하는 데 사용되는 가장 간단한 기계 학습 알고리즘 중 하나입니다.
  • 독립변수의 도움으로 연속형 종속변수를 예측하는 데 사용됩니다.
  • 선형 회귀의 목표는 연속 종속 변수의 출력을 정확하게 예측할 수 있는 최적의 선을 찾는 것입니다.
  • 단일 독립변수를 사용하여 예측하는 경우를 단순선형회귀라고 하고, 독립변수가 2개 이상인 경우 이러한 회귀를 다중선형회귀라고 합니다.
  • 알고리즘은 가장 적합한 선을 찾아 종속 변수와 독립 변수 간의 관계를 설정합니다. 그리고 그 관계는 선형적 성격을 띠어야 합니다.
  • 선형 회귀의 출력은 가격, 연령, 급여 등과 같은 연속 값이어야 합니다. 종속 변수와 독립 변수 간의 관계는 아래 이미지에 표시될 수 있습니다.
선형 회귀와 로지스틱 회귀

위 이미지에서 종속변수는 Y축(급여)에 있고 독립변수는 X축(경험)에 있습니다. 회귀선은 다음과 같이 작성할 수 있습니다.

 y= a<sub>0</sub>+a<sub>1</sub>x+ &#x3B5; 

어디서,0그리고1는 계수이고 ε은 오류항입니다.

로지스틱 회귀:

  • 로지스틱 회귀는 지도 학습 기술에 포함되는 가장 널리 사용되는 기계 학습 알고리즘 중 하나입니다.
  • 회귀 문제뿐만 아니라 분류 문제에도 사용할 수 있지만 주로 분류 문제에 사용됩니다.
  • 로지스틱 회귀 분석은 독립 변수의 도움으로 범주형 종속 변수를 예측하는 데 사용됩니다.
  • 로지스틱 회귀 문제의 출력은 0과 1 사이에서만 가능합니다.
  • 두 클래스 간의 확률이 필요한 경우 로지스틱 회귀를 사용할 수 있습니다. 예를 들어 오늘 비가 올지 여부, 0 또는 1, 참 또는 거짓 등입니다.
  • 로지스틱 회귀는 최대 우도 추정 개념을 기반으로 합니다. 이 추정에 따르면 관측된 데이터는 가장 가능성이 높습니다.
  • 로지스틱 회귀에서는 0과 1 사이의 값을 매핑할 수 있는 활성화 함수를 통해 입력의 가중 합계를 전달합니다. 이러한 활성화 함수는 다음과 같습니다. 시그모이드 함수 그리고 얻은 곡선을 시그모이드 곡선 또는 S-곡선이라고 합니다. 아래 이미지를 고려하십시오.
선형 회귀와 로지스틱 회귀
  • 로지스틱 회귀 방정식은 다음과 같습니다.
선형 회귀와 로지스틱 회귀

선형 회귀와 로지스틱 회귀의 차이점:

선형 회귀 로지스틱 회귀
선형 회귀는 주어진 독립 변수 세트를 사용하여 연속 종속 변수를 예측하는 데 사용됩니다. 로지스틱 회귀 분석은 주어진 독립 변수 세트를 사용하여 범주형 종속 변수를 예측하는 데 사용됩니다.
선형 회귀는 회귀 문제를 해결하는 데 사용됩니다. 로지스틱 회귀는 분류 문제를 해결하는 데 사용됩니다.
선형 회귀에서는 연속 변수의 값을 예측합니다. 로지스틱 회귀 분석에서는 범주형 변수의 값을 예측합니다.
선형 회귀에서는 출력을 쉽게 예측할 수 있는 가장 적합한 선을 찾습니다. 로지스틱 회귀 분석에서는 샘플을 분류할 수 있는 S-곡선을 찾습니다.
정확도를 추정하기 위해 최소제곱 추정법을 사용합니다. 정확도 추정을 위해 최대 우도 추정 방법이 사용됩니다.
선형 회귀의 출력은 가격, 연령 등과 같은 연속 값이어야 합니다. 로지스틱 회귀 분석의 출력은 0 또는 1, 예 또는 아니요 등과 같은 범주형 값이어야 합니다.
선형회귀에서는 종속변수와 독립변수의 관계가 선형이어야 합니다. 로지스틱 회귀 분석에서는 종속 변수와 독립 변수 사이에 선형 관계가 필요하지 않습니다.
선형 회귀 분석에서는 독립 변수 사이에 공선성이 있을 수 있습니다. 로지스틱 회귀 분석에서는 독립 변수 간에 공선성이 없어야 합니다.