logo

지도 머신러닝

지도 학습은 기계가 잘 '레이블이 지정된' 훈련 데이터를 사용하여 훈련하고 해당 데이터를 기반으로 기계가 출력을 예측하는 기계 학습 유형입니다. 레이블이 지정된 데이터는 일부 입력 데이터가 이미 올바른 출력으로 태그 지정되었음을 의미합니다.

지도 학습에서 기계에 제공된 훈련 데이터는 기계가 출력을 올바르게 예측하도록 가르치는 감독자 역할을 합니다. 이는 학생이 교사의 지도하에 배우는 것과 동일한 개념을 적용합니다.

지도 학습은 기계 학습 모델에 입력 데이터와 올바른 출력 데이터를 제공하는 프로세스입니다. 지도 학습 알고리즘의 목적은 다음과 같습니다. 입력 변수(x)를 출력 변수(y)와 매핑하는 매핑 함수를 찾습니다. .

현실 세계에서는 지도 학습을 다음과 같이 사용할 수 있습니다. 위험 평가, 이미지 분류, 사기 탐지, 스팸 필터링 , 등.

지도 학습은 어떻게 작동하나요?

지도 학습에서 모델은 레이블이 지정된 데이터 세트를 사용하여 훈련되며, 여기서 모델은 각 데이터 유형에 대해 학습합니다. 훈련 프로세스가 완료되면 테스트 데이터(훈련 세트의 하위 집합)를 기반으로 모델을 테스트한 다음 출력을 예측합니다.

지도 학습의 작동은 아래 예와 다이어그램을 통해 쉽게 이해할 수 있습니다.

세상에서 가장 아름다운 미소
감독형 기계 학습

정사각형, 직사각형, 삼각형 및 다각형을 포함하는 다양한 유형의 모양 데이터세트가 있다고 가정합니다. 이제 첫 번째 단계는 각 모양에 대한 모델을 훈련하는 것입니다.

  • 주어진 도형에 4개의 변이 있고 모든 변이 동일하면 다음과 같이 표시됩니다. 정사각형 .
  • 주어진 도형에 변이 3개 있으면 다음과 같이 표시됩니다. 삼각형 .
  • 주어진 도형에 6개의 동일한 변이 있으면 다음과 같이 표시됩니다. 육각형 .

이제 훈련 후에 테스트 세트를 사용하여 모델을 테스트하고 모델의 작업은 모양을 식별하는 것입니다.

기계는 이미 모든 유형의 도형에 대해 훈련을 받았으며, 새로운 도형을 찾으면 여러 변을 기준으로 도형을 분류하고 출력을 예측합니다.

지도 학습과 관련된 단계:

  • 먼저 학습 데이터세트 유형을 결정합니다.
  • 레이블이 지정된 훈련 데이터를 수집/수집합니다.
  • 훈련 데이터 세트를 훈련으로 분할 데이터세트, 테스트 데이터세트, 검증 데이터세트 .
  • 모델이 출력을 정확하게 예측할 수 있도록 충분한 지식이 있어야 하는 교육 데이터 세트의 입력 기능을 결정합니다.
  • 지원 벡터 머신, 의사결정 트리 등 모델에 적합한 알고리즘을 결정합니다.
  • 훈련 데이터 세트에서 알고리즘을 실행합니다. 때로는 학습 데이터세트의 하위 집합인 제어 매개변수로 검증 세트가 필요할 때도 있습니다.
  • 테스트 세트를 제공하여 모델의 정확성을 평가합니다. 모델이 올바른 출력을 예측한다면 이는 우리 모델이 정확하다는 것을 의미합니다.

지도형 기계 학습 알고리즘의 유형:

지도 학습은 두 가지 유형의 문제로 더 나눌 수 있습니다.

감독형 기계 학습

1. 회귀

회귀 알고리즘은 입력 변수와 출력 변수 사이에 관계가 있는 경우 사용됩니다. 일기 예보, 시장 동향 등과 같은 연속 변수를 예측하는 데 사용됩니다. 다음은 지도 학습에 사용되는 몇 가지 인기 있는 회귀 알고리즘입니다.

  • 선형 회귀
  • 회귀 트리
  • 비선형 회귀
  • 베이지안 선형 회귀
  • 다항식 회귀

2. 분류

분류 알고리즘은 출력 변수가 범주형일 때 사용됩니다. 즉, 예-아니요, 남성-여성, 참-거짓 등 두 가지 클래스가 있음을 의미합니다.

스팸 필터링,

  • 랜덤 포레스트
  • 의사결정 트리
  • 로지스틱 회귀
  • 지원 벡터 머신

참고: 이러한 알고리즘에 대해서는 이후 장에서 자세히 논의할 것입니다.

지도 학습의 장점:

  • 지도 학습의 도움으로 모델은 이전 경험을 기반으로 출력을 예측할 수 있습니다.
  • 지도 학습에서는 객체 클래스에 대한 정확한 정보를 얻을 수 있습니다.
  • 지도 학습 모델은 다음과 같은 다양한 실제 문제를 해결하는 데 도움이 됩니다. 사기 탐지, 스팸 필터링 , 등.

지도 학습의 단점:

  • 지도 학습 모델은 복잡한 작업을 처리하는 데 적합하지 않습니다.
  • 테스트 데이터가 훈련 데이터 세트와 다른 경우 지도 학습은 올바른 출력을 예측할 수 없습니다.
  • 훈련에는 많은 계산 시간이 필요했습니다.
  • 지도 학습에서는 객체 클래스에 대한 충분한 지식이 필요합니다.