logo

기계 학습 모델

기계 학습 모델은 훈련 프로세스의 출력을 수학적 표현으로 정의합니다. 머신러닝은 경험과 오래된 데이터를 통해 자동으로 개선하고 모델을 구축할 수 있는 다양한 알고리즘을 연구하는 것입니다. 기계 학습 모델은 이전 경험이나 데이터를 기반으로 패턴이나 행동을 인식하도록 설계된 컴퓨터 소프트웨어와 유사합니다. 학습 알고리즘은 훈련 데이터 내에서 패턴을 발견하고, 이러한 패턴을 포착하고 새로운 데이터에 대해 예측하는 ML 모델을 출력합니다.

기계 학습 모델

얼굴 표정을 기반으로 사용자의 감정을 인식하는 앱을 만드는 ML 모델의 예를 이해해 보겠습니다. 따라서 이러한 앱을 만드는 것은 기계 학습 모델을 통해 가능합니다. 여기서 우리는 다양한 감정이 표시된 얼굴 이미지를 제공하여 모델을 학습합니다. 이 앱이 사용자의 기분을 결정하는 데 사용될 때마다 제공된 모든 데이터를 읽은 다음 사용자의 기분을 결정합니다.

그러므로 간단히 말해서 다음과 같이 말할 수 있다. 기계 학습 모델은 무언가 또는 프로세스를 단순화하여 표현한 것입니다. 이 주제에서는 다양한 기계 학습 모델과 해당 기술 및 알고리즘에 대해 논의합니다. .

머신러닝 모델이란 무엇입니까?

머신러닝 모델은 새로운 데이터 내에서 패턴을 찾아 예측하도록 훈련된 프로그램으로 이해될 수 있습니다. 이러한 모델은 입력 데이터 형식의 요청을 받아 입력 데이터에 대해 예측한 다음 응답으로 출력을 제공하는 수학적 함수로 표현됩니다. 먼저 이러한 모델은 일련의 데이터에 대해 훈련된 다음 데이터를 추론하고 피드 데이터에서 패턴을 추출하고 해당 데이터에서 학습하는 알고리즘을 제공합니다. 이러한 모델이 훈련되면 보이지 않는 데이터 세트를 예측하는 데 사용할 수 있습니다.

다양한 비즈니스 목표와 데이터 세트를 기반으로 사용할 수 있는 다양한 유형의 기계 학습 모델이 있습니다.

기계 학습 모델 분류:

다양한 비즈니스 목표와 데이터 세트를 기반으로 알고리즘에 대한 세 가지 학습 모델이 있습니다. 각 기계 학습 알고리즘은 다음 세 가지 모델 중 하나로 결정됩니다.

  • 지도 학습
  • 비지도 학습
  • 강화 학습
기계 학습 모델

지도 학습은 두 가지 범주로 더 나뉩니다.

  • 분류
  • 회귀

비지도 학습(Unsupervised Learning)은 다음과 같은 범주로 나뉩니다.

  • 클러스터링
  • 연관 규칙
  • 차원 축소

1. 지도 머신러닝 모델

지도 학습은 어떤 입력 데이터가 훈련 데이터라고 불리며 출력으로 알려진 레이블 또는 결과가 있는지 이해하는 가장 간단한 기계 학습 모델입니다. 따라서 입출력 쌍의 원리에 따라 작동합니다. 훈련 데이터 세트를 사용하여 훈련할 수 있는 함수를 생성한 다음 이를 알 수 없는 데이터에 적용하여 어느 정도 예측 성능을 내는 것이 필요합니다. 지도 학습은 작업 기반이며 레이블이 지정된 데이터 세트에서 테스트됩니다.

간단한 실생활 문제에 대해 지도 학습 모델을 구현할 수 있습니다. 예를 들어 나이와 키로 구성된 데이터세트가 있습니다. 그런 다음 나이를 기준으로 사람의 키를 예측하는 지도 학습 모델을 구축할 수 있습니다.

지도 학습 모델은 두 가지 범주로 더 분류됩니다.

회귀

회귀 문제에서 출력은 연속 변수입니다. 일반적으로 사용되는 일부 회귀 모델은 다음과 같습니다.

a) 선형 회귀

선형 회귀는 하나 이상의 입력 변수를 사용하여 하나의 출력 변수를 예측하는 가장 간단한 기계 학습 모델입니다. 선형 회귀의 표현은 입력 값 집합(x)과 해당 입력 값 집합에 대한 예측 출력(y)을 결합하는 선형 방정식입니다. 선 형태로 표현됩니다.

Y = bx + c.

기계 학습 모델

선형 회귀 모델의 주요 목표는 데이터 포인트에 가장 잘 맞는 최적선을 찾는 것입니다.

선형 회귀는 다중 선형 회귀(가장 적합한 평면 찾기) 및 다항식 회귀(가장 적합한 곡선 찾기)로 확장됩니다.

b) 의사결정나무

단백질 지방인가

의사결정 트리는 회귀 및 분류 문제 모두에 사용할 수 있는 널리 사용되는 기계 학습 모델입니다.

의사결정 트리는 가능한 결과 및 결과와 함께 트리와 같은 의사결정 구조를 사용합니다. 여기에서 각 내부 노드는 속성에 대한 테스트를 나타내는 데 사용됩니다. 각 분기는 테스트 결과를 나타내는 데 사용됩니다. 의사결정 트리에 노드가 많을수록 결과가 더 정확해집니다.

의사결정 트리의 장점은 직관적이고 구현하기 쉽지만 정확성이 부족하다는 것입니다.

의사결정나무는 다음과 같은 분야에서 널리 사용됩니다. 운영 연구, 특히 의사결정 분석, 전략 계획 , 주로 기계 학습에 사용됩니다.

c) 랜덤 포레스트

Random Forest는 다수의 의사결정 트리로 구성된 앙상블 학습 방법입니다. 랜덤 포레스트의 각 의사결정 트리는 결과를 예측하며, 과반수를 얻은 예측을 결과로 간주합니다.

회귀 문제와 분류 문제 모두에 랜덤 포레스트 모델을 사용할 수 있습니다.

분류 작업의 경우 랜덤 포레스트의 결과는 과반수의 투표에서 가져옵니다. 회귀 작업에서는 각 트리에서 생성된 예측의 평균 또는 평균에서 결과를 가져옵니다.

d) 신경망

신경망은 기계 학습의 하위 집합이며 인공 신경망이라고도 합니다. 신경망은 인공 뉴런으로 구성되며 인간의 뇌 구조와 작동 방식과 유사하게 설계되었습니다. 각각의 인공 뉴런은 신경망의 다른 많은 뉴런과 연결되며, 이렇게 수백만 개의 연결된 뉴런이 정교한 인지 구조를 형성합니다.

기계 학습 모델

신경망은 하나의 입력 레이어, 하나 이상의 숨겨진 레이어 및 하나의 출력 레이어를 포함하는 다층 구조로 구성됩니다. 각 뉴런은 다른 뉴런과 연결되어 있으므로 한 계층에서 다음 계층의 다른 뉴런으로 데이터를 전송합니다. 마지막으로 데이터는 신경망의 마지막 계층 또는 출력 계층에 도달하여 출력을 생성합니다.

신경망은 학습 데이터에 의존하여 정확도를 학습하고 향상시킵니다. 그러나 완벽하게 훈련되고 정확한 신경망은 데이터를 빠르게 클러스터링하여 강력한 기계 학습 및 AI 도구가 될 수 있습니다. 가장 잘 알려진 신경망 중 하나는 구글의 검색 알고리즘.

분류

분류 모델은 범주형 형식의 관찰된 값으로부터 결론을 생성하는 데 사용되는 지도 학습 기술의 두 번째 유형입니다. 예를 들어 분류 모델은 이메일이 스팸인지 아닌지를 식별할 수 있습니다. 구매자가 제품을 구매할지 여부 등이 결정됩니다. 분류 알고리즘은 두 가지 클래스를 예측하고 출력을 다른 그룹으로 분류하는 데 사용됩니다.

분류에서는 데이터세트를 다양한 카테고리로 분류하고 각 카테고리에 라벨을 할당하는 분류자 모델이 설계되었습니다.

기계 학습에는 두 가지 유형의 분류가 있습니다.

    이진 분류: 문제에 가능한 클래스가 두 개만 있는 경우 이진 분류자라고 합니다. 예를 들어 고양이나 개, 예 또는 아니요,다중 클래스 분류: 문제에 가능한 클래스가 2개 이상인 경우 다중 클래스 분류기입니다.

널리 사용되는 분류 알고리즘은 다음과 같습니다.

a) 로지스틱 회귀

로지스틱 회귀는 기계 학습의 분류 문제를 해결하는 데 사용됩니다. 이는 선형 회귀와 유사하지만 범주형 변수를 예측하는 데 사용됩니다. Yes 또는 No, 0 또는 1, True 또는 False 등으로 출력을 예측할 수 있습니다. 그러나 정확한 값을 제공하는 대신 0과 1 사이의 확률적 값을 제공합니다.

b) 서포트 벡터 머신

SVM(Support Vector Machine)은 널리 사용되는 기계 학습 알고리즘으로 분류 및 회귀 작업에 널리 사용됩니다. 그러나 구체적으로 분류 문제를 해결하는 데 사용됩니다. SVM의 주요 목표는 데이터 포인트를 클래스로 분리할 수 있는 N차원 공간에서 최상의 결정 경계를 찾는 것이며, 최상의 결정 경계를 초평면(Hyperplane)이라고 합니다. SVM은 초평면을 찾기 위해 극한 벡터를 선택하며, 이러한 벡터를 서포트 벡터라고 합니다.

기계 학습 모델

c) 나이브 베이즈

Naïve Bayes는 기계 학습에 사용되는 또 다른 인기 있는 분류 알고리즘입니다. 이는 베이즈 정리를 기반으로 하고 다음과 같이 주어진 특성 간의 순진한(독립적) 가정을 따르기 때문에 그렇게 불립니다.

기계 학습 모델

각각의 순진한 베이즈 분류기는 특정 변수의 값이 다른 변수/특성과 독립적이라고 가정합니다. 예를 들어 과일을 색깔, 모양, 맛에 따라 분류해야 하는 경우입니다. 그래서 노란색, 타원형, 달콤한 색이 망고로 인식됩니다. 여기서 각 기능은 다른 기능과 독립적입니다.

2. 비지도 머신러닝 모델

비지도 머신러닝 모델은 지도 학습과 반대되는 학습 프로세스를 구현합니다. 즉, 모델이 레이블이 지정되지 않은 교육 데이터 세트에서 학습할 수 있음을 의미합니다. 모델은 레이블이 지정되지 않은 데이터 세트를 기반으로 출력을 예측합니다. 비지도 학습을 사용하여 모델은 감독 없이 데이터 세트에서 숨겨진 패턴을 스스로 학습합니다.

비지도 학습 모델은 주로 다음과 같은 세 가지 작업을 수행하는 데 사용됩니다.

    클러스터링
    클러스터링은 유사점과 차이점을 기반으로 데이터 포인트를 다른 클러스터로 클러스터링하거나 그룹화하는 비지도 학습 기술입니다. 유사성이 가장 높은 객체는 동일한 그룹에 남아 있으며 다른 그룹과 유사성이 없거나 거의 없습니다.
    클러스터링 알고리즘은 다음과 같은 다양한 작업에 널리 사용될 수 있습니다. 이미지 세분화, 통계자료 분석, 시장 세분화 , 등.
    일반적으로 사용되는 클러스터링 알고리즘 중 일부는 다음과 같습니다. K-평균 클러스터링, 계층적 클러스터링, DBSCAN , 등.
    기계 학습 모델 연관 규칙 학습
    연관 규칙 학습은 대규모 데이터 세트 내에서 변수 간의 흥미로운 관계를 찾는 비지도 학습 기술입니다. 이 학습 알고리즘의 주요 목표는 한 데이터 항목이 다른 데이터 항목에 대한 종속성을 찾고 그에 따라 해당 변수를 매핑하여 최대 수익을 창출하는 것입니다. 이 알고리즘은 주로 다음과 같은 분야에 적용됩니다. Market Basket 분석, 웹 사용량 마이닝, 지속적인 생산 , 등.
    연관 규칙 학습의 일부 인기 있는 알고리즘은 다음과 같습니다. Apriori 알고리즘, Eclat, FP 성장 알고리즘. 차원 축소
    데이터 세트에 존재하는 특징/변수의 수를 데이터 세트의 차원이라고 하며, 차원을 줄이는 데 사용되는 기술을 차원 축소 기술이라고 합니다.
    더 많은 데이터가 더 정확한 결과를 제공하지만 과적합 문제와 같은 모델/알고리즘의 성능에 영향을 미칠 수도 있습니다. 이러한 경우에는 차원 축소 기술이 사용됩니다.
    ' 더 높은 차원의 데이터 세트를 더 작은 차원의 데이터 세트로 변환하여 유사한 정보를 제공하는 프로세스입니다. .'
    다음과 같은 다양한 차원 축소 방법 PCA(Principal Component Analysis), 특이값 분해(Singular Value Decomposition) 등

강화 학습

강화 학습에서 알고리즘은 목표 상태로 이어지는 특정 상태 세트에 대한 동작을 학습합니다. 환경과 상호작용하여 각 상태나 행동 후에 피드백 신호를 받는 피드백 기반 학습 모델입니다. 이 피드백은 보상(좋은 행동에 대해서는 긍정적이고 나쁜 행동에 대해서는 부정적)으로 작용하며, 에이전트의 목표는 긍정적인 보상을 극대화하여 성과를 향상시키는 것입니다.

강화 학습에서 모델의 동작은 인간 학습과 유사합니다. 인간은 피드백으로서의 경험을 통해 사물을 학습하고 환경과 상호 작용합니다.

강화 학습에 사용되는 몇 가지 인기 있는 알고리즘은 다음과 같습니다.

    Q-학습:Q-러닝은 벨만 방정식을 기반으로 하는 인기 있는 모델 없는 강화 학습 알고리즘 중 하나입니다.

특정 상황에서 AI 에이전트가 보상을 극대화하기 위해 최선의 조치를 취하도록 도울 수 있는 정책을 학습하는 것을 목표로 합니다. 이는 주어진 상태 경로를 따르는 데 대한 보상을 나타내는 각 상태-작업 쌍에 대한 Q 값을 통합하고 Q 값을 최대화하려고 시도합니다.

    국가-행동-보상-국가-행동(SARSA):SARSA는 Markov 결정 프로세스를 기반으로 하는 On-policy 알고리즘입니다. Q-값을 학습하기 위해 현재 정책에 의해 수행되는 작업을 사용합니다. SARSA 알고리즘은 다음과 같습니다. 상태 동작 보상 상태 동작은 튜플(s, a, r, s', a')을 상징합니다. 딥 Q 네트워크:DQN 또는 Deep Q 신경망은 Q-학습입니다. 신경망 내에서. 이는 기본적으로 Q 테이블을 정의하는 것이 복잡한 작업인 대규모 상태 공간 환경에서 사용됩니다. 따라서 이러한 경우 신경망은 Q-table을 사용하는 대신 상태를 기반으로 각 작업에 대한 Q-값을 사용합니다.

머신러닝 모델 훈련

머신러닝 모델이 구축되면 적절한 결과를 얻기 위해 학습됩니다. 머신러닝 모델을 훈련하려면 엄청난 양의 사전 처리된 데이터가 필요합니다. 여기서 전처리된 데이터는 Null 값 등이 감소된 구조화된 형태의 데이터를 의미합니다. 전처리된 데이터를 제공하지 않으면 모델이 형편없는 성능을 발휘할 가능성이 큽니다.

최고의 모델을 선택하는 방법은 무엇입니까?

위 섹션에서는 다양한 기계 학습 모델과 알고리즘에 대해 논의했습니다. 그러나 초보자에게 발생할 수 있는 가장 혼란스러운 질문 중 하나는 '어떤 모델을 선택해야 합니까?'입니다. 따라서 대답은 주로 비즈니스 요구 사항이나 프로젝트 요구 사항에 따라 다르다는 것입니다. 이 외에도 관련 속성, 사용 가능한 데이터 세트의 양, 기능 수, 복잡성 등에 따라 달라집니다. 그러나 실제로는 항상 특정 모델에 적용할 수 있는 가장 간단한 모델부터 시작하는 것이 좋습니다. 그런 다음 매개변수 조정 및 교차 검증을 통해 점차적으로 복잡성을 높이고 정확도를 테스트합니다.

기계 학습 모델과 알고리즘의 차이점

초보자들 사이에서 가장 혼란스러운 질문 중 하나는 기계 학습 모델이고 알고리즘이 동일하다는 것입니다. 왜냐하면 기계 학습과 데이터 과학의 다양한 경우에 이 두 용어가 같은 의미로 사용되기 때문입니다.

이 질문에 대한 대답은 '아니오'이며, 기계 학습 모델은 알고리즘과 동일하지 않습니다. 간단한 방법으로, ML 알고리즘은 데이터에서 패턴을 발견하기 위해 실행되는 절차나 방법과 같습니다. 모델을 생성합니다. 동시에, 기계 학습 모델은 출력을 생성하거나 예측하는 컴퓨터 프로그램과 같습니다. . 더 구체적으로 말하면, 데이터로 알고리즘을 훈련하면 모델이 됩니다.

 Machine Learning Model = Model Data + Prediction Algorithm