logo

기계 학습의 유형

머신러닝은 AI의 하위 집합으로, 기계가 데이터로부터 자동으로 학습하고, 과거 경험을 바탕으로 성능을 개선하고, 예측할 수 있게 해줍니다. . 기계 학습에는 엄청난 양의 데이터에 대해 작동하는 일련의 알고리즘이 포함되어 있습니다. 데이터는 이러한 알고리즘에 공급되어 훈련되고, 훈련을 기반으로 모델을 구축하고 특정 작업을 수행합니다.

기계 학습의 유형

이러한 ML 알고리즘은 회귀, 분류, 예측, 클러스터링, 연관 등과 같은 다양한 비즈니스 문제를 해결하는 데 도움이 됩니다.

학습 방법과 방법에 따라 기계 학습은 주로 다음과 같은 네 가지 유형으로 구분됩니다.

자바 컬렉션 프레임워크
  1. 지도 머신러닝
  2. 비지도 기계 학습
  3. 준지도 기계 학습
  4. 강화 학습
기계 학습의 유형

이 주제에서는 각각의 알고리즘과 함께 기계 학습 유형에 대한 자세한 설명을 제공합니다.

1. 지도 머신러닝

이름에서 알 수 있듯이, 감독형 기계 학습 감독을 기반으로 한다. 이는 지도 학습 기술에서 '레이블이 지정된' 데이터 세트를 사용하여 기계를 훈련하고 훈련을 기반으로 기계가 출력을 예측한다는 의미입니다. 여기서 레이블이 지정된 데이터는 일부 입력이 이미 출력에 매핑되었음을 지정합니다. 더 중요하게는 다음과 같이 말할 수 있습니다. 먼저 입력과 해당 출력으로 기계를 훈련한 다음 테스트 데이터 세트를 사용하여 기계에 출력을 예측하도록 요청합니다.

예를 들어 지도 학습을 이해해 보겠습니다. 고양이와 개 이미지의 입력 데이터세트가 있다고 가정합니다. 그래서 먼저 기계가 이미지를 이해할 수 있도록 훈련을 제공하겠습니다. 고양이와 개의 꼬리 모양 및 크기, 눈 모양, 색깔, 키(개는 더 크고 고양이는 더 작음) 등 훈련이 완료된 후 고양이 사진을 입력하고 기계에 물체를 식별하고 출력을 예측하도록 요청합니다. 이제 기계는 잘 훈련되어 키, 모양, 색상, 눈, 귀, 꼬리 등과 같은 개체의 모든 특징을 확인하고 고양이임을 알아냅니다. 그래서 고양이 카테고리에 넣게 됩니다. 이는 지도 학습에서 기계가 객체를 식별하는 과정입니다.

지도 학습 기술의 주요 목표는 입력 변수(x)를 출력 변수(y)와 매핑하는 것입니다. 지도 학습의 실제 적용 사례는 다음과 같습니다. 위험 평가, 사기 탐지, 스팸 필터링, 등.

지도 기계 학습의 카테고리

지도형 기계 학습은 다음과 같은 두 가지 유형의 문제로 분류될 수 있습니다.

    분류 회귀

가) 분류

분류 알고리즘은 ''와 같이 출력 변수가 범주형인 분류 문제를 해결하는 데 사용됩니다. 예' 또는 아니오, 남성 또는 여성, 빨간색 또는 파란색 등 . 분류 알고리즘은 데이터세트에 존재하는 카테고리를 예측합니다. 분류 알고리즘의 실제 사례는 다음과 같습니다. 스팸 감지, 이메일 필터링 등

몇 가지 널리 사용되는 분류 알고리즘은 다음과 같습니다.

    랜덤 포레스트 알고리즘 의사결정 트리 알고리즘 로지스틱 회귀 알고리즘 지원 벡터 머신 알고리즘

b) 회귀

회귀 알고리즘은 입력 변수와 출력 변수 사이에 선형 관계가 있는 회귀 문제를 해결하는 데 사용됩니다. 이는 시장 동향, 날씨 예측 등과 같은 연속 출력 변수를 예측하는 데 사용됩니다.

일부 인기 있는 회귀 알고리즘은 다음과 같습니다.

    단순 선형 회귀 알고리즘 다변량 회귀 알고리즘 의사결정 트리 알고리즘 올가미 회귀

지도 학습의 장점과 단점

장점:

  • 지도 학습은 레이블이 지정된 데이터 세트와 함께 작동하므로 객체 클래스에 대한 정확한 아이디어를 얻을 수 있습니다.
  • 이러한 알고리즘은 이전 경험을 기반으로 출력을 예측하는 데 도움이 됩니다.

단점:

  • 이러한 알고리즘은 복잡한 작업을 해결할 수 없습니다.
  • 테스트 데이터가 훈련 데이터와 다르면 잘못된 출력을 예측할 수 있습니다.
  • 알고리즘을 훈련하려면 많은 계산 시간이 필요합니다.

지도 학습의 응용

지도 학습의 몇 가지 일반적인 응용 프로그램은 다음과 같습니다.

자바는 난수를 생성
    이미지 분할:
    지도 학습 알고리즘은 이미지 분할에 사용됩니다. 이 과정에서는 미리 정의된 레이블이 있는 다양한 이미지 데이터에 대해 이미지 분류가 수행됩니다.의학적 진단:
    지도 알고리즘은 의료 분야에서도 진단 목적으로 사용됩니다. 이는 질병 상태에 대한 라벨이 포함된 의료 이미지 및 과거 라벨 데이터를 사용하여 수행됩니다. 이러한 과정을 통해 기계는 새로운 환자의 질병을 식별할 수 있다.사기 탐지 -지도 학습 분류 알고리즘은 사기 거래, 사기 고객 등을 식별하는 데 사용됩니다. 이는 과거 데이터를 사용하여 사기로 이어질 수 있는 패턴을 식별함으로써 수행됩니다.스팸 감지 -스팸 탐지 및 필터링에는 분류 알고리즘이 사용됩니다. 이러한 알고리즘은 이메일을 스팸인지 스팸이 아닌지 분류합니다. 스팸 이메일은 스팸 폴더로 전송됩니다.음성 인식 -지도 학습 알고리즘은 음성 인식에도 사용됩니다. 알고리즘은 음성 데이터로 훈련되며 이를 사용하여 음성 활성화 비밀번호, 음성 명령 등과 같은 다양한 식별을 수행할 수 있습니다.

2. 비지도 머신러닝

비지도 학습 g는 지도 학습 기술과 다릅니다. 이름에서 알 수 있듯이 감독이 필요하지 않습니다. 이는 비지도 기계 학습에서 기계가 레이블이 지정되지 않은 데이터 세트를 사용하여 훈련되고 기계가 감독 없이 출력을 예측한다는 것을 의미합니다.

비지도 학습에서 모델은 분류되거나 라벨이 지정되지 않은 데이터로 훈련되며, 모델은 감독 없이 해당 데이터에 대해 작동합니다.

비지도 학습 알고리즘의 주요 목표는 유사성, 패턴 및 차이점에 따라 정렬되지 않은 데이터 세트를 그룹화하거나 분류하는 것입니다. 기계는 입력 데이터 세트에서 숨겨진 패턴을 찾도록 지시받습니다.

좀 더 소중하게 이해하기 위해 예를 들어보겠습니다. 과일 이미지 바구니가 있고 이를 기계 학습 모델에 입력한다고 가정합니다. 이미지는 모델에게 전혀 알려지지 않으며 기계의 임무는 물체의 패턴과 범주를 찾는 것입니다.

이제 기계는 색상 차이, 모양 차이와 같은 패턴과 차이점을 발견하고 테스트 데이터 세트로 테스트할 때 출력을 예측합니다.

비지도 기계 학습의 카테고리

비지도 학습은 다음과 같이 두 가지 유형으로 더 분류될 수 있습니다.

    클러스터링 협회

1) 클러스터링

클러스터링 기법은 데이터에서 고유한 그룹을 찾고 싶을 때 사용됩니다. 이는 유사성이 가장 높은 객체가 한 그룹에 남아 있고 다른 그룹의 객체와 유사성이 적거나 전혀 없도록 객체를 클러스터로 그룹화하는 방법입니다. 클러스터링 알고리즘의 예로는 구매 행동에 따라 고객을 그룹화하는 것입니다.

널리 사용되는 클러스터링 알고리즘 중 일부는 다음과 같습니다.

    K-평균 클러스터링 알고리즘 평균 이동 알고리즘 DBSCAN 알고리즘 주요 구성 요소 분석 독립 성분 분석

2) 협회

연관 규칙 학습은 대규모 데이터 세트 내에서 변수 간의 흥미로운 관계를 찾는 비지도 학습 기술입니다. 이 학습 알고리즘의 주요 목표는 한 데이터 항목이 다른 데이터 항목에 대한 종속성을 찾고 그에 따라 해당 변수를 매핑하여 최대 수익을 창출하는 것입니다. 이 알고리즘은 주로 다음과 같은 분야에 적용됩니다. Market Basket 분석, 웹 사용량 마이닝, 지속적인 생산 , 등.

연관 규칙 학습의 일부 인기 있는 알고리즘은 다음과 같습니다. Apriori 알고리즘, Eclat, FP 성장 알고리즘.

비지도 학습 알고리즘의 장점과 단점

장점:

  • 이러한 알고리즘은 레이블이 지정되지 않은 데이터 세트에서 작동하기 때문에 감독된 알고리즘에 비해 복잡한 작업에 사용할 수 있습니다.
  • 비지도 알고리즘은 레이블이 있는 데이터 세트에 비해 레이블이 없는 데이터 세트를 얻는 것이 더 쉽기 때문에 다양한 작업에 선호됩니다.

단점:

  • 비지도 알고리즘의 출력은 데이터 세트에 레이블이 지정되지 않고 알고리즘이 사전에 정확한 출력으로 훈련되지 않기 때문에 정확도가 떨어질 수 있습니다.
  • 비지도 학습 작업은 출력과 매핑되지 않는 레이블이 없는 데이터 세트와 함께 작동하므로 더 어렵습니다.

비지도 학습의 응용

    네트워크 분석:비지도 학습은 학술 논문의 텍스트 데이터에 대한 문서 네트워크 분석에서 표절 및 저작권을 식별하는 데 사용됩니다.추천 시스템:추천 시스템은 다양한 웹 애플리케이션 및 전자상거래 웹사이트를 위한 추천 애플리케이션을 구축하기 위해 비지도 학습 기술을 널리 사용합니다.이상 탐지:이상 탐지는 비지도 학습의 널리 사용되는 애플리케이션으로, 데이터 세트 내의 비정상적인 데이터 포인트를 식별할 수 있습니다. 사기 거래를 발견하는 데 사용됩니다.특이값 분해:SVD(Singular Value Decomposition)는 데이터베이스에서 특정 정보를 추출하는 데 사용됩니다. 예를 들어, 특정 위치에 있는 각 사용자의 정보를 추출합니다.

3. 준지도 학습

준지도 학습(Semi-Supervised Learning)은 지도(Supervised) 기계 학습과 비지도(Unsupervised) 기계 학습 사이에 있는 기계 학습 알고리즘의 한 유형입니다. . 지도 학습(레이블이 있는 훈련 데이터 있음)과 비지도 학습(레이블이 있는 훈련 데이터 없음) 알고리즘 사이의 중간 기반을 나타내며 훈련 기간 동안 레이블이 있는 데이터 세트와 레이블이 없는 데이터 세트의 조합을 사용합니다.

준지도 학습(Semi-supervised learning)은 지도 학습과 비지도 학습의 중간 지점으로 몇 개의 레이블로 구성된 데이터를 기반으로 작동하지만 대부분 레이블이 없는 데이터로 구성됩니다. 라벨은 비용이 많이 들지만 기업 목적으로 라벨이 거의 없을 수 있습니다. 라벨의 존재 여부에 따라 지도 학습 및 비지도 학습과 완전히 다릅니다.

지도 학습과 비지도 학습 알고리즘의 단점을 극복하기 위해 준지도 학습(Semi-supervised learning)이라는 개념이 도입되었습니다. . 준지도 학습의 주요 목표는 지도 학습처럼 레이블이 지정된 데이터만 사용하는 것이 아니라 사용 가능한 모든 데이터를 효과적으로 사용하는 것입니다. 처음에는 유사한 데이터를 비지도 학습 알고리즘과 함께 클러스터링하고, 나아가 레이블이 없는 데이터를 레이블이 있는 데이터로 레이블링하는 데 도움이 됩니다. 레이블이 있는 데이터는 레이블이 없는 데이터보다 상대적으로 비용이 많이 들기 때문입니다.

예를 들어 이러한 알고리즘을 상상할 수 있습니다. 감독 학습은 학생이 집과 대학에서 강사의 감독을 받는 학습입니다. 또한 해당 학생이 강사의 도움 없이 동일한 개념을 자체 분석하는 경우 비지도 학습에 해당됩니다. 준지도 학습에서는 학생이 대학 강사의 지도를 받아 동일한 개념을 분석한 후 스스로 수정해야 합니다.

준지도 학습의 장점과 단점

장점:

  • 알고리즘을 이해하는 것은 간단하고 쉽습니다.
  • 매우 효율적입니다.
  • 지도 학습 및 비지도 학습 알고리즘의 단점을 해결하는 데 사용됩니다.

단점:

  • 반복 결과가 안정적이지 않을 수 있습니다.
  • 이러한 알고리즘을 네트워크 수준 데이터에는 적용할 수 없습니다.
  • 정확도가 낮습니다.

4. 강화 학습

강화 학습은 피드백 기반 프로세스에서 작동합니다. AI 에이전트(소프트웨어 구성 요소)가 타격 및 추적, 조치 수행, 경험을 통한 학습 및 성능 향상을 통해 자동으로 주변을 탐색합니다. 에이전트는 각각의 좋은 행동에 대해 보상을 받고 각각의 나쁜 행동에 대해 처벌을 받습니다. 따라서 강화학습 에이전트의 목표는 보상을 최대화하는 것입니다.

강화 학습에는 지도 학습과 같은 레이블이 지정된 데이터가 없으며 에이전트는 자신의 경험을 통해서만 학습합니다.

강화 학습 과정은 인간과 유사합니다. 예를 들어, 아이는 일상생활의 경험을 통해 다양한 것을 배웁니다. 강화 학습의 예는 게임을 하는 것입니다. 여기서 게임은 환경이고, 각 단계에서 에이전트의 움직임은 상태를 정의하며, 에이전트의 목표는 높은 점수를 얻는 것입니다. 에이전트는 처벌과 보상 측면에서 피드백을 받습니다.

부락 오즈시비트

강화학습은 작동 방식으로 인해 다음과 같은 다양한 분야에서 사용됩니다. 게임 이론, 운영 연구, 정보 이론, 다중 에이전트 시스템.

강화 학습 문제는 다음을 사용하여 공식화될 수 있습니다. 마르코프 결정 프로세스(MDP). MDP에서 에이전트는 지속적으로 환경과 상호 작용하고 작업을 수행합니다. 각 작업에서 환경은 응답하고 새로운 상태를 생성합니다.

강화 학습의 카테고리

강화 학습은 주로 두 가지 유형의 방법/알고리즘으로 분류됩니다.

    긍정적 강화 학습:긍정적 강화 학습은 무언가를 추가함으로써 필요한 행동이 다시 발생하는 경향을 증가시키는 것을 지정합니다. 이는 에이전트의 행동 강도를 강화하고 긍정적인 영향을 미칩니다.부정적 강화 학습:음성 강화 학습은 양성 RL과 정반대로 작동합니다. 부정적인 조건을 회피함으로써 특정 행동이 다시 발생하는 경향을 증가시킵니다.

강화 학습의 실제 사용 사례

    비디오 게임:
    RL 알고리즘은 게임 응용 프로그램에서 매우 널리 사용됩니다. 초인적인 성능을 얻기 위해 사용됩니다. RL 알고리즘을 사용하는 일부 인기 게임은 다음과 같습니다. 알파고 그리고 알파고 제로 .자원 관리:
    '심층 강화 학습을 통한 자원 관리' 논문에서는 평균 작업 속도 저하를 최소화하기 위해 컴퓨터에서 RL을 사용하여 자동으로 학습하고 리소스를 예약하여 다양한 작업을 기다리는 방법을 보여주었습니다.로봇공학:
    RL은 로봇공학 응용 분야에서 널리 사용되고 있습니다. 로봇은 산업 및 제조 분야에서 사용되며, 이러한 로봇은 강화학습을 통해 더욱 강력해집니다. AI와 머신러닝 기술을 사용하여 지능형 로봇을 구축하려는 비전을 가진 다양한 산업이 있습니다.텍스트 마이닝
    NLP의 훌륭한 응용 프로그램 중 하나인 텍스트 마이닝은 이제 Salesforce 회사의 강화 학습의 도움으로 구현되고 있습니다.

강화 학습의 장점과 단점

장점

  • 일반적인 기술로는 해결하기 어려운 복잡한 현실 문제를 해결하는 데 도움이 됩니다.
  • RL의 학습 모델은 인간의 학습과 유사합니다. 따라서 가장 정확한 결과를 찾을 수 있습니다.
  • 장기적인 결과를 달성하는 데 도움이 됩니다.

불리

  • RL 알고리즘은 간단한 문제에는 선호되지 않습니다.
  • RL 알고리즘에는 막대한 데이터와 계산이 필요합니다.
  • 강화 학습이 너무 많으면 상태 과부하가 발생하여 결과가 약화될 수 있습니다.

차원의 저주는 실제 물리적 시스템에 대한 강화 학습을 제한합니다.