기계 학습의 유형

머신러닝은 인공지능 컴퓨터가 모든 작업에 대해 명시적으로 프로그래밍하지 않고도 데이터에서 학습하고 이전 경험을 통해 개선할 수 있는 모델 및 알고리즘 개발에 중점을 둡니다. 간단히 말해서 ML은 데이터를 학습하여 시스템이 인간처럼 생각하고 이해하도록 가르칩니다.

이번 글에서는 다양한 내용을 알아보겠습니다. 종류 기계 학습 알고리즘 이는 향후 요구 사항에 중요합니다. 기계 학습 일반적으로 과거 경험으로부터 배우고 시간이 지남에 따라 성과를 향상시키는 훈련 시스템입니다. 기계 학습 방대한 양의 데이터를 예측하는 데 도움이 됩니다. 빠르고 정확한 결과를 제공하여 수익성 있는 기회를 얻는 데 도움이 됩니다.

기계 학습에는 여러 유형이 있으며 각각 특별한 특성과 응용 프로그램이 있습니다. 기계 학습 알고리즘의 주요 유형 중 일부는 다음과 같습니다.

지도 머신러닝
비지도 기계 학습
준지도 기계 학습
강화 학습

기계 학습의 유형

1. 지도 머신러닝

지도 학습 모델이 훈련을 받는 것으로 정의됩니다. 라벨이 지정된 데이터세트 . 라벨이 지정된 데이터세트에는 입력 매개변수와 출력 매개변수가 모두 있습니다. ~ 안에 지도 학습 알고리즘은 입력과 올바른 출력 사이의 지점을 매핑하는 방법을 학습합니다. 여기에는 레이블이 지정된 훈련 및 검증 데이터 세트가 모두 있습니다.

지도 학습

예를 들어 이해해 봅시다.

예: 고양이와 개를 구별하기 위해 이미지 분류기를 구축해야 하는 시나리오를 생각해 보세요. 개와 고양이의 라벨이 붙은 이미지 데이터세트를 알고리즘에 입력하면 기계는 라벨이 붙은 이미지에서 개와 고양이를 분류하는 방법을 학습합니다. 이전에 본 적이 없는 새로운 개나 고양이 이미지를 입력하면 학습된 알고리즘을 사용하여 개가 개인지 고양이인지 예측합니다. 이것이 방법이다 지도 학습 작동하며 이는 특히 이미지 분류입니다.

자바 컬렉션 프레임워크

지도 학습에는 아래에 언급된 두 가지 주요 범주가 있습니다.

분류
회귀

분류

분류 예측을 다룬다 범주형 개별 클래스 또는 레이블을 나타내는 대상 변수. 예를 들어 이메일을 스팸인지 스팸이 아닌지 분류하거나 환자의 심장병 위험이 높은지 예측하는 등의 작업을 수행할 수 있습니다. 분류 알고리즘은 입력 기능을 사전 정의된 클래스 중 하나에 매핑하는 방법을 학습합니다.

다음은 몇 가지 분류 알고리즘입니다.

회귀

회귀 , 반면에 예측을 다룹니다. 마디 없는 숫자 값을 나타내는 대상 변수입니다. 예를 들어 주택의 크기, 위치, 편의 시설을 기준으로 주택 가격을 예측하거나 제품 판매를 예측합니다. 회귀 알고리즘은 입력 특성을 연속적인 숫자 값에 매핑하는 방법을 학습합니다.

다음은 몇 가지 회귀 알고리즘입니다.

선형 회귀
다항식 회귀
능선 회귀
올가미 회귀
의사결정 트리
랜덤 포레스트

지도 머신러닝의 장점

지도 학습 모델은 학습을 통해 높은 정확도를 가질 수 있습니다. 라벨이 지정된 데이터 .
지도 학습 모델의 의사 결정 과정은 해석 가능한 경우가 많습니다.
새로운 모델을 처음부터 개발할 때 시간과 리소스를 절약하는 사전 훈련된 모델에 자주 사용될 수 있습니다.

지도 머신러닝의 단점

패턴을 아는 데에는 한계가 있으며 훈련 데이터에 없는 보이지 않거나 예상치 못한 패턴으로 인해 어려움을 겪을 수 있습니다.
의존하기 때문에 시간과 비용이 많이 들 수 있습니다. 라벨이 붙은 데이터만.
이는 새로운 데이터를 기반으로 한 잘못된 일반화로 이어질 수 있습니다.

지도 학습의 응용

지도 학습은 다음을 포함하여 다양한 응용 분야에서 사용됩니다.

이미지 분류 : 이미지 속 사물, 얼굴, 기타 특징을 식별합니다.
자연어 처리: 감정, 엔터티, 관계 등 텍스트에서 정보를 추출합니다.
음성 인식 : 음성 언어를 텍스트로 변환합니다.
추천 시스템 : 사용자에게 맞춤형 추천을 제공합니다.
예측 분석 : 매출, 고객 이탈, 주가 등의 결과를 예측합니다.
의료 진단 : 질병 및 기타 의학적 상태를 감지합니다.
사기 탐지 : 사기 거래를 식별합니다.
자율주행차 : 주변의 사물을 인식하고 반응합니다.
이메일 스팸 감지 : 이메일을 스팸인지 스팸이 아닌지 분류합니다.
제조 품질 관리 : 제품에 결함이 있는지 검사합니다.
신용 점수 : 차용인이 대출을 불이행할 위험을 평가합니다.
노름 : 캐릭터를 인식하고, 플레이어의 행동을 분석하고, NPC를 생성합니다.
고객 지원 : 고객 지원 작업을 자동화합니다.
일기 예보 : 기온, 강수량, 기타 기상 매개변수를 예측합니다.
스포츠 분석 : 플레이어의 성과를 분석하고 게임 예측을 하며 전략을 최적화합니다.

2. 비지도 머신러닝

비지도 학습 비지도 학습은 알고리즘이 레이블이 지정되지 않은 데이터를 사용하여 패턴과 관계를 발견하는 일종의 기계 학습 기술입니다. 지도 학습과 달리 비지도 학습은 알고리즘에 라벨이 지정된 목표 출력을 제공하지 않습니다. 비지도 학습의 주요 목표는 종종 데이터 내에서 숨겨진 패턴, 유사성 또는 클러스터를 발견하는 것이며, 이는 데이터 탐색, 시각화, 차원 축소 등과 같은 다양한 목적으로 사용될 수 있습니다.

비지도 학습

예를 들어 이해해 봅시다.

예: 상점에서 구매한 항목에 대한 정보가 포함된 데이터세트가 있다고 가정해 보세요. 클러스터링을 통해 알고리즘은 귀하와 다른 고객 간의 동일한 구매 행동을 그룹화할 수 있으며, 이를 통해 사전 정의된 레이블 없이 잠재 고객을 밝힐 수 있습니다. 이러한 유형의 정보는 기업이 목표 고객을 확보하고 이상치를 식별하는 데 도움이 될 수 있습니다.

비지도 학습에는 아래에 언급된 두 가지 주요 범주가 있습니다.

클러스터링
협회

클러스터링

클러스터링 유사성을 기준으로 데이터 포인트를 클러스터로 그룹화하는 프로세스입니다. 이 기술은 레이블이 지정된 예 없이 데이터의 패턴과 관계를 식별하는 데 유용합니다.

다음은 몇 가지 클러스터링 알고리즘입니다.

K-평균 클러스터링 알고리즘
평균 이동 알고리즘
DBSCAN 알고리즘
주요 구성 요소 분석
독립 성분 분석

협회

연관 규칙 학습 ing은 데이터 세트의 항목 간의 관계를 검색하는 기술입니다. 이는 한 항목의 존재를 나타내는 규칙을 식별하며 특정 확률을 가진 다른 항목의 존재를 의미합니다.

다음은 몇 가지 연관 규칙 학습 알고리즘입니다.

아프리오리 알고리즘
불타는 듯한 빛깔
FP 성장 알고리즘

비지도 머신러닝의 장점

데이터 간의 숨겨진 패턴과 다양한 관계를 발견하는 데 도움이 됩니다.
등의 작업에 사용됩니다. 고객 세분화, 이상 징후 탐지, 그리고 데이터 탐색 .
레이블이 지정된 데이터가 필요하지 않으며 데이터 레이블 지정 노력이 줄어듭니다.

비지도 머신러닝의 단점

레이블을 사용하지 않으면 모델 출력의 품질을 예측하기 어려울 수 있습니다.
클러스터 해석 가능성이 명확하지 않을 수 있으며 의미 있는 해석이 없을 수 있습니다.
등의 기술을 갖고 있습니다. 자동 인코더 그리고 차원 축소 원시 데이터에서 의미 있는 특징을 추출하는 데 사용할 수 있습니다.

비지도 학습의 응용

비지도 학습의 몇 가지 일반적인 응용 프로그램은 다음과 같습니다.

자바는 난수를 생성

클러스터링 : 유사한 데이터 포인트를 클러스터로 그룹화합니다.
이상 탐지 : 데이터의 특이점이나 이상치를 식별합니다.
차원성 감소 : 필수 정보를 보존하면서 데이터의 차원을 줄입니다.
추천 시스템 : 과거의 행동이나 선호도를 바탕으로 사용자에게 제품, 영화, 콘텐츠를 제안합니다.
주제 모델링 : 문서 모음 내에서 숨겨진 주제를 찾아보세요.
밀도 추정 : 데이터의 확률밀도함수를 추정합니다.
이미지 및 비디오 압축 : 멀티미디어 콘텐츠에 필요한 저장 공간을 줄입니다.
데이터 전처리 : 데이터 정리, 결측값 대치, 데이터 스케일링 등의 데이터 전처리 작업에 도움을 줍니다.
시장 바구니 분석 : 제품 간의 연관성을 찾아보세요.
게놈 데이터 분석 : 유사한 발현 프로파일을 갖는 패턴 또는 그룹 유전자를 식별합니다.
이미지 분할 : 이미지를 의미 있는 영역으로 분할합니다.
소셜 네트워크에서 커뮤니티 감지 : 유사한 관심사나 연결을 가진 개인의 커뮤니티 또는 그룹을 식별합니다.
고객 행동 분석 : 더 나은 마케팅 및 제품 추천을 위한 패턴과 통찰력을 찾아보세요.
콘텐츠 추천 : 유사한 상품을 사용자에게 보다 쉽게 추천할 수 있도록 콘텐츠를 분류하고 태그합니다.
탐색적 데이터 분석(EDA) : 특정 작업을 정의하기 전에 데이터를 탐색하고 통찰력을 얻으세요.

3. 준지도 학습

준지도 학습 사이에서 작동하는 기계 학습 알고리즘입니다. 감독되는 것과 감독되지 않는 것 학습하여 둘 다 사용합니다. 라벨이 붙은 것과 라벨이 붙지 않은 것 데이터. 이는 레이블이 지정된 데이터를 얻는 데 비용이 많이 들고, 시간이 많이 걸리거나 리소스 집약적일 때 특히 유용합니다. 이 접근 방식은 데이터 세트가 비싸고 시간이 많이 걸리는 경우에 유용합니다. 준지도 학습은 레이블이 지정된 데이터를 훈련하거나 학습하기 위해 기술과 관련 리소스가 필요한 경우 선택됩니다.

약간의 레이블이 지정되어 있고 나머지 대부분은 레이블이 지정되지 않은 데이터를 처리할 때 이러한 기술을 사용합니다. 비지도 기법을 사용하여 라벨을 예측한 다음 이러한 라벨을 지도 기법에 제공할 수 있습니다. 이 기술은 일반적으로 모든 이미지에 레이블이 지정되지 않는 이미지 데이터 세트의 경우에 주로 적용 가능합니다.

준지도 학습

예를 들어 이해해 봅시다.

예 : 우리가 언어 번역 모델을 구축하고 있다고 생각해보세요. 모든 문장 쌍에 대해 라벨이 붙은 번역은 리소스 집약적일 수 있습니다. 이를 통해 모델은 레이블이 지정된 문장과 레이블이 지정되지 않은 문장 쌍에서 학습하여 더욱 정확해집니다. 이 기술을 통해 기계 번역 서비스의 품질이 크게 향상되었습니다.

준지도 학습 방법의 유형

각각 고유한 특성을 지닌 다양한 준지도 학습 방법이 있습니다. 가장 일반적인 것 중 일부는 다음과 같습니다.

그래프 기반 준지도 학습: 이 접근 방식은 그래프를 사용하여 데이터 포인트 간의 관계를 나타냅니다. 그런 다음 그래프는 레이블이 지정된 데이터 포인트에서 레이블이 지정되지 않은 데이터 포인트로 레이블을 전파하는 데 사용됩니다.
라벨 전파: 이 접근 방식은 데이터 요소 간의 유사성을 기반으로 레이블이 있는 데이터 요소에서 레이블이 지정되지 않은 데이터 요소로 레이블을 반복적으로 전파합니다.
공동 훈련: 이 접근 방식은 레이블이 지정되지 않은 데이터의 서로 다른 하위 집합에 대해 두 가지 서로 다른 기계 학습 모델을 교육합니다. 그런 다음 두 모델은 서로의 예측에 라벨을 붙이는 데 사용됩니다.
자가 훈련: 이 접근 방식은 레이블이 지정된 데이터에 대해 기계 학습 모델을 교육한 다음 모델을 사용하여 레이블이 지정되지 않은 데이터에 대한 레이블을 예측합니다. 그런 다음 모델은 레이블이 지정된 데이터와 레이블이 지정되지 않은 데이터에 대한 예측 레이블에 대해 재교육됩니다.
생성적 적대 네트워크(GAN) : GAN은 합성 데이터를 생성하는 데 사용할 수 있는 일종의 딥러닝 알고리즘입니다. GAN은 두 개의 신경망(생성기 및 판별기)을 훈련하여 준지도 학습을 위한 레이블이 없는 데이터를 생성하는 데 사용할 수 있습니다.

반지도 기계 학습의 장점

에 비해 더 나은 일반화로 이어집니다. 지도 학습, 레이블이 있는 데이터와 레이블이 지정되지 않은 데이터를 모두 사용하기 때문입니다.
다양한 데이터에 적용할 수 있습니다.

반지도 기계 학습의 단점

준감독 방법은 다른 접근 방식에 비해 구현이 더 복잡할 수 있습니다.
아직은 좀 필요해요 라벨이 지정된 데이터 항상 이용 가능하지 않거나 구하기 쉽지 않을 수도 있습니다.
레이블이 지정되지 않은 데이터는 그에 따라 모델 성능에 영향을 미칠 수 있습니다.

준지도 학습의 응용

준지도 학습의 몇 가지 일반적인 응용 프로그램은 다음과 같습니다.

이미지 분류 및 객체 인식 : 레이블이 지정된 작은 이미지 세트와 레이블이 지정되지 않은 더 큰 이미지 세트를 결합하여 모델의 정확도를 향상시킵니다.
자연어 처리(NLP) : 작은 레이블이 있는 텍스트 데이터 세트와 레이블이 없는 방대한 양의 텍스트를 결합하여 언어 모델 및 분류기의 성능을 향상합니다.
음성 인식: 제한된 양의 전사된 음성 데이터와 레이블이 지정되지 않은 보다 광범위한 오디오 세트를 활용하여 음성 인식의 정확성을 향상시킵니다.
추천 시스템 : 레이블이 지정되지 않은 풍부한 사용자 행동 데이터로 희박한 사용자 항목 상호 작용 집합(레이블이 지정된 데이터)을 보완하여 개인화된 권장 사항의 정확성을 향상합니다.
의료 및 의료 영상 : 레이블이 지정되지 않은 대규모 이미지 세트와 함께 레이블이 지정된 소규모 의료 이미지 세트를 활용하여 의료 이미지 분석을 강화합니다.

4. 강화 기계 학습

강화 기계 학습 알고리즘은 동작을 생성하고 오류를 발견함으로써 환경과 상호 작용하는 학습 방법입니다. 시행착오와 지연 강화 학습의 가장 관련성이 높은 특성입니다. 이 기술에서 모델은 행동이나 패턴을 학습하기 위해 보상 피드백을 사용하여 성능을 계속 향상시킵니다. 이러한 알고리즘은 특정 문제에만 적용됩니다. Google 자율 운전 자동차인 AlphaGo에서는 봇이 바둑 게임에서 점점 더 나은 성과를 내기 위해 인간은 물론 자신과도 경쟁합니다. 우리가 데이터를 입력할 때마다 그들은 학습 데이터인 훈련 데이터인 지식에 데이터를 추가합니다. 따라서 더 많이 배울수록 더 잘 훈련되고 경험하게 됩니다.

다음은 가장 일반적인 강화 학습 알고리즘 중 일부입니다.

Q-학습: Q-학습은 상태를 동작에 매핑하는 Q-함수를 학습하는 모델이 없는 RL 알고리즘입니다. Q-함수는 주어진 상태에서 특정 행동을 취할 때 예상되는 보상을 추정합니다.
SARSA(국가-행동-보상-국가-행동): SARSA는 Q 함수를 학습하는 또 다른 모델 없는 RL 알고리즘입니다. 그러나 Q-learning과 달리 SARSA는 최적의 조치가 아닌 실제로 수행된 조치에 대해 Q-함수를 업데이트합니다.
딥 Q-러닝 : 딥 Q-러닝은 Q-러닝과 딥러닝을 결합한 것입니다. Deep Q-learning은 신경망을 사용하여 Q-함수를 표현하므로 상태와 동작 간의 복잡한 관계를 학습할 수 있습니다.

강화 기계 학습

예를 들어 이해해 봅시다.

예: 당신이 훈련하고 있다고 생각하십시오 일체 포함 체스 같은 게임을 하는 에이전트. 에이전트는 다양한 동작을 탐색하고 결과에 따라 긍정적이거나 부정적인 피드백을 받습니다. 강화 학습은 또한 주변 환경과 상호 작용하여 작업을 수행하는 방법을 배우는 응용 프로그램을 찾습니다.

강화 기계 학습의 유형

강화 학습에는 두 가지 주요 유형이 있습니다.

긍정적 강화

원하는 조치를 취한 에이전트에게 보상을 제공합니다.
상담원이 행동을 반복하도록 장려합니다.
예: 앉은 개에게 간식을 주기, 게임에서 정답을 위한 포인트 제공.

부정적인 강화

원하는 행동을 장려하기 위해 바람직하지 않은 자극을 제거합니다.
상담원이 같은 행동을 반복하지 못하도록 합니다.
예: 레버를 누를 때 큰 부저를 끄고 작업을 완료하여 페널티를 피합니다.

강화 기계 학습의 장점

작업에 적합하고 로봇 공학 및 게임 플레이와 같은 일련의 결정을 내리는 방법을 배울 수 있는 자율적인 의사 결정 기능을 갖추고 있습니다.
이 기술은 달성하기 매우 어려운 장기적인 결과를 얻는 데 선호됩니다.
기존 기술로는 해결할 수 없는 복잡한 문제를 해결하는 데 사용됩니다.

강화 머신러닝의 단점

훈련 강화 학습 에이전트는 계산 비용이 많이 들고 시간이 많이 걸릴 수 있습니다.
강화 학습은 단순한 문제를 해결하는 것보다 바람직하지 않습니다.
많은 양의 데이터와 많은 계산이 필요하므로 비실용적이고 비용이 많이 듭니다.

강화 기계 학습의 응용

강화 학습의 몇 가지 응용 분야는 다음과 같습니다.

게임하기 : RL은 에이전트에게 게임, 심지어 복잡한 게임을 플레이하도록 가르칠 수 있습니다.
로봇공학 : RL은 로봇이 자율적으로 작업을 수행하도록 가르칠 수 있습니다.
자율주행차 : RL은 자율주행차가 길을 찾고 의사결정을 내리는 데 도움을 줄 수 있습니다.
추천 시스템 : RL은 사용자 선호도를 학습하여 추천 알고리즘을 향상시킬 수 있습니다.
보건 의료 : RL은 치료 계획 및 약물 발굴을 최적화하는 데 사용될 수 있습니다.
자연어 처리(NLP) : RL은 대화 시스템과 챗봇에서 사용될 수 있습니다.
금융 및 무역 : RL은 알고리즘 거래에 사용될 수 있습니다.
공급망 및 재고 관리 : RL은 공급망 운영을 최적화하는 데 사용될 수 있습니다.
에너지 관리 : RL을 사용하여 에너지 소비를 최적화할 수 있습니다.
AI 게임 : RL은 비디오 게임에서 보다 지능적이고 적응력이 뛰어난 NPC를 만드는 데 사용될 수 있습니다.
적응형 개인 비서 : RL은 개인 비서를 향상시키는 데 사용될 수 있습니다.
가상 현실(VR) 및 증강 현실(AR): RL은 몰입형 및 대화형 경험을 만드는 데 사용될 수 있습니다.
산업 제어 : RL은 산업 프로세스를 최적화하는 데 사용될 수 있습니다.
교육 : RL은 적응형 학습 시스템을 만드는 데 사용될 수 있습니다.
농업 : RL은 농업 운영을 최적화하는 데 사용될 수 있습니다.

확인해야합니다. 자세한 기사는 다음과 같습니다. : 기계 학습 알고리즘
부락 오즈시비트

결론

결론적으로 각 유형의 머신러닝은 고유한 목적을 달성하고 향상된 데이터 예측 기능 개발의 전반적인 역할에 기여하며 다음과 같은 다양한 산업을 변화시킬 수 있는 잠재력을 가지고 있습니다. 데이터 과학 . 대규모 데이터 생산 및 데이터 세트 관리를 처리하는 데 도움이 됩니다.

기계 학습 유형 – FAQ

1. 지도 학습에서 직면한 과제는 무엇입니까?

지도 학습에서 직면하는 과제 중 일부에는 주로 클래스 불균형, 고품질 레이블이 지정된 데이터 해결, 모델이 실시간 데이터에서 제대로 작동하지 않는 과적합 방지 등이 포함됩니다.

2. 지도 학습을 어디에 적용할 수 있나요?

지도 학습은 일반적으로 스팸 이메일 분석, 이미지 인식, 감정 분석과 같은 작업에 사용됩니다.

3. 머신러닝의 미래 전망은 어떤가요?

미래 전망으로서의 머신러닝은 날씨 또는 기후 분석, 의료 시스템, 자율 모델링과 같은 영역에서 작동할 수 있습니다.

4. 머신러닝에는 어떤 유형이 있나요?

머신러닝에는 세 가지 주요 유형이 있습니다.

지도 학습

비지도 학습

강화 학습

5. 가장 일반적인 기계 학습 알고리즘은 무엇입니까?

가장 일반적인 기계 학습 알고리즘 중 일부는 다음과 같습니다.

선형 회귀

로지스틱 회귀

지원 벡터 머신(SVM)

K-최근접 이웃(KNN)

의사결정 트리

랜덤 포레스트

인공 신경망