logo

신경망이란 무엇입니까?

신경망은 인간 두뇌의 복잡한 기능을 모방한 계산 모델입니다. 신경망은 데이터를 처리하고 학습하는 상호 연결된 노드 또는 뉴런으로 구성되어 기계 학습에서 패턴 인식 및 의사 결정과 같은 작업을 가능하게 합니다. 이 기사에서는 신경망, 작동 방식, 아키텍처 등에 대해 자세히 살펴봅니다.

내용의 테이블



신경망의 진화

1940년대 이후 신경망 분야에서는 다음과 같은 주목할 만한 발전이 많이 이루어졌습니다.

  • 1940년대~1950년대: 초기 개념
    신경망은 McCulloch와 Pitts가 인공 뉴런에 대한 최초의 수학적 모델을 도입하면서 시작되었습니다. 그러나 계산상의 제약으로 인해 진행이 어려워졌습니다.
  • 1960년대~1970년대: 퍼셉트론
    이 시대는 퍼셉트론에 대한 Rosenblatt의 연구로 정의됩니다. 퍼셉트론 선형적으로 개별적으로 해결될 수 있는 문제로 적용 가능성이 제한된 단일 레이어 네트워크입니다.
  • 1980년대: 역전파와 연결주의
    다층 네트워크 Rumelhart, Hinton 및 Williams의 역전파 방법 발명으로 훈련이 가능해졌습니다. 상호 연결된 노드를 통한 학습을 ​​강조하면서 연결주의는 매력을 얻었습니다.
  • 1990년대: 호황과 겨울
    이미지 식별, 금융 및 기타 분야의 애플리케이션을 통해 신경망은 호황을 누렸습니다. 그러나 신경망 연구는 엄청난 계산 비용과 부풀려진 기대로 인해 겨울을 보냈습니다.
  • 2000년대: 부활과 딥러닝
    더 큰 데이터 세트, 혁신적인 구조 및 향상된 처리 기능으로 인해 복귀가 촉진되었습니다. 딥러닝 수많은 레이어를 활용하여 여러 분야에서 놀라운 효율성을 보여왔습니다.
  • 2010년대-현재: 딥러닝의 지배력
    두 가지 딥 러닝 아키텍처인 CNN(컨벌루션 신경망)과 RNN(순환 신경망)이 기계 학습을 지배했습니다. 이들의 힘은 게임, 사진 인식, 자연어 처리 분야의 혁신을 통해 입증되었습니다.

신경망이란 무엇입니까?

신경망 사전 프로그래밍된 이해가 부족하여 데이터에서 식별 기능을 추출합니다. 네트워크 구성요소에는 뉴런, 연결, 가중치, 편향, 전파 함수 및 학습 규칙이 포함됩니다. 뉴런은 임계값과 활성화 함수에 의해 제어되는 입력을 받습니다. 연결에는 정보 전송을 규제하는 가중치와 편향이 포함됩니다. 학습, 가중치 및 편향 조정은 입력 계산, 출력 생성, 다양한 작업에서 네트워크의 숙련도를 향상시키는 반복적 개선의 세 단계로 진행됩니다.

여기에는 다음이 포함됩니다.

  1. 신경망은 새로운 환경으로 시뮬레이션됩니다.
  2. 그런 다음 이 시뮬레이션의 결과로 신경망의 자유 매개변수가 변경됩니다.
  3. 그런 다음 신경망은 자유 매개변수의 변경으로 인해 환경에 새로운 방식으로 반응합니다.
nn-Geeksforgeeks


신경망의 중요성

패턴을 식별하고, 복잡한 퍼즐을 풀고, 변화하는 주변 환경에 적응하는 신경망의 능력은 필수적입니다. 데이터로부터 학습하는 능력은 다음과 같은 기술 혁신에 이르기까지 광범위한 영향을 미칩니다. 자연어 처리 자율주행 자동차를 통해 의사결정 프로세스를 자동화하고 다양한 산업 분야에서 효율성을 높일 수 있습니다. 인공지능의 발전은 혁신을 주도하고 기술의 방향에 영향을 미치는 신경망에 크게 의존합니다.

팬더 표준편차

신경망은 어떻게 작동하나요?

신경망이 어떻게 작동하는지 예를 들어 이해해 보겠습니다.

이메일 분류를 위한 신경망을 고려해보세요. 입력 레이어는 이메일 콘텐츠, 보낸 사람 정보, 제목과 같은 기능을 사용합니다. 조정된 가중치를 곱한 이러한 입력은 숨겨진 레이어를 통과합니다. 네트워크는 훈련을 통해 이메일이 스팸인지 아닌지를 나타내는 패턴을 인식하는 방법을 학습합니다. 이진 활성화 함수를 사용하는 출력 레이어는 이메일이 스팸인지(1) 스팸이 아닌지(0) 예측합니다. 네트워크가 역전파를 통해 반복적으로 가중치를 개선함에 따라 스팸과 합법적인 이메일을 구별하는 데 능숙해지며 이메일 필터링과 같은 실제 애플리케이션에서 신경망의 실용성을 보여줍니다.

신경망 작업

신경망은 인간 두뇌 기능의 일부 기능을 모방하는 복잡한 시스템입니다. 입력층, 하나 이상의 은닉층, 인공뉴런이 결합된 층으로 이루어진 출력층으로 구성된다. 기본 프로세스의 두 단계를 역전파(backpropagation)라고 하며 순방향 전파 .

nn-ar-Geeksforgeeks


ABS C 코드

순방향 전파

  • 입력 레이어: 입력 레이어의 각 기능은 입력 데이터를 수신하는 네트워크의 노드로 표시됩니다.
  • 무게와 연결: 각 뉴런 연결의 가중치는 연결이 얼마나 강한지를 나타냅니다. 훈련 전반에 걸쳐 이러한 가중치가 변경됩니다.
  • 숨겨진 레이어: 각 은닉층 뉴런은 입력에 가중치를 곱하고 더한 다음 활성화 함수를 통해 전달하여 입력을 처리합니다. 이를 통해 비선형성이 도입되어 네트워크가 복잡한 패턴을 인식할 수 있습니다.
  • 산출: 출력 레이어에 도달할 때까지 이 과정을 반복하여 최종 결과가 생성됩니다.

역전파

  • 손실 계산: 네트워크의 출력은 실제 목표 값과 비교하여 평가되며 손실 함수를 사용하여 차이를 계산합니다. 회귀 문제의 경우, 평균 제곱 오차 (MSE)는 일반적으로 비용 함수로 사용됩니다.
    손실 함수: MSE = frac{1}{n} 시그마^{n}_{i=1} (y_{i} - hat y_{i})^2
  • 경사하강법: 그런 다음 네트워크에서는 경사하강법을 사용하여 손실을 줄입니다. 부정확성을 낮추기 위해 각 가중치에 대한 손실의 미분을 기준으로 가중치를 변경합니다.
  • 가중치 조정: 이 반복 프로세스를 적용하여 각 연결에서 가중치가 조정됩니다. 역전파 , 네트워크를 통해 뒤로.
  • 훈련: 다양한 데이터 샘플을 사용하여 훈련하는 동안 순방향 전파, 손실 계산 및 역전파의 전체 프로세스가 반복적으로 수행되므로 네트워크가 데이터의 패턴을 조정하고 학습할 수 있습니다.
  • 활성화 기능: 모델 비선형성은 다음과 같은 활성화 함수에 의해 도입됩니다. 정류된 선형 유닛 (ReLU) 시간 시그모이드 . 뉴런을 발사할지 여부에 대한 결정은 전체 가중치 입력을 기반으로 합니다.

신경망 학습

1. 지도 학습을 통한 학습

~ 안에 지도 학습 에서 신경망은 두 입력-출력 쌍에 접근할 수 있는 교사에 의해 안내됩니다. 네트워크는 주변 환경을 고려하지 않고 입력을 기반으로 출력을 생성합니다. 이러한 출력을 교사가 알고 있는 원하는 출력과 비교하여 오류 신호가 생성됩니다. 오류를 줄이기 위해 네트워크의 매개변수는 반복적으로 변경되며 성능이 허용 가능한 수준에 도달하면 중지됩니다.

2. 비지도 학습을 통한 학습

동등한 출력 변수가 없습니다. 비지도 학습 . 주요 목표는 들어오는 데이터의 (X) 기본 구조를 이해하는 것입니다. 조언을 해줄 강사가 없습니다. 대신 데이터 패턴과 관계를 모델링하는 것이 의도된 결과입니다. 회귀 및 분류와 같은 단어는 지도 학습과 관련이 있는 반면, 비지도 학습은 클러스터링 및 연관과 관련이 있습니다.

3. 강화 학습을 통한 학습

환경과의 상호 작용 및 보상이나 처벌 형태의 피드백을 통해 네트워크는 지식을 얻습니다. 시간이 지남에 따라 누적 보상을 최적화하는 정책이나 전략을 찾는 것이 네트워크의 목표입니다. 이러한 종류는 게임 및 의사 결정 응용 프로그램에 자주 활용됩니다.

신경망의 유형

있다 일곱 사용할 수 있는 신경망의 종류.

  • 피드포워드 네트워크: 피드포워드 신경망 데이터가 입력에서 출력으로 단일 방향으로 이동하는 간단한 인공 신경망 아키텍처입니다. 입력, 숨겨진 및 출력 레이어가 있습니다. 피드백 루프가 없습니다. 간단한 아키텍처로 인해 회귀 및 패턴 인식과 같은 다양한 애플리케이션에 적합합니다.
  • 다층 퍼셉트론(MLP): MLP 입력 계층, 하나 이상의 숨겨진 계층 및 출력 계층을 포함하여 3개 이상의 계층으로 구성된 피드포워드 신경망 유형입니다. 비선형 활성화 함수를 사용합니다.
  • CNN(컨벌루션 신경망): 컨볼루셔널 신경망 (CNN)은 이미지 처리를 위해 설계된 전문 인공 신경망입니다. 컨볼루셔널 레이어를 사용하여 입력 이미지에서 계층적 특징을 자동으로 학습하므로 효과적인 이미지 인식 및 분류가 가능합니다. CNN은 컴퓨터 비전에 혁명을 일으켰으며 객체 감지 및 이미지 분석과 같은 작업에서 중추적인 역할을 합니다.
  • 순환 신경망(RNN): 순차적 데이터 처리를 목적으로 하는 인공 신경망 유형을 순환 신경망 (RNN). 시계열 예측, 자연어 처리 등 상황별 종속성이 중요한 애플리케이션에 적합합니다. 피드백 루프를 사용하여 네트워크 내에서 정보가 유지될 수 있도록 하기 때문입니다.
  • 장단기 기억(LSTM): LSTM RNN 학습 시 그래디언트 소실 문제를 극복하기 위해 설계된 RNN 유형입니다. 메모리 셀과 게이트를 사용하여 정보를 선택적으로 읽고, 쓰고, 지웁니다.

신경망의 간단한 구현

파이썬3

import> numpy as np> # array of any amount of numbers. n = m> X>=> np.array([[>1>,>2>,>3>],> >[>3>,>4>,>1>],> >[>2>,>5>,>3>]])> # multiplication> y>=> np.array([[.>5>, .>3>, .>2>]])> # transpose of y> y>=> y.T> # sigma value> sigm>=> 2> # find the delta> delt>=> np.random.random((>3>,>3>))>-> 1> for> j>in> range>(>100>):> > ># find matrix 1. 100 layers.> >m1>=> (y>-> (>1>/>(>1> +> np.exp(>->(np.dot((>1>/>(>1> +> np.exp(> >->(np.dot(X, sigm))))), delt))))))>*>((>1>/>(> >1> +> np.exp(>->(np.dot((>1>/>(>1> +> np.exp(> >->(np.dot(X, sigm))))), delt)))))>*>(>1>->(>1>/>(> >1> +> np.exp(>->(np.dot((>1>/>(>1> +> np.exp(> >->(np.dot(X, sigm))))), delt)))))))> ># find matrix 2> >m2>=> m1.dot(delt.T)>*> ((>1>/>(>1> +> np.exp(>->(np.dot(X, sigm)))))> >*> (>1>->(>1>/>(>1> +> np.exp(>->(np.dot(X, sigm)))))))> ># find delta> >delt>=> delt>+> (>1>/>(>1> +> np.exp(>->(np.dot(X, sigm))))).T.dot(m1)> ># find sigma> >sigm>=> sigm>+> (X.T.dot(m2))> # print output from the matrix> print>(>1>/>(>1> +> np.exp(>->(np.dot(X, sigm)))))>
>
>

산출:

HTML에서 자바스크립트 함수 호출
[[0.99999325 0.99999375 0.99999352]  [0.99999988 0.99999989 0.99999988]  [1. 1. 1. ]]>

신경망의 장점

신경망은 다음과 같은 많은 이점으로 인해 다양한 애플리케이션에서 널리 사용됩니다.

  • 적응성: 신경망은 새로운 상황에 적응하고 데이터로부터 학습할 수 있기 때문에 입력과 출력 사이의 연결이 복잡하거나 잘 정의되지 않은 활동에 유용합니다.
  • 패턴 인식: 패턴 인식 능력이 뛰어나 오디오 및 이미지 식별, 자연어 처리, 기타 복잡한 데이터 패턴과 같은 작업에 효과적입니다.
  • 병렬 처리: 신경망은 본질적으로 병렬 처리가 가능하기 때문에 수많은 작업을 한 번에 처리할 수 있어 계산 속도가 빨라지고 효율성이 향상됩니다.
  • 비선형성: 신경망은 선형 모델의 단점을 극복한 뉴런에서 발견되는 비선형 활성화 함수 덕분에 데이터의 복잡한 관계를 모델링하고 이해할 수 있습니다.

신경망의 단점

신경망은 강력하지만 단점과 어려움이 없는 것은 아닙니다.

  • 계산 강도: 대규모 신경망 훈련은 많은 컴퓨팅 능력을 요구하는 힘들고 계산량이 많은 프로세스일 수 있습니다.
  • 블랙박스 성격: 블랙박스 모델로서 신경망은 결정을 내리는 방법을 이해하기 어렵기 때문에 중요한 응용 분야에서 문제를 제기합니다.
  • 과적합: 과적합은 신경망이 데이터의 패턴을 식별하는 대신 훈련 자료를 메모리에 할당하는 현상입니다. 정규화 접근 방식이 이를 완화하는 데 도움이 되지만 문제는 여전히 존재합니다.
  • 대규모 데이터 세트의 필요성: 효율적인 훈련을 위해 신경망에는 크기가 크고 레이블이 지정된 데이터 세트가 필요한 경우가 많습니다. 그렇지 않으면 불완전하거나 왜곡된 데이터로 인해 성능이 저하될 수 있습니다.

자주 묻는 질문(FAQ)

1. 신경망이란 무엇입니까?

신경망은 인간의 뇌 구조를 모델로 하여 정보를 처리하는 상호 연결된 노드(뉴런)로 구성된 인공 시스템입니다. 데이터에서 패턴을 추출하는 기계 학습 작업에 사용됩니다.

2. 신경망은 어떻게 작동하나요?

연결된 뉴런의 레이어는 신경망의 데이터를 처리합니다. 네트워크는 입력 데이터를 처리하고 훈련 중에 가중치를 수정하며 발견된 패턴에 따라 출력을 생성합니다.

3. 신경망 아키텍처의 일반적인 유형은 무엇입니까?

피드포워드 신경망, 순환 신경망(RNN), 컨볼루션 신경망(CNN) 및 장단기 기억 네트워크(LSTM)는 각각 특정 작업을 위해 설계된 일반적인 아키텍처의 예입니다.

4. 신경망에서 지도 학습과 비지도 학습의 차이점은 무엇입니까?

지도 학습에서는 입력을 일치하는 출력에 매핑하는 방법을 학습할 수 있도록 신경망을 훈련하는 데 레이블이 지정된 데이터가 사용됩니다. 비지도 학습은 레이블이 지정되지 않은 데이터를 사용하여 데이터에서 구조나 패턴을 찾습니다. .

5. 신경망은 순차 데이터를 어떻게 처리합니까?

순환 신경망(RNN)에 통합된 피드백 루프를 통해 순차 데이터를 처리하고 시간이 지남에 따라 종속성과 컨텍스트를 캡처할 수 있습니다.