Deep learning

[Deep Learning] 인공지능의 기초: 퍼셉트론부터 인공 신경망까지

독립성이 강한 ISFP 2024. 2. 6. 23:31
728x90
반응형

퍼셉트론의 개요

퍼셉트론은 인공 신경망(artificial neural network)의 기초적인 형태 중 하나로, 이진 분류 문제를 위한 간단한 알고리즘입니다.

  1. 입력값 (Input): 퍼셉트론은 하나 이상의 입력값을 받습니다. 이러한 값들은 각각의 특성(feature)을 나타내며, 이를 바탕으로 결정을 내립니다.
  2. 가중치 (Weights): 각 입력값에는 가중치가 부여됩니다. 이 가중치는 학습 과정에서 조절되며, 입력값의 중요도를 조절하는 역할을 합니다.
  3. 가중합 (Weighted Sum): 각 입력값과 그에 대응하는 가중치의 곱을 모두 합한 값입니다.
  4. 활성화 함수 (Activation Function): 가중합이 어느 임계값을 넘으면 퍼셉트론은 1을 출력하고, 그렇지 않으면 0을 출력합니다. 이를 결정하는 함수를 활성화 함수라고 합니다.

퍼셉트론은 기본적으로 선형 분류를 수행합니다. 

즉, XOR 같은 비선형 문제를 해결하는 데에는 한계가 있습니다. 

이러한 한계를 극복하기 위해 다층 퍼셉트론(Multi-Layer Perceptron, MLP) 같은 다양한 구조와 활성화 함수가 도입되었습니다.

 

퍼셉트론의 학습 과정

퍼셉트론은 학습 과정을 통해 최적의 가중치를 찾아갑니다.

이 과정에서 사용되는 학습 알고리즘을 퍼셉트론 학습 알고리즘 (Perceptron Learning Algorithm)이라고 부릅니다.

  1. 최초 가중치 설정: 시작 시, 모든 가중치는 임의의 값으로 설정됩니다.
  2. 예측값 계산: 설정된 가중치와 입력값을 사용하여 예측값을 계산합니다.
  3. 오차 계산: 예측값과 실제값과의 차이를 계산합니다.
  4. 가중치 갱신: 오차를 줄이기 위해 가중치를 조정합니다. 이 때, 경사 하강법 등의 방법을 사용할 수 있습니다.

학습을 통해, 퍼셉트론은 오차를 최소화하는 방향으로 가중치를 조절해 나갑니다.

 

인공 신경망(Artificial Neural Networks, ANN)

인공신경망은 기본적인 단위인 퍼셉트론들을 다층 구조로 조합하여 만든 복잡한 컴퓨팅 시스템입니다. 

이러한 네트워크는 데이터를 입력받아 처리하고, 학습하는 기능을 수행합니다.

구성은 입력층, 하나 이상의 은닉층, 그리고 출력층으로 이뤄져 있으며, 각 층은 다수의 뉴런(또는 퍼셉트론)으로 구성됩니다.

이들 뉴런은 서로 연결되어 있고, 각각의 연결마다 특정한 가중치가 부여됩니다.

인공 신경망의 설계는 인간의 뇌에서 정보를 처리하고 전달하는 신경 세포, 즉 뉴런의 작동 방식을 본떠 만들어졌습니다. 

인간의 뇌에 있는 뉴런들은 복잡한 네트워크를 형성하고, 전기적 및 화학적 신호를 통해 정보를 소통합니다. 

이러한 생물학적 뉴런 네트워크의 기능을 모방하여, 인공 신경망은 다양한 종류의 데이터를 효과적으로 처리하고 학습할 수 있는 능력을 갖추게 됩니다.

 

생물학적 뉴런의 구성 요소

  1. Dendrite (수상돌기): 뉴런에서 다른 뉴런으로부터 신호를 받는 부분입니다. 여러 개의 가지를 가지고 있어 다른 뉴런의 축삭 끝에서 신호를 받습니다.
  2. Synapse (시냅스): 다른 뉴런과의 연결 부위에 위치하며, 전기 신호의 세기를 재조정합니다.
  3. Soma (cell body, 세포체): 수상돌기(Dendrite)를 통해 받은 신호들을 통합(합침)합니다.
  4. Axon (축삭): 세포체의 전위가 일정 이상이 되면 이웃 뉴런으로 전기 신호를 보냅니다.
생물학적 뉴런 구조

 

인공 신경망의 구성 요소

  1. input(입력값- x1, x2): 외부로부터 데이터를 받는 부분으로, 생물학적 뉴런의 수상돌기에 해당합니다.
  2. Weights (가중치- w1, w2): 신호의 중요도를 조절하는 역할을 하며, 생물학적 뉴런의 시냅스 강도에 비유할 수 있습니다
  3. 가중합 (Weighted Sum): 각 입력값과 그에 대응하는 가중치의 곱을 모두 합한 값이며, 생물학적 뉴런의 세포체에 해당합니다.
  4. Output(출력값 - y): 최종 결정이나 예측을 내보내는 부분으로, 생물학적 뉴런의 축삭에 해당합니다.

 

단층 퍼셉트론 네트워크 구조

 

퍼셉트론 출력 결정식

 

입력 x1, x2에 가중치 w1, w2를 곱한 뒤 이를 합산하여 출력 y를 결정합니다.

출력 y는 합산된 값이 임계값 세타보다 크거나 작은지에 따라 결정됩니다.

 

인공 신경망의 작동 원리

인공 신경망은 입력층에서 받은 데이터를 은닉층을 거쳐 출력층으로 전달합니다.

각 뉴런(노드)은 입력 신호에 가중치를 곱한 후 활성화 함수를 통과시켜, 출력 신호를 생성합니다.

이 과정은 뇌의 신경망에서 뉴런이 신호를 처리하고 전달하는 방식과 유사합니다.

신경망은 주어진 작업에 대해 좋은 성능을 내기 위해 학습 과정을 통해 가중치를 조정합니다.

이는 생물학적 뇌가 경험을 통해 학습하고 기억하는 과정과 비슷합니다.

인공 신경망은 다양한 종류의 데이터(이미지, 음성, 텍스트 등)를 처리할 수 있으며, 패턴 인식, 분류, 회귀 분석 등의 다양한 작업에 사용됩니다. 생물학적 뉴런이 다양한 종류의 자극에 반응하고 이를 기반으로 학습하는 것과 마찬가지로, 인공 신경망도 복잡한 데이터 구조를 학습하고 예측할 수 있습니다.

 

728x90
반응형