pytorch

[pytorch] 머신러닝 딥러닝의 차이 / 머신러닝 학습 순서

독립성이 강한 ISFP 2023. 3. 12. 15:20
728x90
반응형

1. 인공지능, 머신러닝과 딥러닝의 차이

인공지능 머신러닝 딥러닝의 관계

 

인공지능(Artificial Intelligence)은 인간의 지능적 행동을 모방하거나 재현하는 컴퓨터 시스템을 말합니다.

 

머신러닝은 인공지능의 한 분야로,

데이터를 통해 스스로 학습하고, 예측하거나 결정을 내릴 수 있는 알고리즘과 기술의 개발을 목표로 합니다.

이는 데이터로부터 패턴을 발견하고, 이를 바탕으로 예측 또는 결정을 내리는 모델을 만드는 과정을 포함합니다.

 

딥러닝은 머신러닝의 하위 분야로,

주로 인공신경망(특히 깊은 신경망)을 사용하여 복잡한 문제를 해결합니다.

딥러닝은 대규모 데이터에서 고수준의 추상화와 패턴 인식을 수행하는 능력을 가지고 있습니다.

 

머신러닝과 딥러닝 모두 학습 모델을 제공하여 데이터를 분류할 수 있는 기술이다. 하지만 접근 방식에 차이가 있다.

 

머신러닝은 주어진 데이터를 인간이 먼저 처리(전처리) 한다. 이미지 데이터라면 사람이 학습(train) 데이터를 컴퓨터가 인식할 수 있도록 준비해 두어야 합니다. 머신러닝은 데이터의 특징을 스스로 추출하지 못한다. 이 과정을 인간이 처리해 주어야 한다. 즉, 각 데이터(혹은 이미지) 특성을 컴퓨터(기계)에 인식시키고 학습시켜 문제를 해결한다.

 

머신러닝

 

반면 딥러닝은 인간이 하던 작업을 생략한다. 대량의 데이터를 신경망에 적용하면 컴퓨터가 스스로 분석한 후 답을 찾는다.

 

딥러닝

 

구분 머신러닝 딥러닝
동작 원리 입력 데이터에 알고리즘을 적용하여 예측 정보를 전달하는 신경망을 사용하여 데이터 특징 및 관계 해석
재사용 불가능 가능
데이터 수천 개의 데이터가 필요 수백만 개 이상의 데이터 필요
훈련 시간 단시간 장시간
결과 점수 또는 분류 등 숫자 값 점수, 텍스트, 소리 등 어떤 것이든 가능

 

특성추출 : 머신러닝에서 컴퓨터가 스스로 학습(컴퓨터가 입력받은 데이터를 분석하여 일정한 패턴이나 규칙을 찾아내려면)하려면 사람이 인지하는 데이터를 컴퓨터가 인지할 수 있는 데이터로 변환해 주어야 한다. 데이터별로 어떤 특징을 가지고 있는지 찾아내고, 그것을 토대로 데이터를 벡터로 변환하는 작업이다.

 


2. 머신러닝 학습과정

 

머신러닝은 인공지능의 한 분야로, 컴퓨터 스스로 대용량 데이터에서 지식이나 패턴을 찾아 학습하고 예측을 수행하는 것이다. 즉, 컴퓨터가 학습할 수 있게 하는 알고리즘과 기술을 개발하는 분야이다.

 

# 머신러닝의 학습과정 : 학습단계(learning), 예측단계(prediction)

 

  • 학습 단계 : 훈련 데이터(train)를 머신러닝 알고리즘에 적용하여 학습시키고, 이 학습 결과로 모형이 생성된다.
  • 예측 단계 : 학습 단계에서 생성된 모델에 새로운 데이터(test)를 적용하여 결과를 예측한다.

머신러닝 학습 과정

 # 머신러닝의 주요 구성 요소 : 데이터, 모델(모형)

 

  • 데이터: 머신러닝이 학습 모델을 만드는 데 사용하는 것이다. 실제 데이터의 특징이 잘 반영되고 편향되지 않는 훈련 데이터를 수집하는 것이 중요하다. 

    또한 학습에 필요한 데이터가 수집되었다면 훈련 데이터셋과 테스트 데이터셋 용도로 분리해서 사용한다. 또한 훈련 데이터셋을 또다시 훈련데이터셋과 검증 데이터셋으로 분리해서 사용하기도 한다. 보통 데이터의 80%는 훈련용으로, 20%는 테스트용으로 분리한다.

  • 모델: 머신러닝의 학습 단계에서 얻는 최종 결과물이다. 
    (모델의 학습 절차 : 모델정의 -> 모델 학습 및 평가 -> 평가를 바탕으로 모델 업데이트)

 

머신러닝의 문제 풀이 과정

최종적으로 완성된 모델을 해결하고자 하는 문제에 적용해서 분류 및 예측 결과를 도출한다.

728x90
반응형