Supervised_Learning

Table of contents


지도학습

지도학습이란?

  • 학습할 데이터에 정보와 정답을 포함하는 방법
  • 정답이 있기 때문에 정답에 대한 데이터 특성 학습 가능
  • input 특성들을 활용하여 ouput 특성 예측
    • input 특성 : 정답을 맞추기 위해 사용되는 데이터 특성
    • ouput 특성 : 정답이 되는 데이터 특성

지도학습의 특징

  • 비지도 학습보다 더 단순하고 일반적이다
  • 사람인 관여자가 답을 알고 있는 상태에서 AI를 훈련하고자 할 때 사용한다
  • 사용하여 데이터를 분류하고 처리한다
  • 레이블이 지정된 데이터 즉, 분류된 데이터를 사용한다

지도학습의 유형

1. 분류 기법(Classification techniques)

  • 분류 모델은 레이블이 달린 학습 데이터로 학습한 후에 새로 입력된 데이터가 학습했던 어느 그룹에 속하는 지를 찾아내는 방법
  • ex. 스팸메일 분류 예제
  • 알고리즘
    • 로지스틱 회귀
    • 선형 판별 분석
    • K-최근접 이웃(KNN, K-nearest neighbors)
    • 트리(Trees)
    • 신경망
    • 서포트 벡터 머신(SVM, Support vector machines)

2. 선형 회귀 (Linear regression)

  • 예측 모델(=선형회귀)은 레이블이 달린 학습 데이터를 가지고 특징(feature)과 레이블(label) 사이의 상관관계를 함수식으로 표현
  • ex. 보스턴 주택 가격 예측 예제

지도학습의 활용

  • 이메일의 스팸 여부 분류
  • 집 값 예측
  • 특정 후보 투표 여부 예측
  • 강우 및 기상 상황 예측
  • 자동차 엔진의 기계 부품 고장 예측