티스토리 뷰

지도학습

지도학습(supervised learning)은 레이블(정답)을 알려주면서 진행되는 학습입니다.

때문에 학습 시 데이터와 함께 레이블(정답)이 항상 제공되어야 해요!

지도학습은 테스트할 때 데이터와 함께 레이블을 제공하므로 손쉽게 모델의 성능을 평가할 수 있다는 장점이 있습니다.

하지만 데이터마다 레이블을 달기 위해 많은 시간이 투자돼야 한다는 단점 또한 있어요!

지도학습의 대표적인 예는 분류와 회귀가 있습니다.

분류는 범주형 데이터, 즉 분리된 값을 예측하고 

회귀는 연속형 데이터, 연속된 값으로 예측합니다.

이 둘을 날씨로 예를 들면, 

분류) 내일은 날씨가 추울 것이다.
회귀) 내일은 온도가 35.0℃일 것이다.

지도학습의 기법들
  • 선형 회귀(Linear Regression)
  • 로지스틱 회귀(Logistic Regression)
  • 나이브 베이즈(Naive Bayes)
  • K-최근접 이웃(k-Nearest Neighbors)
  • 서포트 벡터 머신(SVM, Support Vector Machine)
  • 의사결정 트리(Decision Tree)
  • 랜덤 포레스트(Random Forest)
  • 인공신경망(Neural Network)
비지도학습

비지도학습(unsupervised learning)이란 레이블(정답)이 없이 진행되는 학습입니다.

따라서 학습할 때 레이블 없이 데이터만 필요로 해요!

보통 비지도학습의 목적은 데이터 자체에서 패턴을 찾아내는 거에요.

비지도학습은 레이블을 제공할 필요가 없다는 장점이 있는 반면에, 

그 레이블이 없기 때문에 모델 성능을 평가하는 데에 어려움이 있다는 단점이 있어요!

비지도학습의 대표적인 예는 군집화와 차원축소가 있습니다.

비지도학습의 기법들
  • 군집(Clustering)
  • K-means 클러스터링
  • 위계적 군집분석
  • 가우시안 혼합모형(Gaussian Mix Texture Model)
  • 주성분 분석(PCA)
  • LLE(Locally Linear Embedding)
  • Isomap
  • MDS(Multi Dimensional Scaling
  • t-SNE(t-distributed Stochastic Neighbor Embedding)

<참고 문헌>
Minseok-Heo, [나의 첫 머신러닝/딥러닝], Wikibooks, 2019.

이 글은 저자님과 출판사의 참고 허가를 받고 작성되었습니다.

글 보관함