티스토리 뷰
지도학습
지도학습(supervised learning)은 레이블(정답)을 알려주면서 진행되는 학습입니다.
때문에 학습 시 데이터와 함께 레이블(정답)이 항상 제공되어야 해요!
지도학습은 테스트할 때 데이터와 함께 레이블을 제공하므로 손쉽게 모델의 성능을 평가할 수 있다는 장점이 있습니다.
하지만 데이터마다 레이블을 달기 위해 많은 시간이 투자돼야 한다는 단점 또한 있어요!
지도학습의 대표적인 예는 분류와 회귀가 있습니다.
분류는 범주형 데이터, 즉 분리된 값을 예측하고
회귀는 연속형 데이터, 연속된 값으로 예측합니다.
이 둘을 날씨로 예를 들면,
분류) 내일은 날씨가 추울 것이다.
회귀) 내일은 온도가 35.0℃일 것이다.
지도학습의 기법들
- 선형 회귀(Linear Regression)
- 로지스틱 회귀(Logistic Regression)
- 나이브 베이즈(Naive Bayes)
- K-최근접 이웃(k-Nearest Neighbors)
- 서포트 벡터 머신(SVM, Support Vector Machine)
- 의사결정 트리(Decision Tree)
- 랜덤 포레스트(Random Forest)
- 인공신경망(Neural Network)
비지도학습
비지도학습(unsupervised learning)이란 레이블(정답)이 없이 진행되는 학습입니다.
따라서 학습할 때 레이블 없이 데이터만 필요로 해요!
보통 비지도학습의 목적은 데이터 자체에서 패턴을 찾아내는 거에요.
비지도학습은 레이블을 제공할 필요가 없다는 장점이 있는 반면에,
그 레이블이 없기 때문에 모델 성능을 평가하는 데에 어려움이 있다는 단점이 있어요!
비지도학습의 대표적인 예는 군집화와 차원축소가 있습니다.
비지도학습의 기법들
- 군집(Clustering)
- K-means 클러스터링
- 위계적 군집분석
- 가우시안 혼합모형(Gaussian Mix Texture Model)
- 주성분 분석(PCA)
- LLE(Locally Linear Embedding)
- Isomap
- MDS(Multi Dimensional Scaling
- t-SNE(t-distributed Stochastic Neighbor Embedding)
<참고 문헌>
Minseok-Heo, [나의 첫 머신러닝/딥러닝], Wikibooks, 2019.
이 글은 저자님과 출판사의 참고 허가를 받고 작성되었습니다.
'Data Science > Machine Learning' 카테고리의 다른 글
[Machine Learning] 선형 회귀와 경사하강법 (0) | 2019.04.14 |
---|---|
[Machine Learning] K-최근접 이웃(KNN) 알고리즘 (0) | 2019.04.04 |
[Machine Learning] 서포트 벡터 머신 - SVM (0) | 2019.04.03 |
[Machine Learning] 혼동행렬 (0) | 2019.03.29 |
[Machine Learning] 과대적합과 과소적합 (0) | 2019.03.28 |
글 보관함