
서포트 벡터 머신(SVM)은 머신러닝의 분류기법 중 하나로 분류 문제 외에 회귀에도 적용이 가능하며 정확도 측면에서 우수한 결과를 가져온다는 이유로 분류기법 중에서도 최상의 기법으로 알려져 있습니다 ! 하지만 의사결정나무처럼 직관적인 해석은 불가능 하기 때문에 이해하는데 어렵다는 단점 또한 가지고 있어요. 그래서 보통 결과해석에는 의사결정나무가 자주 쓰이지만, 높은 정확도를 위해서는 SVM을 주로 사용한다고 합니다. 용어 먼저 알아보고 장단점으로 글을 마무리 하겠습니다! 01 초평면 곡선이 아닌 직선이나 평면으로 데이터를 구별하는 방법을 최대 마진 분류기라고 하고, 최대 마진 분류기가 경계로 사용하는 선이나 면을 초평면(Hyperplane)이라고 합니다. 데이터의 차원에 따라 초평면 차원도 달라집니다. ..

지도학습 지도학습(supervised learning)은 레이블(정답)을 알려주면서 진행되는 학습입니다. 때문에 학습 시 데이터와 함께 레이블(정답)이 항상 제공되어야 해요! 지도학습은 테스트할 때 데이터와 함께 레이블을 제공하므로 손쉽게 모델의 성능을 평가할 수 있다는 장점이 있습니다. 하지만 데이터마다 레이블을 달기 위해 많은 시간이 투자돼야 한다는 단점 또한 있어요! 지도학습의 대표적인 예는 분류와 회귀가 있습니다. 분류는 범주형 데이터, 즉 분리된 값을 예측하고 회귀는 연속형 데이터, 연속된 값으로 예측합니다. 이 둘을 날씨로 예를 들면, 분류) 내일은 날씨가 추울 것이다. 회귀) 내일은 온도가 35.0℃일 것이다. 지도학습의 기법들 선형 회귀(Linear Regression) 로지스틱 회귀(Lo..