본문 바로가기

프로그래밍/Machine Learning

[Machine Learning] 지도 학습(Supervised Learning)이란?

지도 학습(Supervised Learning)이란?

앞선 '인공 지능(Artificial Intelligence), 머신 러닝(Machine Learning), 딥 러닝(Deep Learning) 란?'(https://honeyteacs.tistory.com/8)에서도 간단히 설명하였듯이 입력에 대한 출력(답)이 정해진 데이터들을 알고리즘에 학습시켜 주어진 입력에 대한 출력을 만드는 방법을 말한다.

즉, 훈련세트로부터 만들어진 모델을 통하여 새로운 데이터에 대한 정확한 출력을 예측하는 것이다.

 

지도 학습의 종류는 분류(classification)와 회귀(regression)로 나눌 수 있다.

 

1) 분류 : 두 개의 클래스로 나뉘어지는 이진 분류와 셋 이상의 클래스로 나뉘어지는 다중 분류로 나눌 수 있다.

2) 회귀 : 예상되는 출력 값이 분류에서처럼 정확히 나뉘어 지는 것이 아니라 연속적인 숫자 중 하나를 예측하는 것이다.

 

과대 적합(overfitting) : 적은 양의 샘플 데이터를 기반으로 하며 지나치게 샘플 데이터들에 맞추어진 복잡한 모델로서, 새로운 데이터의 일반화가 어렵게 되는 현상

과소 적합(underfitting) : 과대 적합 현상과는 반대로 모델이 너무 간단하여 데이터의 다양성을 잡아내지 못하는 현상

최적의 모델(optimum) : 과대적합과 과소적합의 절충점에 있는, 일반화 성능이 최대가 되는 모델. 보통은 데이터가 많을 수록 최적의 모델을 만드는데에 유리하다.