회귀 모델(Regression Model) 과 분류 모델(Classification Model)

By | 2020년 4월 3일
Table of Content

회귀 모델(Regression Model) 과 분류 모델(Classification Model)

회귀 모델(Regression Model)

회귀 모델은 여러 조건의 합산값입니다.

회사에서 신입사원을 뽑는다고 가정해 봅니다. A 라는 사람이 JAVA 는 80점의 점수로 잘 하고, ELK는 50점으로 잘하고, ML은 30점으로 잘한다고 할 때, 이 사람의 능력을 어떻게 점수화 하고 뽑을지 말지를 결정하게 됩니다.

단순히 여러 조건을 합산해서 80 + 50 + 30 = 160 으로 할 수도 있고, 우리 회사에서 지금 필요한 사람은 ELK를 잘해야해 한다면 ELK 에 가중치(Weight) 를 주어서 80 + 50*5 + 30 = 410 으로 할 수도 있습니다.

분류 모델(Classification Model)

데이타를 분류하는 모델입니다.

타이타닉 호에 탔던 사람들 중에 연봉이 얼마고, 성별이 무엇이고, 나이가 얼마일 때, 그 사람은 살것인가 죽을것인가… 이런걸 이진 분류(Binary Classification) 라고 합니다. 분류가 딱 2개일 때를 의미합니다.

회사에서 인사 평가를 한다고 생각할 때, A 라는 사람은 a 부문도 성적이 좋고. b 부문도 성적이 좋고, c 부문도 성적이 좋고… 그러면 총점이 A, B 라는 사람은 성적이 c/c/c 라고 하면 총점이 C…, C 라는 사람은 성적이 b/b/b, 이렇게 분류가 3개 이상이면 다중 클래스 분류(Multi-class Classification) 라고 합니다.

회귀 모델과 분류 모델은 차이가 무엇인가?

위에 분류 모델 문제 중에 타이타닉 문제같은 경우, 죽는가 살건가로 했을 때 이진 분류(Binary Classification) 가 되지만, 동일한 문제로 살 확률이 얼마인가로 가면 회귀 모델 의 문제가 됩니다.

쇼핑몰에서, 이 상품이 베스트셀러가 될것인가 로 접근하면 이진분류이고, 베스트셀러가 될 확률이 얼마인가로 가면 회귀문제가 됩니다.

간단히, 문제를 어떻게 접근하고 풀어갈건가의 차이입니다.

Category: ML

답글 남기기