선형 회귀(Linear Regression)

By | 2020년 4월 4일
Table of Content

선형 회귀(Linear Regression)

선형 회귀는 회귀 모델 중 가장 단순하면서도 많이 쓰이는 모델입니다.

아파트 평수와 아파트의 가격간의 상관관계가 선형모델에 해당합니다.

단순 선형 회귀(simple linear regression)와 다중 선형 회귀(multiple linear regression)

단 하나의 특성(feature) 만을 이용하는 모델이 단순 선형 회귀(simple linear regression) 이고, 여러 가지 특성을 이용하는 모델이 다중 선형 회귀(multiple linear regression) 입니다.

아파트의 가격을 예측한다고 할 때, 아파트의 평수만 이용한다면 단순 선형회귀이고, 평수 이외에 지하철과의 거리, 인근 공원과의 거리, 한강뷰 유무 등을 고려하는 것이 다중 선형회귀입니다.

그러면 다중 선형 회귀만 쓰면 되지 왜 단순 선형 회귀를 쓸까요? 우선, 특성 수집이 어려워집니다. 각각의 아파트 별로 위의 모든 특성 정보를 수집해야 하므로 그만큼 시간이 걸리는 것입니다. 또한, 가중치(Weight) 산정이 어렵습니다. 지하철과의 거리를 어떻게 가격산정에 반영할지가 어렵습니다.

그래서, 처음 가설(Hyperthesis) 을 세울 때는 단순 선형 회귀부터 시작해서 특성(feature) 을 늘려 나가는 것이 좋습니다.

Category: ML

답글 남기기