넷플릭스와 아마존

By | 2020년 4월 12일
Table of Content

넷플릭스와 아마존

두 업체 모두 추천시스템을 사용합니다.

하지만 두 업체가 사용하는 추천 로직은 다릅니다.

넷플릭스

넷플릭스는 영화를 추천합니다.

우리나라 기준으로, 인구수 5천만의 인구이고, 1년동안 개봉되는 영화는 100편이 될까말까 합니다.

결과적으로 같이 본 영화가 많을 수밖에 없습니다. 그래서 User Based CF 가 잘 작동합니다. 그리고, 아르바이트를 동원해서 영화의 감독, 주연배우, 장르 등을 추출하고, 그 특성을 추천에 사용하는 것들도 가능해집니다.

따라서 Content Based CF 도 좋은 결과를 도출합니다.

아마존

아마존은 상품을 추천합니다.

미국을 기준으로 해도, 인구수 4억 이내이고, 상품수는 수백만이 넘어갑니다.

같이 구매한 상품 데이타를 생성해 보면, 한개의 상품을 같이 구매한 고객의 비율은 대단히 드물고 2개 이상을 같이 구매한 고객 비율은 더더욱 적습니다.

결과적으로 User Based CF 는 정상적인 데이타를 생성하지 못하고 대신 Item Based CF 가 좋은 데이타를 생성해 줍니다.

예외

그러면 상품수가 극단적으로 적은 경우는 어떻게 될까?

예를들어, 상품이 자동차인경우는 어떻게 될까?

영화와 동일한 접근법이 가능해집니다. 자동차의 특성 추출도 저비용으로 가능해지고 User Based CF 도 가능해지게 됩니다.

반대로, 영화가 아니라 유튜브 동영상이라면…

상품과 동일한 접근법만이 가능해집니다. 아르바이트를 동원한 Feature 추출은 불가능해지는거죠.

답글 남기기