그래프와 추천시스템 68
추천시스템
- 추천의 대상은 다양하지만, 이번 강의에서는 상품을 대상으로하는 추천으로 가정하자
- 사용자와 상품은 이종 그래프(Bipartite graph)로 표현할 수 있다.
- 추천시스템의 핵심은 사용자별 구매를 예측하거나 선호를 추정하는 것
- 컨텐츠 기반 추천(Content based Recommendation)
사용자가 구매/만족했던 상품과 유사한 것을 추천하는 방법
- 크게 아래와 같은 4가지 단계로 구성가능
- 사용자가 사용했던 상품 프로필(Item Profile)을 수집
ex. 원핫벡터, 임베딩 벡터 등으로 표현 가능
- 상품프로필을 바탕으로 사용자 프로필(User Profile)
ex. 상품 프로필을 가중 평균 등을 이용해 사용자 프로필 구성 가능
- 사용자 프로필과 다른 상품들의 상품프로필을 매칭
ex. 코사인 유사도, 위의 예시의 경우 빨강색인 육각형과 초록원 순으로 사용자와 상품의 유사도가 크다.
- 사용자가 사용했던 상품 프로필(Item Profile)을 수집
- pros
다른 사용자의 구매기록이 필요하지 않음
독특한 취향의 사용자에게 추천 용이
새 상품에 대한 추천 가능
추천의 설명력
- cons
상품에 대한 정보가 없는 경우 → 상품 프로필 구성 불가능
cold start (구매기록이 없는 경우)
과적합(overfitting)으로 인한 협소한 추천 위험성(ex. 우연히 편향 선택을 했을 경우, 해당 편향에 대한 추천만 이루어짐)
- 크게 아래와 같은 4가지 단계로 구성가능
- 협업 필터링 추천(Collaborative Filtering Recommendation)
- 사용자-사용자 협업필터링
- 추천
사용하지 않은 제품을 평점 추정해 추천할 수 있다.
- Pros : 상품에 대한 부가정보가 없는 경우에도 사용 가능
- Cons
충분한 수의 평점 데이터가 누적되어야 효과적
새 상품, 새로운 사용자에 대한 추천이 어려움
독특한 취향의 사용자의 추천이 어려움
- 추천
- 사용자-사용자 협업필터링
- 추천시스템의 평가
- Metric: MSE, RMSE 활용
이외에, 추정한 평점으로 순위를 매긴 후, 실제 평점으로 매긴 순위와의 상관계수
추천 상품 중 실제 구매로 이루어진 것의 비율
추천의 순서, 다양성 고려한 지표 등이 있음
- Metric: MSE, RMSE 활용
- 잠재 인수모형 (Latent Factor Model, UV decomposition, SVD)
- 고급 잠재 인수 모형
- 사용자와 상품의 편향을 고려한 잠재 인수 모형
- 상품 편향: 전체 사용자&상품 평점 평균 - 각 상품의 평점 평균
- 넷플릭스 챌린지에서의 성능: 0.89
- 사용자와 상품의 편향을 고려한 잠재 인수 모형
- Further Reading: