사용자와 상품의 편향을 고려한 latent factor model
1. 편향(bias)
사용자의 편향은 해당 사용자가 매긴 평점들의 평균과 전체 상품들의 평점평균의 차이
전체 평점평균에 대해 이 사용자는 얼마나 평가를 후하게 하는지 박하게 하는지 알 수 있다.
나연은 전체 상품들의 평점평균에 비해 0.3점 정도 더 주는 경향이 있다.
상품의 편향은 해당 상품이 받은 평점들의 평균과 전체 상품들의 평점평균의 차이
해당 상품이 전체 상품의 평점평균에 비해 얼마나 좋은 평가를 받는지 나쁜 평가를 받는지 알 수 있다.
식스센스는 전체 상품들의 평점평균에 비해 0.8점정도 긍정적으로 평가 받는다
사용자와 상품의 편향은 현재 주어진 데이터로부터 계산한 예측값이다.
그러니까 정확한 상수가 아니라는 뜻이다.
데이터가 추가되면 사용자의 평점이나 상품의 평점은 바뀌기 때문에 개선의 여지가 있는 값이다.
2. idea
이전의 latent factor model이 상품의 평점은 사용자와 상품간의 상호작용에만 영향을 받았다고 생각했다면
이번에는 상품의 평점은 전체 평점평균과 사용자의 편향, 상품의 편향, 사용자와 상품간의 상호작용의 합으로 나타난다고 보는것이다.
최적의 사용자 편향, 상품 편향, 사용자와 상품의 embedding vector를 찾는 것을 목표로 한다.
바로 위에서 언급했지만 사용자 편향과 상품 편향은 데이터가 추가되면서 바뀌는 개선의 여지가 있는 값이므로 근본적으로 숨어있는 정확한 값을 찾고 싶다는 것이다.
3. loss function
상품의 실제 평점과 추정한 평점(전체 평점평균, 사용자 편향, 상품 편향, 사용자 embedding과 상품 embedding의 내적의 합)의 차이가 최소가 되도록 하는 사용자 편향, 상품 편향, 사용자, 상품의 embedding을 찾는다.
과적합 방지를 위해 모형의 복잡도까지 고려한 regularization 항도 추가한다.
'딥러닝 > recommendation system' 카테고리의 다른 글
matrix factorization을 이용한 추천시스템 간단한 이론과 구현예시 (0) | 2024.08.03 |
---|---|
시간에 따른 편향을 고려한 latent factor model (0) | 2024.07.19 |
latent factor model for recommendation system (0) | 2024.07.16 |
추천시스템 평가 방법 (0) | 2024.07.05 |
추천시스템 기본이론2 -collaborative filtering- (0) | 2022.11.10 |