728x90
Rating Prediction > Explicit feedback의 단점 Latent factor model은 보통 rating prediction 태스크에 집중되었다. 유저의 명시적인 선호도 점수(explicit preference rating)는 user-item 매트릭스로 표현된다. 하지만, 실제 시나리오(real-world scenarios)에서 명시적인 피드백 데이터는 얻기 어렵다는 단점이 있다.. 때문에 MC를 내재적 피드백 매트릭스로 확장하는 방법에 대한 연구가 이뤄졌다. 내재적 피드백(implicit feedback)의 종류로는 클릭이나 조회 여부가 있고, 메트릭스에서 이진값(0/1) 로 표현된다. > 한계점 일반적인 MC의 objective function을 사용하게 되면 모든 unob..
Factorization Machines (FM) FMs은 real-valued features를 latent factor space에 맵핑하는 일반적인 지도 학습 모델이다. MF와 FM의 목표는 둘다 input에 대해 파악되지 않은 rating을 예측하는 것이다. 일반적인 MF 알고리즘들은 더 일반적이거나 유연한 FM 모델 클래스의 특수한 케이스로 재구성 할 수 있다. MF의 latent space는 아이템에 대한 유저의 rating에 대한 것을 담았다. 이 경우 유저와 아이템의 수가 많으면 많은 weight를 사용해 오버피팅이 될 가능성이 높다. FM의 latent space는 아이템과 유저에 관한 정보를 one-hot encoding 하고 concat 하고 부가적인 features를 추가하여 spa..
Collaborative Filtering에는 두가지 방법이 있다 1. 이웃 기반 방법 (Neighborhood-based Method) - 영화 선호도의 유사도에 기반하여 이웃을 탐색 - 찾아낸 이웃들이 시청한 영화를 추천 2. 잠재 요소 방법 (Latent Factor Method) - Low-dimensional (latent) space에 유저와 영화의 성질을 표현 - 유저와 근접도(proximity)에 기반해서 영화를 추천 - Goal : 유저와 영화를 latent space에 잘 임베딩 하는 것 Matrix Completion(MC) MC는 CF에서 널리 쓰이는 태스크이다. 먼저 유저의 아이템에 대한 explicit feedback을 고려한다. 미완성(incomplete)인 user-item ..
import os os.environ['KMP_DUPLICATE_LIB_OK']='True' 참고 https://jaeniworld.tistory.com/8 [딥러닝]OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized 딥러닝 모델중 CIFAR10을 사용하고 그 중 하나의 이미지 테스트 셋을 pyplot으로 시각화 할때 뜬 에러였다. 해당 코드만 돌리면 dead kernel이 뜨고 jupyter notebook이 자동으로 이를 재시작하는데 그래도 jaeniworld.tistory.com
1. Collaborative Filtering Collaborative Filtering : behavior-based(user interation) recommendation - 아이템의 속성을 무시 - user-item interaction에 주목 : 어떤 사람이 유저가 구매한 아이템을 좋아하는지 장점 1. 추천되는 특정 아이템의 내용과 무관하게 작동하는 알고리즘 2. "두산 베어스 굿즈를 전부 산 유저들이 마라탕을 좋아한다" 같은 흥미로운 패턴들도 찾을 수 있음 2. Neighborhood-based Collaborative Filtering - 유저의 성향과 아이템의 유사도로 선호도를 예측 - 비슷한 성향을 가진 유저가 소비한 아이템을 추천해줌 3. User-based Collaborative ..
1. 왜 Non-personalized Recommendation을 하는가? - Cold-start problem : 새로운 유저가 들어오면 그 유저에 대한 정보가 부족함 - 간단하면서 유용함 - 개인화가 불가능한 어플리케이션과 미디어에 적용 2. Non-personalized Recommendation 출판 추천 : 편집상 선택됨 - 신문의 책, 영화, 음악 평론 - 미쉐린 가이드 인기도 기반 - 빌보드 차트, 멜론 차트 - 박스오피스 차트 등.. 3. Popularity-based Recommendation 각 아이템의 점수는 요약된 통계에 기반해서 계산됨 - 인기도(혹은 빈도) - 평점 - 유저가 선호할 확률 Naïve 평점은 잘못 될 수 있음 - 선호하는 사람들의 %를 합산하여 점수를 조정함 - ..