[TIL] 내일배움캠프 115일차_[ML] 넷플릭스의 추천시스템
👀Today I Learn
1. 유사 사용자 기반 알고리즘
-
우리가 영화를 추천해야 할 유저는 C 라고 하면,
유사 사용자 기반 알고리즘은 C와 취향이 비슷한 유사 사용자를 찾아내 영화를 추천해주는 방식
- C와 중복되는 영화를 시청한 유저는 A라는 것을 확인해 볼 수 있음
- 따라서 A와 C를 유사 사용자로 묶고 A는 시청했는데 C는 시청하지 않은 ‘킹덤’과 ‘설국열차’를 추천
2. 유사 아이템 기반 알고리즘
- 유사 아이템 기반 알고리즘은 영화와 영화 간의 시청기록을 파악하여 유사한 아이템을 추천해주는 방식
- 위 그림에서 A와 B의 시청기록을 보면, A는 ‘킹덤’, ‘설국열차’ 그리고 ‘국제시장’을 시청했고 B는 ‘킹덤’과 ‘국제시장’을 시청
- A와 B의 시청기록을 바탕으로 ‘킹덤’과 ‘국제시장’을 유사 아이템으로 묶을 수 있고 국제시장을 시청한 C에게는 아직 시청하지 않은 ‘킹덤’을 추천
3. 잠재 모델 기반 알고리즘
- 잠재 모델 기반 알고리즘은 항목 간 유사성을 단순하게 비교하는 방식이 아니라 사용자와 아이템에 내재된 잠재 모델의 패턴을 이용하는 방법
- 예를 들어 ‘킹덤’을 좋아하는 사용자는 배우 주지훈을 좋아해서 일수도 있고, 좀비물을 좋아해서 일 수도 있고, OST를 좋아해서 일수도 있음
- 따라서 이것을 세부 분류하여 특정 기준을 바탕으로 2차원으로 행과 열을 분해하여 예측 평점을 구하는 것
4. 콘텐츠 기반 알고리즘
- 콘텐츠 기반 알고리즘은 사용자와 아이템간의 정보가 필요하지 않음
- 영화 타이틀을 기준으로 배우, 장르, 국가, 시대, 연령대 등 수백 개의 영화 특성을 분석해 영화 프로파일을 생성하고 사용자가 좋아한 영화를 바탕으로 사용자 프로파일을 도출
- 그리고 영화 프로파일과 사용자 프로파일을 비교해서 사용자 선호 영화를 추천하는 방식
번외
-
빅데이터 기반 넷플릭스 드라마 : ‘하우스 오브 카드(House of Cards)
- 이 드라마는 넷플릭스 유저들의 빅데이터를 분석하여 원하는 연출 스타일, 선호하는 배우 등을 예측
- 빅데이터 분석 결과 사람들이 주말에 드라마를 몰아 본 후 입소문을 잘 낸다는 결론을 도출하여 한 시즌 전체를 한번에 공개
- 이렇게 한 결과 무려 85%의 시청자가 만족하는 엄청난 인기 콘텐츠가 탄생
💡Today I Thought
오늘의 체크리스트
- 알고리즘 코드카타 1문제
- SQL 코드카타 1문제
- ML 공부
- 콘텐츠기반 ML 코드 작성하기
- 유저테스트 정리
- WIL 작성
- TIL 작성
회고
오늘은 ML 공부한거 다시 복습하고, 팀원들 동기/비동기 면접스터디 하는거 구경했다. 공부안했는데도 조금 지식 생긴 기분…🤔 그래도 나중에 쓸 일이 있을거 같으니까 자료화해서 한번 보기는 해야할 것 같다.
댓글남기기