추천 시스템

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

추천 시스템은 사용자에게 적합한 항목을 제안하는 기술로, 협업 필터링, 콘텐츠 기반 필터링, 하이브리드 방식 등 다양한 접근법이 사용된다. 1979년 엘레인 리치에 의해 최초의 추천 시스템이 개발되었으며, 넷플릭스 프라이즈와 같은 대회를 통해 알고리즘의 정확성을 향상시키려는 노력이 이루어졌다. 최근에는 인공지능 기술을 활용하여 성능을 개선하고 있으며, 세션 기반, 강화 학습 기반, 다기준, 위험 인지, 모바일 추천 시스템 등 다양한 형태의 시스템이 개발되고 있다. 추천 시스템의 평가는 정확도, 다양성, 참신성 등을 기준으로 이루어지며, 사용자 연구, A/B 테스트, 오프라인 평가 등의 방법이 사용된다. 그러나 오프라인 평가의 한계와 재현성 문제, 개인 정보 보호 문제 등 여러 가지 한계점도 존재한다.

이미지 준비중입니다.

정의	사용자의 선호도를 예측하는 시스템
목적	사용자에게 맞춤형 콘텐츠 또는 제품 추천 사용자의 정보 과부하 감소 사용자의 만족도 및 참여도 향상

협업 필터링	사용자 간의 유사성을 기반으로 추천 사용자-아이템 상호작용 데이터 활용 사용자 기반 협업 필터링 아이템 기반 협업 필터링
콘텐츠 기반 필터링	아이템의 특징을 분석하여 추천 사용자가 선호하는 아이템과 유사한 아이템 추천
하이브리드 추천	협업 필터링과 콘텐츠 기반 필터링의 장점 결합 다양한 추천 알고리즘 조합
지식 기반 추천	명시적인 지식 또는 규칙을 기반으로 추천 사용자의 요구사항과 아이템의 속성을 매칭

주요 알고리즘	협업 필터링 콘텐츠 기반 필터링 기계 학습 (예: 신경망, SVM) 행렬 분해 기타
성능 평가 지표	정밀도 재현율 F1 점수 MAE (평균 절대 오차) RMSE (제곱 평균 제곱근 오차)

활용 분야	전자 상거래 소셜 미디어 온라인 스트리밍 서비스 검색 엔진 뉴스 서비스 광고 플랫폼
시스템 구성 요소	데이터 수집 데이터 전처리 추천 모델 학습 추천 생성 결과 평가 지속적 개선
고려 사항	데이터 희소성 콜드 스타트 문제 확장성 다양성 최신성 설명 가능성

연구 분야	새로운 추천 알고리즘 개발 데이터 개인 정보 보호 기술 그룹 추천 시스템 대화형 추천 시스템 다중 목표 최적화
관련 연구	GroupLens Research MovieLens Netflix Prize ACM Conference on Recommender Systems

관련 용어	집단 지성 적합성 별점 평가 롱테일
구현 예시	협업 검색 엔진 콘텐츠 검색 플랫폼 의사 결정 지원 시스템 뮤직 게놈 프로젝트 제품 파인더
핵심 과제	콜드 스타트 차원 축소 암묵적 데이터 수집 아이템-아이템 협업 필터링 행렬 분해 선호도 유도 유사도 검색

2. 접근법

추천 시스템은 일반적으로 협업 필터링 방식과 콘텐츠 기반 필터링(content-based filtering, personality-based approach라고도 불림) 방식을 통해 추천 목록을 만든다.

협업 필터링과 콘텐츠 기반 필터링의 차이점은 라스트닷에프엠(Last.fm)과 판도라 라디오(Pandora Radio)와 같은 유명한 음악 추천 시스템을 통해 잘 나타난다.
* 라스트닷에프엠(Last.fm)은 사용자가 주로 들어온 밴드와 각각의 음원을 관찰하고 다른 사용자와의 행동을 비교하면서 추천될 음악의 “상태”를 만든다. 그 사용자의 음악 목록에는 없지만 비슷한 취향을 가진 다른 사용자가 자주 들었던 음악을 추천해 준다.
* 판도라 라디오(Pandora Radio)는 뮤직 지놈 프로젝트(Music Genome Project)에서 제공하는 400여 개의 특성을 사용하여 비슷한 특성이 있는 음악을 재생하는 “상태”를 만든다. 사용자의 피드백은 사용자가 특정한 음악에 싫어요를 눌렀을 때 그 특정한 속성을 약화하고 좋아요를 누른 음악을 강조하면서, 그 상태의 결과를 다듬기 위해 사용된다.

각각의 시스템은 모두 강점과 약점이 있다. 라스트닷에프엠(Last.fm)은 정확한 추천을 만들기 위해 한 사용자에 대한 많은 양의 정보를 필요로 한다. 이는 콜드 스타트 문제의 예시이며, 협업 필터링 시스템에서 일반적이다. 반면에 판도라 라디오(Pandora Radio)는 시작할 때 매우 적게 정보를 필요로 하는 반면에, 범위가 더 한정적이다.

추천 시스템은 사용자가 찾지 못한 것들을 발견하게 해 주기 때문에 검색 알고리즘의 유용한 대안이다.

사용자 프로필을 구축할 때, 명시적 데이터 수집과 암묵적 데이터 수집을 구분한다.

명시적 데이터 수집
* 사용자에게 항목에 대한 평가를 매기도록 한다(예: 5단계 평가).
* 사용자에게 여러 항목을 좋아하는 순서대로 순위를 매기도록 한다.
* 사용자에게 두 개의 항목을 제시하고 더 좋아하는 쪽을 선택하도록 한다.
* 사용자에게 좋아하는 항목 목록을 작성하도록 한다.

암묵적 데이터 수집
* 온라인 스토어에서 사용자가 항목을 참조하는 모습을 관찰한다.
* 각 항목을 보고 있던 시간을 분석한다.
* 사용자가 온라인으로 구매한 항목의 기록을 보관한다.
* 사용자가 온라인으로 시청한 항목 목록을 얻는다.
* 사용자의 사회적 네트워크를 분석하여 선호도를 파악한다.

2.1. 협업 필터링 (Collaborative Filtering)

협업 필터링은 추천 시스템 설계에서 널리 사용되는 접근 방식 중 하나이다. 협업 필터링은 과거에 동의했던 사람들은 미래에도 동의할 것이며, 과거에 좋아했던 것과 유사한 종류의 상품을 좋아할 것이라는 가정에 기반한다. 이 시스템은 서로 다른 사용자 또는 상품에 대한 평점 프로필 정보만을 사용하여 추천을 생성한다. 현재 사용자 또는 상품과 유사한 평점 이력을 가진 동료 사용자/상품을 찾음으로써, 이러한 이웃을 사용하여 추천을 생성한다. 협업 필터링 방법은 메모리 기반과 모델 기반으로 분류된다. 메모리 기반 접근 방식의 잘 알려진 예로는 사용자 기반 알고리즘이 있으며, 모델 기반 접근 방식의 예로는 행렬 분해 (추천 시스템)이 있다.

협업 필터링의 핵심 장점은 기계 분석 가능한 콘텐츠에 의존하지 않아도 된다는 점이다. 따라서 영화와 같이 복잡한 상품도 상품 자체를 "이해"하지 않고도 정확하게 추천할 수 있다. 추천 시스템에서 사용자 또는 상품의 유사성을 측정하기 위해 다양한 알고리즘이 사용된다. 예를 들어, k-최근접 이웃(k-NN) 접근 방식과 Allen이 처음 구현한 피어슨 상관 계수가 있다.

사용자 행동으로부터 모델을 구축할 때, 데이터 수집의 명시적 형태와 암시적 형태를 구분하는 경우가 많다.

명시적 데이터 수집의 예는 다음과 같다:

* 사용자에게 슬라이딩 스케일로 상품을 평가하도록 요청한다.
* 사용자에게 검색을 요청한다.
* 사용자에게 상품 모음을 가장 좋아하는 것부터 가장 좋아하지 않는 것까지 순위를 매기도록 요청한다.
* 사용자에게 두 개의 상품을 제시하고 그 중 더 나은 것을 선택하도록 요청한다.
* 사용자에게 자신이 좋아하는 상품 목록을 작성하도록 요청한다 (로치오 분류 또는 기타 유사한 기술 참조).

암시적 데이터 수집의 예는 다음과 같다:

* 온라인 상점에서 사용자가 본 상품을 관찰한다.
* 상품/사용자 시청 시간 분석.
* 사용자가 온라인으로 구매한 상품 기록을 보관한다.
* 사용자가 컴퓨터에서 듣거나 본 상품 목록을 얻는다.
* 사용자의 소셜 네트워크를 분석하고 유사한 좋아요와 싫어요를 발견한다.

협업 필터링 접근 방식은 콜드 스타트, 확장성 및 희소성의 세 가지 문제점을 겪는 경우가 많다.

* 콜드 스타트: 새로운 사용자 또는 상품의 경우 정확한 추천을 할 수 있을 만큼 충분한 데이터가 없다. 이 문제에 대한 일반적인 해결책은 다중 무장 밴딧 알고리즘을 사용하는 것이다.
* 확장성: 추천 시스템이 많은 환경에서 추천을 계산하려면 수백만 명의 사용자와 상품에 대한 데이터를 처리해야 하므로, 많은 컴퓨팅 성능이 필요할 수 있다.
* 희소성: 주요 전자상거래 사이트에서 판매되는 상품 수는 매우 많다. 가장 활동적인 사용자라도 전체 데이터베이스의 작은 하위 집합만 평가했을 가능성이 높다. 따라서 가장 인기 있는 상품조차도 평가가 매우 적을 수 있다.

아마존의 추천 시스템에서 대중화된 상품 간 협업 필터링(x를 구매하는 사람들은 y도 구매한다)은 가장 유명한 협업 필터링의 예 중 하나이다.

많은 소셜 네트워크는 원래 사용자와 그들의 친구 간의 연결 네트워크를 조사하여 새로운 친구, 그룹 및 기타 사회적 연결을 추천하는 데 협업 필터링을 사용했다. 협업 필터링은 여전히 하이브리드 시스템의 일부로 사용된다.

2.2. 콘텐츠 기반 필터링 (Content-based Filtering)

콘텐츠 기반 필터링(Content-based Filtering)은 아이템의 설명과 사용자 선호도 프로필을 기반으로 추천하는 방식이다. 사용자가 과거에 좋아했거나 현재 보고 있는 아이템과 비슷한 아이템을 추천하는 알고리즘을 사용한다.

이러한 시스템에서는 키워드를 사용하여 아이템을 설명하고, 사용자가 좋아하는 아이템 유형을 나타내는 사용자 프로필을 만든다. 다양한 후보 아이템을 사용자가 이전에 평가한 아이템과 비교하여 가장 일치하는 아이템을 추천한다. 이 접근 방식은 정보 검색과 정보 필터링 연구에 뿌리를 두고 있다.

* 정보 검색: 집합적 정보로부터 원하는 내용이나 관련되는 내용을 가져오는 것이다.
* 정보 필터링: 필요 없는 정보를 제거하는 것이다.

콘텐츠 기반 추천 시스템은 아이템의 특징을 추출하기 위해 tf-idf 알고리즘을 사용한다.

* Tf-idf (Term frequency-inverse document frequency): 여러 문서로 이루어진 문서군에서 어떤 단어가 특정 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치이다.

사용자 프로필을 만들기 위해 시스템은 주로 다음 두 가지 유형의 정보에 중점을 둔다.

1. 사용자 선호도 모델
2. 추천 시스템과의 사용자 상호 작용 이력

이러한 방법은 시스템 내에서 아이템을 특징짓는 아이템 프로필(이산 속성 및 특징의 집합)을 사용한다. 시스템은 아이템 특징의 가중 벡터를 기반으로 사용자의 콘텐츠 기반 프로필을 만든다. 가중치는 각 특징의 사용자에 대한 중요도를 나타낸다. 간단한 접근 방식은 평가된 아이템 벡터의 평균값을 사용하며, 베이지안 분류기, 군집 분석, 의사결정 트리, 인공 신경망과 같은 머신 러닝 기법을 사용하여 사용자가 아이템을 좋아할 확률을 추정하기도 한다.

사용자로부터 직접적인 피드백(‘좋아요’, ‘싫어요’ 등)은 특정 속성의 중요도에 대한 가중치를 조정하는 데 사용될 수 있다.

콘텐츠 기반 필터링의 주요 문제는 한 콘텐츠 소스에 관련된 사용자 행동으로부터 사용자 선호도를 학습하고 다른 콘텐츠 종류를 넘어 사용할 수 있는지 여부이다. 시스템이 사용자가 이미 사용한 것과 같은 종류의 콘텐츠를 추천하는 것으로 제한될 때, 추천 시스템의 가치는 상당히 낮아진다. 예를 들어, 뉴스 브라우징을 기반으로 뉴스 기사를 추천하는 것보다 다른 서비스의 음악, 비디오, 제품 토론 등을 추천할 수 있을 때 더 유용하다.

판도라 라디오(Pandora Radio)는 콘텐츠 기반 추천 시스템의 한 예이다. 사용자가 제공한 노래와 비슷한 특징의 음악을 재생하며, 사용자 피드백을 통해 스테이션의 결과를 개선한다.

2.3. 하이브리드 방식 (Hybrid Recommender Systems)

하이브리드 방식(Hybrid Recommender Systems)은 협업 필터링과 콘텐츠 기반 필터링(content-based filtering) 방식을 결합하여 추천 시스템의 성능을 향상시키는 방법이다. 최근 연구에 따르면, 이 두 가지 방식을 섞은 하이브리드 접근법이 특정 상황에서 더 효과적일 수 있다고 알려져 있다.

하이브리드 접근법은 다양한 방식으로 구현될 수 있다. 예를 들어, 각 접근법의 예측을 별도로 수행 후 결합하거나, 협업 기반 방식에 콘텐츠 기반 기능을 추가(또는 그 반대)하거나, 여러 방식을 하나의 모델로 통합하는 방법 등이 있다.

몇몇 연구들은 하이브리드 방식이 순수 협업 필터링이나 콘텐츠 기반 필터링보다 더 정확한 추천을 제공한다고 보고한다. 또한, 이러한 방법들은 콜드 스타트나 희소성(sparsity) 문제와 같은 추천 시스템의 일반적인 문제들을 극복하는 데 도움을 줄 수 있다.

넷플릭스(Netflix)는 하이브리드 추천 시스템의 좋은 예시이다. 넷플릭스는 사용자가 높게 평가했던 영화와 비슷한 특성을 가진 영화를 추천(content-based)하고, 비슷한 사용자들의 검색 습관과 시청 기록을 비교(collaborative)하여 추천을 제공한다.

하이브리드 기법에는 다음과 같은 종류가 있다:

1. 가중치 방식 (Weighted): 여러 추천 요소들의 점수를 수학적으로 결합한다.
2. 전환 방식 (Switching): 시스템이 추천 요소들 중에서 선택하고, 선택된 것을 적용한다.
3. 혼합 방식 (Mixed): 여러 추천자로부터의 추천들을 함께 보여준다.
4. 특징 조합 방식 (Feature Combination): 다른 지식 소스들로부터 나온 특징들을 합쳐서 하나의 추천 알고리즘에 사용한다.
5. 특징 보강 방식 (Feature Augmentation): 하나의 추천 기술을 사용하여 특징을 생성하고, 이 특징을 다음 기술의 입력으로 사용한다.
6. 캐스케이드 방식 (Cascade): 추천자에게 엄격한 우선순위를 부여하고, 낮은 우선순위의 추천자는 높은 우선순위의 추천자에서 동점인 항목들의 순위를 정한다.
7. 메타 레벨 방식 (Meta-level): 하나의 추천 기술을 적용하여 모델을 만들고, 이 모델을 다음 기술의 입력으로 사용한다.

3. 추천 시스템의 역사

추천 시스템 개발의 선구적인 연구는 1979년 엘레인 리치(Elaine Rich)가 개발한 그런디(Grundy)라는 시스템에서 찾을 수 있다. 이 시스템은 사용자에게 특정 질문을 하여 얻은 답변을 바탕으로 사용자의 선호도를 파악하고, 이를 "고정관념"으로 분류하여 적합한 책을 추천했다.

1990년에는 컬럼비아 대학교의 유시 카를그렌(Jussi Karlgren)이 "디지털 책장"이라는 초기 추천 시스템에 대한 기술 보고서를 발표했다. 이후 1994년부터 스웨덴 왕립 공과대학(SICS)의 유시 카를그렌, MIT의 패티 메이스(Pattie Maes)가 이끄는 연구 그룹, 벨코어(Bellcore)의 윌 힐(Will Hill), 그리고 MIT의 폴 레즈닉(Paul Resnick)(그의 그룹렌즈(GroupLens) 작업은 2010년 ACM 소프트웨어 시스템 상을 수상했다.)에 의해 대규모로 구현되고 연구되었다.

추천 시스템은 크게 협업 필터링 방식과 콘텐츠 기반 필터링(personality-based approach라고도 불림) 방식을 사용한다. 협업 필터링은 사용자의 과거 행동과 다른 사용자의 유사한 결정을 바탕으로 모델을 구축하여 사용자가 관심을 가질 만한 항목을 예측한다. 콘텐츠 기반 필터링은 항목의 특성을 활용하여 유사한 속성을 가진 추가 항목을 추천한다.

라스트닷에프엠(Last.fm)과 판도라 라디오(Pandora Radio)는 협업 필터링과 콘텐츠 기반 필터링의 차이점을 보여주는 대표적인 음악 추천 시스템이다.

* 라스트닷에프엠(Last.fm)은 사용자의 청취 기록을 분석하고 다른 사용자와 비교하여 유사한 관심사를 가진 사용자들이 자주 듣는 음악을 추천한다. 이는 협업 필터링의 예시이다.
* 판도라(Pandora)는 뮤직 지놈 프로젝트(Music Genome Project)에서 제공하는 400개의 음악 속성을 기반으로 유사한 속성을 가진 음악을 재생하며, 사용자 피드백을 통해 결과를 개선한다. 이는 콘텐츠 기반 접근 방식의 예이다.

각 시스템은 장단점이 있다. 라스트닷에프엠(Last.fm)은 정확한 추천을 위해 많은 정보가 필요하며, 이는 콜드 스타트 문제로 이어진다. 반면 판도라는 시작 시 정보가 적게 필요하지만, 추천 범위가 제한적이다.

추천 시스템은 사용자가 찾지 못한 항목을 발견하도록 돕는 검색 알고리즘의 대안이며, 비전통적인 데이터를 색인하는 검색 엔진을 사용하여 구현되기도 한다.

4. 추천 시스템의 기술

추천 시스템은 협업 필터링과 콘텐츠 기반 필터링(personality-based approach라고도 불림) 방식을 사용하여 추천 목록을 만든다. 지식 기반 시스템과 같은 다른 시스템도 사용된다.

협업 필터링과 콘텐츠 기반 필터링의 차이점은 라스트닷에프엠(Last.fm)과 판도라 라디오(Pandora Radio)를 통해 비교할 수 있다.
* 라스트닷에프엠은 사용자가 정기적으로 듣는 밴드와 트랙을 관찰하고, 다른 사용자의 청취 행동과 비교하여 "스테이션"을 만든다. 유사한 관심사를 가진 다른 사용자가 자주 듣는 트랙을 재생하여 사용자에게 추천한다.
* 판도라는 뮤직 지놈 프로젝트(Music Genome Project)에서 제공하는 400개의 속성 중 일부를 사용하여 노래나 아티스트의 속성을 기반으로 "스테이션"을 생성한다. 사용자 피드백을 통해 "싫어요"를 누른 노래의 특정 속성 중요도를 낮추고, "좋아요"를 누른 노래의 다른 속성 중요도를 높여 결과를 개선한다.

각 시스템은 장단점이 있다. 라스트닷에프엠은 정확한 추천을 위해 많은 사용자 정보가 필요하며, 이는 콜드 스타트 문제로 이어진다. 반면 판도라는 시작 시 적은 정보만 필요하지만, 추천 범위가 제한적이다.

추천 시스템은 사용자가 찾지 못했을 항목을 발견하도록 돕는 검색 알고리즘의 대안이며, 비전통적인 데이터를 색인하는 검색 엔진을 사용하여 구현되기도 한다.

추천 시스템은 여러 특허를 받았으며, LensKit, RecBole, ReChorus 및 RecPack을 포함하여 추천 시스템 개발을 지원하는 50개 이상의 소프트웨어 라이브러리가 있다.

사용자 프로필 구축을 위해 데이터 수집의 명시적, 암묵적 부분을 구분한다. 명시적 데이터 수집에는 사용자의 항목 평가, 순위 매기기, 선호도 선택, 목록 작성 등이 있다. 암묵적 데이터 수집에는 온라인 스토어에서의 사용자 행동 관찰, 항목 조회 시간 분석, 구매 기록 보관, 시청 목록 획득, 사회적 네트워크 분석 등이 있다.

추천 시스템은 수집된 데이터를 다른 데이터와 비교하여 사용자에게 추천할 항목 목록을 계산한다. 협업 필터링 항목에 상업적 또는 비상업적 예시가 있다. Adomavicius는 추천 시스템의 개요를, Herlocker는 추천 시스템의 평가 기법 개요를 제공한다.

추천 시스템은 정보 검색의 대안으로, 사용자가 스스로 찾을 수 없는 항목을 제시할 수 있으며, 비표준 데이터에 색인을 단 검색 엔진을 사용하여 구현되는 경우가 많다.

추천 시스템에서 자주 사용되는 알고리즘으로 최근접 이웃 검색이 있다. 상관 계수를 계산하여 사회적 네트워크에서 특정 사용자와 가까운 상위 N개의 이웃을 찾고, 그 선호도를 통해 사용자의 선호도를 예측할 수 있다.

넷플릭스 프라이즈는 1억 개 이상의 영화 평점 정보를 기반으로 가장 정확한 검색을 수행한 알고리즘에 100만 달러를 제공했다. 2007년 가장 정확한 알고리즘은 107개의 알고리즘을 조합하여 예측했다.

4.1. 세션 기반 추천 시스템 (Session-based Recommender Systems)

이러한 추천 시스템은 세션 내 사용자의 상호 작용을 사용하여 추천을 생성한다. 세션 기반 추천 시스템은 유튜브와 아마존에서 사용된다. 이러한 시스템은 사용자의 과거 기록(예: 이전 클릭, 구매)을 사용할 수 없거나 현재 사용자 세션과 관련이 없는 경우 특히 유용하다. 세션 기반 추천이 특히 중요한 분야에는 비디오, 전자상거래, 여행, 음악 등이 있다. 대부분의 세션 기반 추천 시스템은 사용자의 추가적인 정보(기록, 인구 통계) 없이 세션 내 최근 상호 작용 순서에 의존한다. 세션 기반 추천 기술은 주로 순환 신경망, 트랜스포머 및 기타 심층 학습 기반 접근 방식과 같은 생성 순차 모델을 기반으로 한다.

4.2. 강화 학습 기반 추천 시스템 (Reinforcement Learning for Recommender Systems)

추천 문제는 강화 학습 문제의 특수한 경우로 볼 수 있다. 여기서 사용자는 환경이며, 에이전트(추천 시스템)는 사용자에게 영향을 미쳐 보상(예: 클릭 또는 참여)을 받는다. 강화 학습이 추천 시스템 분야에서 특히 유용한 점 중 하나는 모델 또는 정책을 추천 에이전트에 보상을 제공하여 학습할 수 있다는 것이다. 이는 전통적인 지도 학습 방식에 의존하는 기존 학습 기법과 대조적이다. 강화 학습 추천 기법은 참여 및 사용자 관심도 지표에 따라 모델을 직접 최적화할 수 있는 잠재력을 제공한다.

4.3. 다기준 추천 시스템 (Multi-criteria Recommender Systems)

다기준 추천 시스템(MCRS, Multi-criteria recommender systems)은 여러 기준에 대한 선호도 정보를 통합하는 추천 시스템으로 정의할 수 있다. 단일 기준 값에 기반한 추천 기법을 개발하는 대신, 이러한 시스템은 사용자 u의 탐색되지 않은 항목 i에 대한 평점을 예측하기 위해 이러한 전반적인 선호도 값에 영향을 미치는 여러 기준에 대한 선호도 정보를 활용하려고 한다. 여러 연구자들은 MCRS를 다기준 의사결정(MCDM, multi-criteria decision making) 문제로 접근하여 MCDM 방법 및 기법을 적용하여 MCRS 시스템을 구현한다. 자세한 소개는 이 장을 참조한다.

4.4. 위험 인지 추천 시스템 (Risk-aware Recommender Systems)

기존의 추천 시스템 접근 방식 대부분은 맥락 정보를 사용하여 사용자에게 가장 관련성이 높은 콘텐츠를 추천하는 데 중점을 두지만, 원치 않는 알림으로 사용자를 불편하게 할 위험은 고려하지 않는다. 전문적인 회의 중, 이른 아침, 늦은 밤과 같이 특정 상황에서 추천을 제공함으로써 사용자를 불쾌하게 할 위험을 고려하는 것이 중요하다. 따라서 추천 시스템의 성능은 추천 과정에 위험 요소를 어느 정도 통합했는지에 따라 달라진다. 이 문제를 관리하는 한 가지 방법은 맥락 인식 추천을 밴딧 문제로 모델링하는 DRARS 시스템이다. 이 시스템은 콘텐츠 기반 기법과 맥락 밴딧 알고리즘을 결합한다.

4.5. 모바일 추천 시스템 (Mobile Recommender Systems)

모바일 추천 시스템은 인터넷에 접속 가능한 스마트폰을 활용하여 개인화되고 상황에 맞는 추천을 제공한다. 모바일 데이터는 추천 시스템이 종종 처리해야 하는 데이터보다 훨씬 복잡하기 때문에 이는 특히 어려운 연구 분야이다. 모바일 데이터는 이질적이고, 노이즈가 많으며, 공간적 및 시간적 자기 상관 관계를 필요로 하고, 검증 및 일반화 문제를 가지고 있다.

모바일 추천 시스템과 예측 결과의 정확도에 영향을 미칠 수 있는 세 가지 요소는 상황, 추천 방법 및 개인 정보 보호이다. 또한, 모바일 추천 시스템은 이식성 문제를 겪는다. 즉, 추천이 모든 지역에 적용될 수 있는 것은 아니다(예를 들어, 모든 재료를 구할 수 없는 지역에서 레시피를 추천하는 것은 현명하지 않다).

모바일 추천 시스템의 한 예로는 우버(Uber)와 리프트(Lyft)와 같은 회사가 도시의 택시 운전사를 위한 운전 경로를 생성하기 위해 사용하는 접근 방식이다. 이 시스템은 택시 운전사가 근무 중에 이용하는 경로의 GPS 데이터를 사용하는데, 여기에는 위치(위도 및 경도), 시간 스탬프 및 운영 상태(승객 유무)가 포함된다. 이 데이터를 사용하여 경로를 따라 픽업 지점 목록을 추천하고, 점유 시간과 이익을 최적화하는 것을 목표로 한다.

5. 인공지능의 응용

추천 시스템은 협업 필터링과 콘텐츠 기반 필터링 방식을 사용하여 추천 목록을 만든다. 지식 기반 시스템과 같은 다른 시스템도 사용되지만, 일반적으로 협업 필터링과 콘텐츠 기반 필터링 중 하나 또는 둘 다를 사용한다.

협업 필터링과 콘텐츠 기반 필터링의 차이점은 라스트닷에프엠(Last.fm)과 판도라 라디오(Pandora Radio)를 통해 비교할 수 있다.
* 라스트닷에프엠은 사용자가 정기적으로 듣는 밴드와 트랙을 다른 사용자의 청취 기록과 비교하여 유사한 취향의 사용자가 자주 듣는 음악을 추천한다. 이는 사용자 행동을 활용하는 협업 필터링의 예시이다.
* 판도라는 뮤직 지놈 프로젝트(Music Genome Project)에서 제공하는 400개의 음악 속성을 사용하여 비슷한 속성을 가진 음악을 재생한다. 사용자 피드백을 통해 특정 속성의 중요도를 조정하여 결과를 개선하는 콘텐츠 기반 접근 방식이다.

각 시스템은 장단점이 있다. 라스트닷에프엠은 정확한 추천을 위해 많은 정보가 필요하며, 이는 콜드 스타트 문제로 이어진다. 반면 판도라는 시작 정보가 적어도 되지만, 추천 범위가 제한적이다.

추천 시스템은 사용자가 찾지 못했을 항목을 발견하게 해 준다는 점에서 검색 알고리즘의 유용한 대안이다.

추천 시스템에서의 인공지능(AI) 응용은 인공지능 기술을 활용하여 추천 엔진의 성능을 향상시키는 고급 방법론이다. AI 기반 추천 시스템은 복잡한 데이터 세트를 분석하여 사용자 행동, 선호도 및 상호 작용으로부터 학습하여 매우 정확하고 개인화된 콘텐츠 또는 제품 제안을 생성한다.

추천 시스템은 기계 학습, 심층 학습, 자연어 처리와 같은 AI 기술을 광범위하게 채택한다. 이러한 기술은 사용자의 선호도를 예측하고 개인화된 콘텐츠를 더 정확하게 제공하는 시스템 기능을 향상시킨다.

5.1. 협업 필터링에서의 KNN

협업 필터링에서 사용자를 분류할 때, 분류 대상과 가까운 k개를 뽑아 그 중 가장 많은 비율을 차지하는 쪽으로 분류하는 KNN 알고리즘이 사용된다. KNN은 추천 시스템에서 사용자나 아이템의 유사성을 측정하는 데 사용되는 여러 알고리즘 중 하나이다.

AI가 적용된 협업 필터링의 일반적인 모델은 K-최근접 이웃이다. 작동 방식은 다음과 같다.

# 데이터 표현: 각 축이 사용자의 특성(평점, 구매 등)을 나타내는 n차원 공간을 만들고, 사용자를 그 공간의 한 점으로 나타낸다.
# 통계적 거리: 통계적 거리를 이용하여 이 공간에서 사용자 간의 거리를 측정한다.
# 이웃 식별: 계산된 거리를 기반으로, 추천을 하고자 하는 사용자의 k개의 최근접 이웃을 찾는다.
# 예측 추천 형성: k개 이웃의 유사한 선호도를 분석하여 그 유사성을 기반으로 추천을 한다.

최근접 이웃 검색은 추천 시스템에서 자주 사용되는 알고리즘이다. 사회적 네트워크에서 특정 사용자와 가까운 상위 N개의 이웃(가중치를 부여한)과의 상관 계수를 계산함으로써 그 선호도 공간에서의 이웃을 알 수 있다. 사용자의 선호도는 그 데이터를 어떤 기법으로 계산함으로써 예측할 수 있다.

5.2. 신경망 (Neural Networks)

인공 신경망(ANN, artificial neural network)은 인간의 뇌를 모방하는 것을 목표로 하는 심층 학습 모델 구조이다. 인공 신경망은 일련의 뉴런으로 구성되며, 각 뉴런은 다른 상호 연결된 뉴런에서 전달되는 정보를 수신하고 처리하는 역할을 한다. 인간의 뇌와 마찬가지로, 이러한 뉴런은 입력 신호(훈련 입력 및 역전파된 출력)에 따라 활성화 상태를 변경하여 네트워크 학습 단계 동안 활성화 가중치를 조정할 수 있다. ANN은 일반적으로 블랙 박스 모델로 설계된다. 기본적인 이론적 구성 요소가 공식적이고 엄격한 일반적인 기계 학습과 달리, 뉴런의 협력 효과는 완전히 명확하지 않지만, 현대적인 실험은 ANN의 예측력을 보여주었다.

ANN은 다양한 데이터를 활용하는 능력 때문에 추천 시스템에서 널리 사용된다. 피드백 데이터 외에도, ANN은 협업 필터링으로 학습하기에는 너무 복잡한 비피드백 데이터를 통합할 수 있으며, 고유한 구조를 통해 ANN은 비피드백 데이터에서 추가적인 신호를 식별하여 사용자 경험을 향상시킬 수 있다. 예를 들면 다음과 같다.

* 시간 및 계절성: 사용자가 플랫폼과 상호 작용하는 특정 시간, 날짜 또는 계절
* 사용자 탐색 패턴: 방문한 페이지 순서, 웹사이트의 여러 부분에 소비한 시간, 마우스 움직임 등
* 외부 사회적 트렌드: 외부 소셜 미디어의 정보

추천 시스템에서 자주 사용되는 알고리즘으로 최근접 이웃 검색이 있다. 사회적 네트워크에서 특정 사용자와 가까운 상위 N개의 이웃(가중치를 부여한)과의 상관 계수를 계산함으로써 그 선호도(지향) 공간에서의 이웃을 알 수 있다. 사용자의 선호도는 그 데이터를 어떤 기법으로 계산함으로써 예측할 수 있다.

넷플릭스 프라이즈(Netflix Prize)는 1억 개 이상의 영화 평점 정보를 수집하여, 그에 대해 가장 정확한 검색을 수행한 새로운 알고리즘에 1를 제공하는 것이다. 2007년 가장 정확한 알고리즘은 107개의 알고리즘을 조합하여 하나의 예측을 도출했다.

5.2.1. 2중 타워 모델 (Two-Tower Model)

투 타워 모델(Two-Tower model)은 대규모 추천 시스템, 특히 후보 검색 작업에 널리 사용되는 신경망 아키텍처이다. 이 모델은 다음 두 개의 신경망으로 구성된다.

* 사용자 타워(User Tower): 사용자 특징(예: 상호작용 이력, 인구 통계학적 데이터)을 인코딩한다.
* 아이템 타워(Item Tower): 아이템 특징(예: 메타데이터, 콘텐츠 임베딩)을 인코딩한다.

두 타워의 출력은 사용자와 아이템을 공유 벡터 공간에 나타내는 고정 길이 임베딩이다. 내적이나 코사인 유사도와 같은 유사도 측정법을 사용하여 사용자와 아이템 간의 관련성을 측정한다.

이 모델은 아이템에 대한 임베딩을 미리 계산할 수 있으므로 추론 중에 빠른 검색이 가능하여 대규모 데이터 세트에 매우 효율적이다. 종종 엔드투엔드 추천 파이프라인을 위한 순위 모델과 함께 사용된다.

5.3. 자연어 처리 (Natural Language Processing, NLP)

자연어 처리(Natural Language Processing, NLP)는 기계가 자연어를 이해하고 분석할 수 있도록 하는 인공지능(AI) 알고리즘이다. 이는 방대한 텍스트 정보에서 영감을 받은 비교적 최신 기술이다. 추천 시스템의 일반적인 적용 사례는 아마존 고객 리뷰이다. 아마존은 고객의 피드백 의견을 분석하여 다른 고객이 참조할 수 있는 관련 데이터를 제공한다. 최근 잠재 의미 분석(latent semantic analysis, LSA), 특이값 분해(singular value decomposition, SVD), 잠재 디리클레 할당(latent Dirichlet allocation, LDA) 등 다양한 텍스트 분석 모델이 개발되었다. 이러한 모델은 고객에게 더 정확하고 맞춤화된 추천을 제공하는 것을 목표로 한다.

6. 구체적인 응용 사례

추천 시스템은 사용자의 선호도, 과거 행동, 유사 사용자 정보 등을 분석하여 사용자가 좋아할 만한 아이템을 추천해 주는 시스템이다. 구체적인 응용 사례는 다음과 같다.

* 아마존: 온라인 소매업체인 아마존은 사용자의 구매 내역, 검색 기록 등을 바탕으로 추천 상품을 제시한다.
* 라스트닷에프엠: 음악 서비스인 라스트닷에프엠은 사용자가 주로 듣는 음악, 밴드 등을 분석하고 다른 사용자와의 행동을 비교하여 음악을 추천한다.
* 넷플릭스: DVD 대여 서비스인 넷플릭스는 사용자가 높게 평가한 영화와 비슷한 특성을 가진 영화를 추천하거나, 비슷한 사용자들의 검색 및 시청 기록을 바탕으로 추천한다.
* 레딧: 뉴스 및 추천 시스템을 제공하는 레딧은 사용자의 관심사, 구독 정보 등을 바탕으로 뉴스와 콘텐츠를 추천한다.
* 츠타야 디스카스: DVD 및 CD 대여 서비스인 츠타야 디스카스는 사용자의 대여 기록, 평가 등을 바탕으로 DVD와 CD를 추천한다.

이 외에도 링크트인, 페이스북과 같은 소셜 네트워크 서비스는 협업 필터링(Collaborative filtering)을 사용하여 친구를 추천하기도 한다.

7. 평가

추천 알고리즘의 효과를 평가하기 위해서는 평가가 중요하다. 추천 시스템의 효과를 측정하고 서로 다른 접근 방식을 비교하기 위해 사용자 연구, 온라인 평가(A/B 테스트), 오프라인 평가의 세 가지 유형의 평가가 있다.

일반적으로 사용되는 지표는 평균 제곱 오차와 제곱근 평균 제곱 오차이며, 후자는 넷플릭스 프라이즈에서 사용되었다. 정밀도 및 재현율 또는 DCG와 같은 정보 검색 지표는 추천 방법의 품질을 평가하는 데 유용하다.

고정된 테스트 데이터 세트에서 추천 알고리즘의 성능을 평가하는 것은 실제 사용자의 추천에 대한 반응을 정확하게 예측하는 것이 불가능하기 때문에 매우 어렵다. 따라서 오프라인 데이터에서 알고리즘의 효과를 계산하는 모든 지표는 부정확할 수 있다.

사용자 연구는 규모가 상당히 작다. 수십 명 또는 수백 명의 사용자에게 서로 다른 추천 접근 방식에 의해 생성된 추천이 제시되고, 사용자는 어떤 추천이 가장 좋은지 판단한다.

A/B 테스트에서는 추천이 일반적으로 실제 제품의 수천 명의 사용자에게 표시되며, 추천 시스템은 추천을 생성하기 위해 적어도 두 가지 서로 다른 추천 접근 방식을 무작위로 선택한다. 효과는 전환율 또는 클릭률과 같은 암시적 효과 측정값으로 측정된다.

오프라인 평가는 과거 데이터(예: 사용자가 이전에 영화를 평가한 방법에 대한 정보가 포함된 데이터 세트)를 기반으로 한다. 추천 접근 방식의 효과는 추천 접근 방식이 데이터 세트에서 사용자의 평가를 얼마나 잘 예측할 수 있는지에 따라 측정된다. 평가는 사용자가 영화를 좋아했는지에 대한 명시적인 표현이지만, 모든 영역에서 이러한 정보를 사용할 수 있는 것은 아니다. 예를 들어, 인용 추천 시스템 영역에서 사용자는 일반적으로 인용 또는 추천된 기사를 평가하지 않는다. 이러한 경우 오프라인 평가는 암시적 효과 측정값을 사용할 수 있다. 예를 들어, 연구 기사의 참고 목록에 포함된 가능한 한 많은 기사를 추천할 수 있는 추천 시스템이 효과적이라고 가정할 수 있다.

그러나 이러한 종류의 오프라인 평가는 많은 연구자들에 의해 비판적으로 여겨진다. 예를 들어, 오프라인 평가 결과는 사용자 연구 또는 A/B 테스트 결과와 상관관계가 낮다는 것이 입증되었다. 오프라인 평가에 자주 사용되는 데이터 세트에는 중복 데이터가 포함되어 있어 알고리즘 평가에서 잘못된 결론으로 이어지는 것으로 나타났다. 종종 소위 오프라인 평가의 결과는 실제로 평가된 사용자 만족도와 상관관계가 없다. 이는 아마도 오프라인 교육이 접근 가능한 항목에 크게 치우쳐 있고, 오프라인 테스트 데이터가 온라인 추천 모듈의 출력에 크게 영향을 받기 때문일 것이다. 연구자들은 오프라인 평가 결과를 비판적으로 검토해야 한다는 결론을 내렸다.

추천 시스템은 오프라인 평가가 매우 어려운 것으로 악명이 높으며, 일부 연구자들은 이로 인해 추천 시스템 논문에서 재현성 위기가 초래되었다고 주장한다. 재현성 문제는 일부 기계 학습 논문 발표 장소에서 반복적으로 제기되는 문제이지만, 과학 논문 발표 분야를 넘어서는 상당한 영향은 미치지 않는다. 추천 시스템의 맥락에서 2019년 한 논문은 최상위 학회(SIGIR, KDD, WWW, RecSys, IJCAI)에 발표된 상위 k 추천 문제에 딥러닝 또는 신경망 방법을 적용한 소수의 엄선된 논문들을 조사하여 평균적으로 40% 미만의 논문만이 설문 조사 저자들에 의해 재현될 수 있었으며, 일부 학회에서는 14%에 불과하다는 것을 보여주었다. 해당 논문은 오늘날 연구 학문의 여러 잠재적 문제점들을 고려하고 그 분야에서 개선된 과학적 관행을 제안한다.

같은 방법들의 벤치마킹에 대한 최근 연구는 정성적으로 매우 다른 결과를 보였다. 신경망 방법이 최고 성능의 방법 중 하나로 나타났다. 추천 시스템을 위한 딥러닝 및 신경망 방법은 최근 여러 추천 시스템 경진 대회, WSDM, RecSys 챌린지에서 우승 솔루션에 사용되었다.

또한, 신경망 및 딥러닝 방법은 업계에서 광범위하게 사용되며 광범위하게 테스트된다. 추천 시스템에서 재현성 문제는 새로운 것이 아니다. 2011년까지 Ekstrand, Konstan 등은 "현재 추천 시스템 연구 결과를 재현하고 확장하기 어렵다"고 비판했으며, 평가가 "일관되게 처리되지 않는다"고 지적했다. 콘스탄과 아도마비시우스는 "추천 시스템 연구 커뮤니티는 상당수의 논문이 집단적 지식에 거의 기여하지 않는 결과를 제시하는 위기에 직면해 있으며 [...] 종종 연구에 [...] 적절한 평가가 부족하여 의미 있는 기여를 제공하지 못하기 때문이다"라고 결론지었다. 결과적으로 추천 시스템에 대한 많은 연구는 재현할 수 없는 것으로 간주될 수 있다. 따라서 추천 시스템 운영자는 추천 시스템에서 어떤 추천 접근 방식을 사용할지에 대한 질문에 답하기 위해 현재 연구에서 거의 지침을 찾을 수 없다. Said와 Bellogín은 해당 분야에 발표된 논문을 연구하고 가장 인기 있는 추천 프레임워크 중 일부를 벤치마킹하여 동일한 알고리즘과 데이터 세트를 사용한 경우에도 결과에 큰 불일치가 있음을 발견했다. 일부 연구자들은 추천 알고리즘이나 시나리오의 사소한 변화가 추천 시스템의 효과에 큰 변화를 가져온다는 것을 보여주었다. 그들은 현재 상황을 개선하기 위해 7가지 조치가 필요하다고 결론지었습니다. "(1) 다른 연구 분야를 조사하고 그곳에서 배우고, (2) 재현성에 대한 공통된 이해를 찾고, (3) 재현성에 영향을 미치는 결정 요인을 식별하고 이해하고, (4) 보다 포괄적인 실험을 수행하고 (5) 출판 관행을 현대화하고, (6) 추천 프레임워크의 개발 및 사용을 촉진하고, (7) 추천 시스템 연구를 위한 모범 사례 지침을 수립한다."

7.1. 정확도 지표

(원본 소스에는 '정확도 지표'에 대한 구체적인 내용이 없으므로, 해당 섹션에는 내용을 추가할 수 없습니다. 원본 소스에 관련 내용이 추가되면 업데이트할 수 있습니다.)

7.2. 정확도 외 지표

추천 시스템 연구는 주로 가장 정확한 추천 알고리즘을 찾는 데 중점을 두지만, 그 외에도 고려해야 할 중요한 요소들이 많다.

* 다양성 (Diversity): 사용자들은 서로 다른 아티스트의 아이템과 같이 더 높은 intra-list 다양성을 가진 추천을 선호하는 경향이 있다.
* 추천 지속성 (Recommender persistence): 어떤 경우에는 추천을 다시 보여주거나 사용자가 아이템을 다시 평가하도록 하는 것이 더 효과적일 수 있다.
* 개인 정보 보호 (Privacy): 추천 시스템은 사용자가 민감한 정보를 공개해야 하므로 개인 정보 보호 문제를 해결해야 한다. 협업 필터링을 사용하여 사용자 프로필을 만드는 것은 개인 정보 보호 측면에서 문제가 될 수 있다. 많은 유럽 국가들은 데이터 프라이버시에 대한 강력한 문화를 가지고 있으며, 사용자 프로필을 만드는 어떠한 단계를 도입하려는 시도는 부정적인 사용자 반응을 초래할 수 있다. Netflix Prize competition을 위해 Netflix에서 제공한 데이터 셋과 관련하여 많은 개인 정보 보호 문제가 발생했다. 데이터 셋은 고객의 개인 정보를 보호하기 위해 익명화되었지만, 2007년 텍사스 대학의 두 연구자는 인터넷 영화 데이터베이스(IMDB)의 영화 평가 데이터 셋과 매칭하여 사용자 개개인을 식별할 수 있었다. 그 결과, 2009년 12월 한 익명의 Netflix 사용자가 Netflix를 고소했고, 이는 2010년 두 번째 Netflix Prize competition을 취소하는 데 부분적으로 영향을 미쳤다. 많은 연구들이 이 영역에서 진행 중인 개인 정보 보호 문제를 다루고 있다. Ramakrishnan은 개인화와 정보 보호 사이의 교환에 대한 확장적인 개요를 제시했고, 다른 데이터 소스와 약한 연결(우연히 발견한 추천을 제공하는 예상치 못한 연결)의 조합이 익명화된 데이터 셋에서 사용자의 정체를 발견하는 데 사용될 수 있음을 발견했다.
* 사용자 인구 통계 (User demographics): Beel은 사용자 인구 통계가 사용자가 추천에 얼마나 만족하는지에 영향을 줄 수 있음을 발견했다. 그들의 연구에서 나이가 많은 사용자들이 어린 사용자들보다 추천에 더 관심을 보이는 경향이 있다는 것을 증명했다.
* 견고성 (Robustness): 사용자가 추천 시스템에 참여할 수 있을 때, 속임수 문제(the issue of fraud)는 반드시 다뤄져야 한다.
* 뜻밖의 발견 (Serendipity): 뜻밖의 발견(Serendipity)은 추천 시스템이 얼마나 놀라운 결과를 제공하는지에 대한 척도이다. 예를 들어, 마트에서 고객에게 우유를 추천하는 시스템은 완벽하게 정확할 수 있지만, 고객이 구매할 품목이 너무 명백하기 때문에 좋은 추천이라고 할 수 없다. 그러나 뜻밖의 발견은 정확도에 부정적인 영향을 줄 수 있다.
* 신뢰 (Trust): 추천 시스템은 사용자가 시스템을 신뢰하지 않으면 가치가 없다. 신뢰는 추천이 어떻게 만들어졌는지, 왜 이 아이템을 추천했는지를 설명함으로써 쌓을 수 있다.
* 라벨링 (Labelling): 추천에 대한 사용자의 만족도는 추천의 라벨링(그룹 짓기, 이름 짓기)에 따라 영향을 받을 수 있다. 예를 들어, 한 연구에서 "sponsored"로 표시된 추천의 클릭률(CTR)은 "Organic"으로 표시된 동일한 추천의 CTR보다 낮았다. 해당 연구에서 라벨이 없는 추천이 가장 좋은 성능을 보였다.

7.3. 평가 방법

추천 시스템 연구에 활력을 불어넣은 사건 중 하나는 넷플릭스 프라이즈이다. 2006년부터 2009년까지 넷플릭스는 1억 개가 넘는 영화 평점 데이터 세트를 제공하고, 회사의 기존 추천 시스템보다 10% 더 정확한 추천을 제공하는 팀에게 1의 상금을 제공하는 대회를 후원했다. 이 대회는 새롭고 더 정확한 알고리즘을 찾는 노력에 활력을 불어넣었다. 2009년 9월 21일, 1의 상금은 동률 해소 규칙을 사용한 BellKor's Pragmatic Chaos 팀에게 수여되었다.

2007년 가장 정확한 알고리즘은 107가지의 서로 다른 알고리즘적 접근 방식을 하나의 예측으로 결합하는 앙상블 방법을 사용했다. Bell 등 수상자들은 다음과 같이 말했다.

> 여러 예측 변수를 결합할 때 예측 정확도가 크게 향상됩니다. 우리의 경험에 따르면 대부분의 노력은 단일 기술을 개선하는 것보다 상당히 다른 접근 방식을 도출하는 데 집중해야 합니다. 따라서 우리의 솔루션은 여러 방법의 앙상블입니다.

넷플릭스 프로젝트 덕분에 웹에 많은 이점이 생겼다. 일부 팀은 자체 기술을 다른 시장에 적용했다. 2위를 차지한 팀의 일부 멤버는 RecSys 커뮤니티에서 활동하는 추천 엔진인 그래비티 R&D를 설립했다. 4-Tell, Inc.는 전자상거래 웹사이트를 위한 넷플릭스 프로젝트에서 파생된 솔루션을 만들었다.

넷플릭스 프라이즈 대회를 위해 넷플릭스가 제공한 데이터 세트를 둘러싸고 여러 가지 개인 정보 보호 문제가 발생했다. 고객 개인 정보를 보호하기 위해 데이터 세트가 익명화되었지만, 2007년 텍사스 대학교의 두 연구원은 데이터 세트를 인터넷 영화 데이터베이스 (IMDb)의 영화 평점과 비교하여 개별 사용자를 식별할 수 있었다. 그 결과 2009년 12월 익명의 넷플릭스 사용자가 넷플릭스를 상대로 Doe v. Netflix 소송을 제기하여 넷플릭스가 데이터 세트를 공개함으로써 미국 공정 거래법과 비디오 개인 정보 보호법을 위반했다고 주장했다. 이와 함께 미국 연방 거래 위원회의 우려로 인해 2010년 두 번째 넷플릭스 프라이즈 대회가 취소되었다.

8. 한계점

추천 시스템은 협업 필터링이나 콘텐츠 기반 필터링(personality-based approach라고도 불림) 방식을 주로 사용하며, 각 방식은 장단점이 있다. 예를 들어, 음악 추천 시스템인 라스트닷에프엠(Last.fm)은 사용자의 청취 기록과 다른 사용자의 행동을 비교하여 추천하지만, 정확한 추천을 위해 많은 정보가 필요하다. 반면, 판도라 라디오(Pandora Radio)는 음악의 특성을 기반으로 추천하여 시작 시 정보가 적게 필요하지만, 추천 범위가 제한적이다. 이는 콜드 스타트 문제와 관련이 있다.

추천 시스템 연구는 정확도 외에도 다음과 같은 다양한 요소를 고려해야 한다.

* 다양성(Diversity): 사용자들은 추천 목록 내의 다양성이 높을수록 만족하는 경향이 있다.
* 추천 지속성(Recommender persistence): 경우에 따라 추천을 다시 보여주거나 사용자가 항목을 다시 평가하도록 하는 것이 효과적일 수 있다.
* 개인 정보 보호(Privacy): 추천 시스템은 사용자의 민감한 정보를 다루므로 개인 정보 보호 문제가 중요하다. 협업 필터링을 사용한 사용자 프로필 생성은 특히 문제가 될 수 있으며, 유럽 국가들과 같이 개인 정보 보호 문화가 강한 곳에서는 부정적인 반응을 일으킬 수 있다. 넷플릭스(Netflix) 데이터셋의 익명화에도 불구하고, 사용자 개인 식별이 가능했던 사례는 이 문제를 보여준다.
* 사용자 인구 통계(User demographics): 사용자의 인구 통계적 특성(예: 연령)은 추천 만족도에 영향을 줄 수 있다.
* 견고성(Robustness): 사용자가 추천 시스템에 참여할 때, 속임수(fraud) 문제를 다루어야 한다.
* 뜻밖의 발견(Serendipity): 추천 시스템이 얼마나 놀라운 결과를 제공하는지를 나타내는 지표이다. 너무 명백한 추천은 정확하더라도 유용하지 않을 수 있다. 하지만, 뜻밖의 발견은 정확도에 부정적인 영향을 줄 수도 있다.
* 신뢰(Trust): 사용자가 시스템을 신뢰해야 추천 시스템이 가치를 가진다. 추천의 이유를 설명함으로써 신뢰를 쌓을 수 있다.
* 라벨링(Labelling): 추천에 대한 사용자의 만족도는 추천에 어떤 레이블(예: "sponsored", "organic")이 붙어있는지에 따라 달라질 수 있다.

9. 주요 국제 학회

* Recsys
* 웹 검색 및 데이터 마이닝 (WSDM)
* SIG 정보 검색 (SIGIR)
* 웹 컨퍼런스 (TheWebConf, 구칭 WWW)
* 지식 발견 및 데이터 마이닝 (KDD)
* 정보 및 지식 관리 컨퍼런스 (CIKM)

10. 연구 그룹

* 그룹렌즈
* 프라이부르크 대학교 정보학과 데이터베이스 및 정보시스템 연구소 차세대 추천 시스템
* 카를스루에 공과대학교 정보시스템 및 관리학과
* 사우샘프턴 대학교 인공지능 및 기계학습 연구 그룹
* 오레곤 주립대학교 정보과학 연구소 CoFE
* 듀인 추천 프레임워크
* 텍사스 대학교 오스틴 캠퍼스 라이브러리 추천 시스템
* 클라겐푸르트 대학교 지능 시스템 및 비즈니스 정보학 연구 그룹
* 프리부르 대학교 통계물리학 연구 그룹