MovieLens - MovieLens
Рекомендательные системы |
---|
Концепции |
Методы и проблемы |
Реализации |
Исследование |
MovieLens это веб- рекомендательная система и виртуальное сообщество который рекомендует пользователям смотреть фильмы на основе их предпочтений, используя совместная фильтрация рейтингов фильмов и обзоров фильмов участников. Он содержит около 11 миллионов оценок примерно к 8500 фильмам.[1] MovieLens был создан в 1997 году компанией GroupLens Research, исследовательская лаборатория факультета компьютерных наук и инженерии Университет Миннесоты,[2] для сбора исследовательских данных по персонализированным рекомендациям.[3]
История
MovieLens - не первая рекомендательная система, созданная GroupLens. В мае 1996 г. GroupLens сформировали коммерческое предприятие под названием Net Perceptions, которое обслуживало клиентов, среди которых E! В сети и Amazon.com. E! Online использовал сервисы Net Perceptions для создания системы рекомендаций для Moviefinder.com,[3] в то время как Amazon.com использовал технологию компании для формирования своего раннего механизма рекомендаций по покупкам потребителей.[4]
Когда другой сайт с рекомендациями фильмов, eachmovie.org,[5] закрылся в 1997 году, и разработавшие его исследователи публично опубликовали собранные ими анонимные рейтинговые данные для использования другими исследователями. Исследовательская группа GroupLens под руководством Брента Далена и Джона Херлокера использовала это набор данных чтобы запустить новый сайт рекомендаций по фильмам, который они решили назвать MovieLens. С момента своего создания MovieLens превратился в очень заметную исследовательскую платформу: полученные данные были подробно описаны в статье New Yorker, опубликованной Малькольм Гладуэлл,[6] а также репортаж в полном выпуске ABC Nightline.[7] Кроме того, данные MovieLens сыграли важную роль в нескольких исследованиях, в том числе совместном исследовании Университета Карнеги-Меллона, Университета Мичигана, Университета Миннесоты и Университета Питтсбурга «Использование социальной психологии для мотивации участия в онлайн-сообществах».[8]
Весной 2015 года поиск по запросу "киноленты" дал 2 750 результатов в Google Книгах и 7 580 в Google Scholar.[9]
Рекомендации
MovieLens основывает свои рекомендации на информации, предоставленной пользователями веб-сайта, например, на основе фильмов рейтинги.[2] На сайте используются различные алгоритмы рекомендаций, в том числе совместная фильтрация такие алгоритмы как предмет-предмет,[10] пользователь-пользователь и упорядоченный СВД.[11] Кроме того, чтобы решить холодный запуск проблема для новых пользователей, MovieLens использует выявление предпочтений методы.[12] Система просит новых пользователей оценить, насколько им нравится смотреть различные группы фильмов (например, фильмы с черным юмором по сравнению с романтическими комедиями). Предпочтения, записанные в ходе этого опроса, позволяют системе давать первоначальные рекомендации еще до того, как пользователь оценил большое количество фильмов на веб-сайте.
Для каждого пользователя MovieLens прогнозирует, как пользователь оценит любой данный фильм на веб-сайте.[13] На основе этих прогнозируемых оценок система рекомендует фильмы, которые пользователь, скорее всего, высоко оценит. На веб-сайте предлагается, чтобы пользователи оценивали как можно больше полностью просмотренных фильмов, чтобы рекомендации были более точными, поскольку в этом случае система будет лучше анализировать вкусы фильмов пользователя.[3] Однако метод поощрения рейтингов MovieLens не всегда особенно эффективен, поскольку исследователи обнаружили, что более 20% фильмов, перечисленных в системе, имеют настолько мало оценок, что рекомендательные алгоритмы не могут сделать точных прогнозов о том, понравятся они подписчикам или нет.[8] Рекомендации по фильмам не могут содержать каких-либо маркетинговых ценностей, позволяющих рассматривать большое количество рейтингов фильмов как «исходный набор данных». [14]
Помимо рекомендаций фильмов, MovieLens также предоставляет информацию об отдельных фильмах, такую как список актеров и режиссеров каждого фильма. Пользователи также могут отправлять и оценивать теги (форма метаданные, например, «на основе книги», «слишком длинный» или «манерный»), которые могут использоваться для повышения точности системы рекомендаций по фильмам.[3]
Рейтинги в MovieLens могут появиться в любое время, на самом деле, это может произойти спустя годы после просмотра фильма. Пользователи часто вводили сразу несколько оценок, надеясь, что получат более персонализированные рекомендации или просто для удовлетворения. [15]
Прием
К сентябрю 1997 года сайт посетили более 50 000 пользователей.[3] Когда Акрон Бикон Журнал's Паула Шлейс опробовала веб-сайт и была удивлена тем, насколько точным был этот веб-сайт с точки зрения рекомендаций для нее новых фильмов, основанных на ее предпочтениях в отношении фильмов.[13]
За пределами области рекомендаций по фильмам, данные из MovieLens использовались компанией Solution by Simulation для прогнозирования Оскара.[16]
Исследование
В 2004 году совместное исследование с учеными из Университет Карнеги Меллон, университет Мичигана, Университет Миннесоты и Питтсбургский университет разработанные и проверенные стимулы, основанные на принципах социальной психологии Социальная леность и постановка целей для пользователей MovieLens.[8]Исследователи увидели, что недостаточный вклад, по-видимому, является проблемой для сообщества, и организовали исследование, чтобы определить наиболее эффективный способ мотивировать пользователей оценивать и просматривать больше фильмов. В рамках исследования были выполнены два полевых эксперимента; одно касалось сообщений электронной почты, которые напоминали пользователям об уникальности их вклада и вытекающих из них выгодах, а другое давало пользователям ряд индивидуальных или групповых целей для вклада.
Первый эксперимент, основанный на анализе совокупного отклика сообщества MovieLens, показал, что пользователи с большей вероятностью будут вносить свой вклад в сообщество, когда им напоминают об их уникальности, что заставляет их думать, что их вклад не является дублированием того, что могут делать другие пользователи. предоставлять. Вопреки гипотезе исследователей, они также обнаружили, что пользователи с меньшей вероятностью будут вносить свой вклад, когда для них было подчеркнуто преимущество, которое они получают от оценки, или выгоду, которую получают другие, когда они оценивают. Наконец, они не нашли поддержки взаимосвязи между уникальностью и выгодой.
Второй эксперимент показал, что пользователи с большей вероятностью будут вносить свой вклад, если им ставят конкретные и сложные цели и заставляют поверить, что их вклад был необходим для достижения цели группы. Исследование показало, что в этом конкретном контексте предоставление пользователям групповых целей на самом деле увеличивает вклад по сравнению с индивидуальными целями, где исследователи предсказывали обратное из-за эффектов социального бездельничания. Связь между сложностью цели и вкладом пользователей как в группе, так и в отдельных случаях дала слабые доказательства того, что за пределами определенного порога сложности производительность падает, а не плато, как предполагалось ранее в Локк и теория постановки целей Лэтэма.
Наборы данных
GroupLens Research, лаборатория исследования взаимодействия человека и компьютера в Университет Миннесоты, предоставляет наборы данных рейтинга, собранные с веб-сайта MovieLens, для использования в исследованиях. Полный набор данных содержит 26 000 000 оценок и 750 000 приложений тегов, примененных к 45 000 фильмов 270 000 пользователей. Он также включает данные о геноме тегов с 12 миллионами оценок релевантности для 1100 тегов (последнее обновление 8/2017).[17] На основе наборов данных MovieLens проводится много типов исследований. Лю и др. использовали наборы данных MovieLens для проверки эффективности улучшенного алгоритма случайного блуждания, подавляя влияние крупных объектов.[18] GroupLens имеет Условия эксплуатации для набора данных и он принимает запросы через Интернет.
Рекомендации
- ^ http://license.umn.edu/technologies/z05173_movielens-database
- ^ а б Скофилд, Джек (2003-05-22). "Земля Гнода". Хранитель. Лондон.
- ^ а б c d е Охеда-Сапата, Хулио (15 сентября 1997 г.). «Новый сайт персонализирует обзоры фильмов». Св. Павла Пионер Пресс. п. 3E.
- ^ Бут, Майкл (30.01.2005). «Откуда компьютеры так много знают о нас?». The Denver Post. п. F01.
- ^ Лим, Мюнгеун; Ким, Juntae (2001). «Адаптивная система рекомендаций с агентом-координатором». Труды Первой Азиатско-Тихоокеанской конференции по веб-аналитике: исследования и разработки. Азиатско-Тихоокеанская конференция по веб-аналитике. Конспект лекций по информатике. 2198/2001. Springer Berlin / Heidelberg. стр.438–442. Дои:10.1007 / 3-540-45490-X_56. ISBN 978-3-540-42730-8. Получено 2009-12-30.
- ^ Гладуэлл, Малькольм (4 октября 1999 г.). "Анналы маркетинга: наука о спящем: как информационная эпоха может смести блокбастер". Житель Нью-Йорка. 75 (29): 48–55. Архивировано из оригинал 30 декабря 2009 г.. Получено 2009-12-29.
- ^ Крулвич, Роберт (10 декабря 1999 г.). "ABC Nightline: Родственная душа". ABC.
- ^ а б c Бинен, Джерард; Линг, Кимберли; Ван, Сяоцин; Чанг, Кларисса; Франковски, Дэн; Резник, Пол; Краут, Роберт Э. (2004). «Использование социальной психологии для мотивации участия в онлайн-сообществах». CommunityLab. CiteSeerX 10.1.1.320.5540.
- ^ http://files.grouplens.org/papers/harper-tiis2015.pdf
- ^ Сарвар, Бадрул и др. «Алгоритмы рекомендаций совместной фильтрации на основе элементов». Материалы 10-й международной конференции по всемирной паутине. ACM, 2001.
- ^ Экстранд, Майкл Д. К инструментам разработки рекомендаций и экспериментам для выявления различий в рекомендациях. Дисс. УНИВЕРСИТЕТ МИННЕСОТА, 2014.
- ^ Чанг, Шуо, Ф. Максвелл Харпер и Лорен Тервин. «Использование групп элементов для начальной загрузки новых пользователей в рекомендательных системах». Материалы 18-й конференции ACM по совместной работе с компьютерной поддержкой и социальным вычислениям. ACM, 2015.
- ^ а б Шлейс, Паула (2000-11-13). «Сайт позволяет всем быть критиком». Акрон Бикон Журнал. п. D2.
- ^ http://license.umn.edu/technologies/z05173_movielens-database
- ^ http://files.grouplens.org/papers/harper-tiis2015.pdf
- ^ Хики, Уолт. «Складываются ли ваши прогнозы на Оскар? Вот что говорят данные». FiveThirtyEight. N.p., 18 февраля 2016 г. Web. 08 марта 2016 г. <http://fivethirtyeight.com/features/oscar-data-model-predictions-2015/ >
- ^ "GroupLens".
- ^ Чуан Лю, Чжэнь Лю, Цзы-Кэ Чжан, Цзюнь-Линь Чжоу, Янь Фу, Да-Ченг Не (2014). «Алгоритм персонализированной рекомендации через случайное блуждание». 11-я Международная совместная конференция по информатике и программной инженерии (JCSSE).CS1 maint: несколько имен: список авторов (связь)