Социальное профилирование - Википедия - Social profiling

Социальное профилирование - это процесс создания профиля пользователя с использованием его или ее социальных данных. В целом, профилирование относится к наука о данных процесс создания профиля человека с компьютеризированной алгоритмы и технологии.[1] Существуют различные платформы для обмена этой информацией с распространением растущих популярных социальные сети, в том числе, но не ограничиваются LinkedIn, Google+, Facebook и Twitter.[2]

Социальный профиль и социальные данные

Человека социальные данные относится к персональным данным, которые они генерируют онлайн или офлайн.[3] (подробнее см. революция социальных данных ). Большой объем этих данных, включая язык, местоположение и интересы, передается через социальные медиа и социальная сеть. Пользователи присоединяются к нескольким платформам социальных сетей, и их профили на этих платформах могут быть связаны различными способами.[4] чтобы узнать их интересы, местоположение, контент и друзей. В целом, эта информация может построить социальный профиль человека.

Удовлетворение потребностей пользователей в сборе информации становится все сложнее и труднее. Это связано с тем, что генерируется слишком много шума, который влияет на процесс сбора информации из-за стремительного роста онлайн-данных. Социальное профилирование - это новый подход к решению проблем, возникающих при удовлетворении запросов пользователей, путем внедрения концепции персонализированный поиск учитывая при этом профили пользователей, созданные с использованием данных социальных сетей. В исследовании рассматривается и классифицируется исследование, в котором атрибуты социальных профилей пользователей выводятся из данных социальных сетей, как индивидуальные и групповые. Были выделены существующие методы, а также используемые источники данных, ограничения и проблемы. Наиболее известные подходы включают машинное обучение, онтологию и нечеткую логику. Данные социальных сетей от Twitter и Facebook использовались в большинстве исследований для определения социальных атрибутов пользователей. Литература показала, что социальные атрибуты пользователей, в том числе возраст, пол, местоположение дома, благополучие, эмоции, мнение, отношения, влияние, все еще требуют изучения.[5]

Персонализированные мета-поисковые системы

Постоянно увеличивающийся объем онлайн-контента привел к недостаточной квалификации результатов централизованной поисковой системы.[6][7] Он больше не может удовлетворить потребность пользователя в информации. Возможное решение, которое увеличило бы охват результатов поиска, было бы мета-поисковики,[6] подход, который собирает информацию из многочисленных централизованных поисковых систем. Таким образом, возникает новая проблема: слишком много данных и слишком много шума создается в процессе сбора. Таким образом, появляется новый метод, называемый персонализированными метапоисковыми системами, который обращается к профилю пользователя (в основном социальному профилю) для фильтрации результатов поиска. Профиль пользователя может представлять собой комбинацию нескольких вещей, включая, помимо прочего, «выбранные в руководстве пользователя интересы, историю поиска пользователя» и данные личных социальных сетей.[6]

Профилирование в социальных сетях

В соответствии с Уоррен и Брандейс (1890), раскрытие частной информации и неправильное ее использование могут нанести вред чувствам людей и нанести значительный ущерб их жизням.[8] Социальные сети предоставляют людям доступ к интимным онлайн-взаимодействиям; следовательно, контроль доступа к информации, информационные транзакции, проблемы с конфиденциальностью, связи и взаимоотношения в социальных сетях и т. д. стали важными областями исследований и вызывают всеобщее беспокойство. По словам Рикара Фогеса и других соавторов, «любой механизм конфиденциальности имеет в своей основе контроль доступа», который диктует, «как разрешения указаны, какие элементы могут быть частными, как определены правила доступа и так далее ».[9] Текущий контроль доступа для учетных записей социальных сетей, как правило, все еще очень упрощен: существует очень ограниченное разнообразие категорий отношений для учетных записей социальных сетей. Отношения пользователя с другими на большинстве платформ классифицируются только как «друг» или «не друг», и люди могут передавать важную информацию «друзьям» внутри своего социального круга, но не обязательно пользователям, которым они сознательно хотят поделиться информацией.[9] Раздел ниже посвящен профилированию в социальных сетях и возможностям профилирования информации в учетных записях социальных сетей.

Утечка конфиденциальности

Много информации добровольно передается в социальных сетях онлайн, и многие люди уверены, что разные учетные записи социальных сетей на разных платформах не будут связаны, пока они не предоставят разрешение на эти ссылки. Однако, по словам Дайан Ган, информация, собранная в Интернете, позволила «идентифицировать целевых субъектов на других сайтах социальных сетей, таких как Foursquare, Instagram, LinkedIn, Facebook и Google+, где просочилось больше личной информации».[10]

Большинство платформ социальных сетей используют «подход отказа» для своих функций. Если пользователи желают защитить свою конфиденциальность, проверка и изменение настроек конфиденциальности является личной ответственностью пользователя, поскольку для некоторых из них установлено значение по умолчанию.[10] Основные платформы социальных сетей разработали функции гео-тегов и широко используются. Это вызывает беспокойство, потому что 39% пользователей испытали взлом профилей; 78% взломщиков использовали основные социальные сети и Google Street View для выбора своих жертв; поразительные 54% взломщиков пытались проникнуть в пустые дома, когда люди публиковали свои статусы и географические местоположения.[11]

Facebook

Создание и поддержание аккаунтов в социальных сетях и их взаимоотношений с другими людьми связаны с различными социальными результатами.[12] Для многих фирм управление взаимоотношениями с клиентами необходимо и частично осуществляется через Facebook.[13] До появления и распространения социальных сетей идентификация клиентов в первую очередь основывалась на информации, которую фирма могла получить напрямую:[14] например, это может быть процесс покупки покупателем или добровольный акт завершения опрос / программа лояльности. Однако рост социальных сетей значительно сократил процесс создания профиль / модель клиента на основании таких доступных данных. Маркетологи сейчас активно ищут информацию о клиентах через Facebook;[13] это может включать различную информацию, которую пользователи раскрывают всем пользователям или частичным пользователям на Facebook: имя, пол, дата рождения, адрес электронной почты, сексуальная ориентация, семейное положение, интересы, хобби, любимые спортивные команды, любимый спортсмен (s) или любимую музыку, что более важно, связи с Facebook.[13]

Однако из-за дизайна политики конфиденциальности получение достоверной информации на Facebook - нетривиальная задача. Часто пользователи Facebook либо отказываются раскрывать правдивую информацию, либо устанавливают информацию, доступную только друзьям, пользователей Facebook, которым «НРАВИТСЯ» ваша страница, также трудно идентифицировать. Чтобы сделать онлайн-профилирование пользователей и объединить пользователей в кластеры, маркетологи и компании могут и будут получать доступ к следующим видам данных: пол, IP-адрес и город каждого пользователя через страницу Facebook Insight, которому «ЛЮБИЛСЯ» определенный пользователь, страница список всех страниц, которые понравились человеку (данные транзакции ), других людей, на которых подписан пользователь (даже если оно превышает первые 500, которые мы обычно не можем видеть), и все общедоступные данные.[13]

Twitter

Twitter, впервые запущенный в Интернете в марте 2006 года, представляет собой платформу, на которой пользователи могут подключаться и общаться с любым другим пользователем, используя всего 140 символов.[10] Как Facebook, Twitter также является важным туннелем для утечки важной информации пользователями, часто неосознанно, но доступной и доступной для других.

По словам Рэйчел Нумер, из 10,8 миллионов твитов от более чем 5000 пользователей их заявленной и публично распространенной информации достаточно, чтобы выявить диапазон доходов пользователя.[15] Постдокторский исследователь из Пенсильванский университет, Даниэль Преожюк-Пьетро и его коллеги смогли разделить 90% пользователей на соответствующие группы доходов. Собранные ими данные, введенные в модель машинного обучения, позволили сделать надежные прогнозы характеристик каждой группы доходов.[15]

На фото справа изображено мобильное приложение Streamd.in. Он отображает живые твиты на Google Maps, используя данные о географическом местоположении, прикрепленные к твиту, и отслеживает перемещения пользователя в реальном мире.[10]

Профилирование фото в социальной сети

Появление и универсальность социальных сетей повысили роль изображений и распространения визуальной информации.[16] Многие визуальные данные в социальных сетях передают сообщения от автора, информацию о местоположении и другую личную информацию. В исследовании, проведенном Кристиной Сегалин, Дон Сон Ченг и Марко Кристани, они обнаружили, что профилирование фотографий в публикациях пользователей может выявить личные качества, такие как личность и настроение.[16] В исследовании представлены сверточные нейронные сети (CNN). Он основан на основных характеристиках вычислительной эстетики CA (подчеркивая «вычислительные методы», «эстетическую точку зрения человека» и «необходимость сосредоточиться на объективных подходах»).[16]), определенный Хёнигом (Hoenig, 2005). Этот инструмент может извлекать и идентифицировать контент на фотографиях.

Теги

В исследовании под названием "Система рекомендаций тегов Flickr на основе правил", автор предлагает персональные рекомендации по тегам,[17] в основном на основе профилей пользователей и других веб-ресурсов. Он оказался полезным во многих аспектах: «индексирование веб-контента», «поиск мультимедийных данных» и корпоративный поиск в Интернете.[17]

Очень вкусно

Flickr

Zooomr

Маркетинг

В настоящее время маркетологи и розничные торговцы увеличивают свое присутствие на рынке, создавая свои собственные страницы в социальных сетях, на которых они публикуют информацию, просят людей поставить отметку «Нравится» и поделиться ими, чтобы участвовать в конкурсах, и многое другое. Исследования показывают, что в среднем человек проводит в социальной сети около 23 минут в день.[18] Поэтому компании, от малых до крупных, вкладывают средства в сбор информации о поведении пользователей, рейтингах, обзорах и многом другом.[19]

Facebook

До 2006 года общение в Интернете не зависело от содержания с точки зрения количества времени, которое люди проводят в Интернете. Тем не менее, совместное использование и создание контента были основной онлайн-деятельностью обычных пользователей социальных сетей, и это навсегда изменило онлайн-маркетинг.[20] В книге «Продвинутый маркетинг в социальных сетях»[21] автор приводит пример того, как организатор свадеб в Нью-Йорке может идентифицировать свою аудиторию при маркетинге в Facebook. Некоторые из этих категорий могут включать: (1) проживающих в Соединенных Штатах; (2) проживающие в пределах 50 миль от Нью-Йорка; (3) Возраст 21 года и старше; (4) помолвленная женщина.[21] Независимо от того, выбираете ли вы оплату за клик или за показы / просмотры, «стоимость рекламы на торговой площадке Facebook и спонсируемых историй определяется вашей максимальной ставкой и конкуренцией для тех же аудиторий».[21] Стоимость клика обычно составляет 0,5–1,5 доллара за каждый.

Инструменты

Klout

Klout популярный онлайн-инструмент, ориентированный на оценку пользователей влияние общества по социальному профилированию. Требуется несколько платформ социальных сетей (например, Facebook, Twitter и т. д.), а также множество аспектов, которые учитывают и дают пользователю оценку от 1 до 100. Независимо от количества лайков или связей в LinkedIn, социальные сети содержат много личной информации. Klout генерирует единственную оценку, которая указывает на влияние человека.

В исследовании под названием "Сколько у вас Klout ... Тест генерируемых системой сигналов на достоверность источника"сделанный Чадом Эдвардсом, оценка Klout может влиять на воспринимаемое доверие людей.[22] Поскольку Klout Score становится популярным комбинированным методом оценки влияния людей, он может быть одновременно удобным и необъективным инструментом. Исследование Дэвида Вестермана о том, как подписчики в социальных сетях влияют на суждения людей, иллюстрирует возможную предвзятость, которую может содержать Клоут.[23] В одном исследовании участников попросили просмотреть шесть идентичных фиктивных страниц Twitter с одной важной независимой переменной: подписчиками. Результат показывает, что страницы со слишком большим или меньшим количеством подписчиков снизят доверие к нему, несмотря на схожий контент. Оценка Klout также может иметь такую ​​же предвзятость.[23]

Хотя это иногда используется в процессе приема на работу, остается спорным.

Kred

Kred не только присваивает каждому пользователю оценку влияния, но также позволяет каждому пользователю претендовать на профиль Kred и учетную запись Kred. С помощью этой платформы каждый пользователь может увидеть, как влиятельные лица взаимодействовать с их онлайн-сообществом и узнавать, как каждое ваше действие в сети повлияло на ваши показатели влияния.

Аналитика данных Keyhole

Вот несколько предложений, которые Кред дает аудитории по поводу увеличения влияния: (1) будьте щедры со своей аудиторией, бесплатно делитесь контентом от друзей и публикуйте твиты; (2) присоединиться к онлайн-сообществу; (3) создавать значимый контент и делиться им; (4) отслеживайте свой прогресс в Интернете.

Последователь Вонк

Follower Wonk специально нацелен на аналитику Twitter, которая помогает пользователям понять демографию подписчиков и оптимизирует ваши действия, чтобы определить, какая деятельность привлекает наиболее положительные отзывы от подписчиков.

Замочная скважина

Keyhole - это устройство для отслеживания и анализа хэштегов, которое отслеживает данные хэштегов в Instagram, Twitter и Facebook. Это сервис, который позволяет вам отслеживать, кто из наиболее влиятельных лиц использует определенный хэштег, и какова другая демографическая информация о хэштеге. Когда вы вводите хэштег на своем веб-сайте, он автоматически случайным образом выбирает пользователей, которые в настоящее время используют этот тег, что позволяет пользователю анализировать каждый интересующий его хэштег.

Социальный профиль онлайн-активиста

Распространенность Интернета и социальных сетей обеспечила онлайн-активисты и новая платформа для активизма, и самый популярный инструмент. В то время как онлайн-активизм может вызвать большие споры и тенденции, мало кто на самом деле участвует или жертвует ради соответствующих событий. Интересной темой становится анализ профиля онлайн-активистов. В исследовании, проведенном Харпом и его соавторами об онлайн-активистах в Китае, Латинской Америке и США, большинство онлайн-активистов - мужчины из Латинской Америки и Китая со средним доходом не более 10 000 долларов, в то время как большинство онлайн-активистов женщина в США со средним доходом от 30 000 до 69 999 долларов США; а уровень образования онлайн-активистов в Соединенных Штатах, как правило, соответствует последипломному образованию / работе, в то время как активисты в других странах имеют более низкий уровень образования.[24]

При более внимательном рассмотрении их общего онлайн-контента выясняется, что наиболее распространенная в Интернете информация включает пять типов:

  1. Для сбора средств: из трех стран активисты Китая больше всего довольны сбором средств из трех.
  2. Размещение ссылок: латиноамериканские активисты делают все возможное для размещения ссылок.
  3. Для продвижения дебатов или дискуссий: активисты из Латинской Америки и Китая публикуют больше материалов для продвижения дебатов или дискуссий, чем американские активисты.
  4. Для размещения такой информации, как объявления и новости: американские активисты публикуют больше такого контента, чем активисты из других стран.
  5. Для общения с журналистом: в этом разделе активисты Китая играют ведущую роль.

Социальный кредитный рейтинг в Китае

Китайское правительство надеется создать "социально-кредитная система «который направлен на оценку« финансовой кредитоспособности граждан », социального поведения и даже политического поведения.[25] Эта система будет сочетать большие данные и технологии социального профилирования. По словам Силии Хаттон из Новости BBC, ожидается, что каждый в Китае поступит в национальная база данных который включает в себя и автоматически рассчитывает финансовую информацию, политическое поведение, социальное поведение и повседневную жизнь, включая незначительные нарушения правил дорожного движения - единый балл, который оценивает надежность граждан.[26]

Показатели правдоподобия, оценки социального влияния и другие комплексные оценки людей не редкость в других странах. Тем не менее, в Китае «социально-кредитная система» остается быть спорным, так как этот один счет может быть отражением человека каждый аспект.[26] Действительно, «многое в системе социального кредита остается неясным».[25]

Каким образом компании будут ограничены системой кредитного рейтинга в Китае?

Хотя реализация социальных кредитный рейтинг остается спорным в Китае, китайское правительство стремится полностью внедрить эту систему к 2018 году.[27] По словам Джейка Лабанда (заместителя директора пекинского офиса США -Китай Business Council), низкие кредитные рейтинги «ограничат право на финансирование, трудоустройство и членство в партии, а также ограничат операции с недвижимостью и поездки». Социальный кредитный рейтинг будет зависеть не только от юридических критериев, но и от социальных критериев, таких как нарушение контракта. Тем не менее, это было серьезной проблемой для конфиденциальности для крупных компаний из-за огромного количества данных, которые будут анализироваться системой.

Рекомендации

  1. ^ Каноджа, Сумиткумар; Мукхопадхьяя, Дебаджьоти; Гираз, Шиталь (2016). «Профилирование пользователей для рекомендательной системы университета с использованием автоматического поиска информации». Процедуры информатики. 78: 5–12. Дои:10.1016 / j.procs.2016.02.002.
  2. ^ Ву, Сюань Чыонг; Абель, Мари-Элен; Моризе-Махудо, Пьер (01.10.2015). «Ориентированный на пользователя и групповой подход к фильтрации и обмену социальными данными» (PDF). Компьютеры в человеческом поведении. Вычислительная техника для обучения, поведения и совместной работы человека в эпоху социальных и мобильных сетей. 51, часть B: 1012–1023. Дои:10.1016 / j.chb.2014.11.079.
  3. ^ Фонтинель, Эми (2017-02-06). «Социальные данные». Инвестопедия. Получено 2017-04-03.
  4. ^ Kaushal., Rishabh; Гош., Васундхара (26 марта 2020 г.). Международная конференция IEEE 2019 по параллельной распределенной обработке с приложениями, большим данным и облачным вычислениям, устойчивым вычислениям и коммуникациям, социальным вычислениям и сетям (ISPA / BDCloud / SocialCom / SustainCom). IEEE. Дои:10.1109 / ISPA-BDCloud-SustainCom-SocialCom48970.2019.00231. S2CID  214692247.
  5. ^ Билал, Мухаммад; Гани, Абдулла; Лали, Мухаммад Икрам Уллах; Марджани, Мохсен; Малик, Надя (2019). «Социальное профилирование: обзор, таксономия и проблемы». Киберпсихология, поведение и социальные сети. 22 (7): 433–450. Дои:10.1089 / cyber.2018.0670. PMID  31074639.
  6. ^ а б c Сауд, Закария; Кечид, Самир (01.04.2016). «Интеграция социального профиля для улучшения выбора источника и процесса объединения результатов при распределенном поиске информации». Информационные науки. 336: 115–128. Дои:10.1016 / j.ins.2015.12.012.
  7. ^ Лоуренс, Стив; Джайлз, К. Ли (1999-07-08). «Доступность информации в сети». Природа. 400 (6740): 107–9. Дои:10.1038/21987. ISSN  0028-0836. PMID  10428673. S2CID  4347646.
  8. ^ Д. Уоррен, Сэмюэл; Д. Брандейс, Луи (декабрь 1890 г.). «Право на неприкосновенность частной жизни». Гарвардский юридический обзор. IV.
  9. ^ а б Fogues, Рикар; Такие, Jose M .; Эспиноза, Агустин; Гарсия-Форнес, Ана (04.05.2015). «Открытые проблемы в механизмах конфиденциальности на основе взаимоотношений для служб социальных сетей» (PDF). Международный журнал взаимодействия человека с компьютером. 31 (5): 350–370. Дои:10.1080/10447318.2014.1001300. HDL:10251/65888. ISSN  1044-7318. S2CID  16864348.
  10. ^ а б c d Ган, Дайан; Дженкинс, Лили Р. (2015-03-23). "Конфиденциальность в социальных сетях - кто вас преследует?" (PDF). Интернет будущего. 7 (1): 67–93. Дои:10.3390 / fi7010067.
  11. ^ «Социальные сети и преступность». Получено 2017-04-23.
  12. ^ Парк, Намки; Ли, Сын Юн; Ким, Чан Хён (01.09.2012). «Характеристики личных сетей людей и модели использования Facebook: подход социальной сети». Компьютеры в человеческом поведении. 28 (5): 1700–1707. Дои:10.1016 / j.chb.2012.04.009.
  13. ^ а б c d ван Дам, Ян-Виллем; ван де Вельден, Мишель (01.02.2015). «Онлайн-профилирование и кластеризация пользователей Facebook». Системы поддержки принятия решений. 70: 60–72. Дои:10.1016 / j.dss.2014.12.001.
  14. ^ Чжу, Фэн; Чжан Сяоцюань (Майкл) (29.05.2013). «Влияние онлайн-обзоров потребителей на продажи: регулирующая роль продуктов и потребительских характеристик». Журнал маркетинга. 74 (2): 133–148. CiteSeerX  10.1.1.471.520. Дои:10.1509 / мкг.74.2.133.
  15. ^ а б «Разговоры о деньгах - и твиты: начни поиски!». eds.a.ebscohost.com. Получено 2017-04-23.
  16. ^ а б c Сегалин, Кристина; Ченг, Дон Сон; Кристани, Марко (2017-03-01). «Социальное профилирование через понимание изображения: вывод личности с использованием сверточных нейронных сетей». Компьютерное зрение и понимание изображений. Понимание изображений и видео в больших данных. 156: 34–50. Дои:10.1016 / j.cviu.2016.10.013.
  17. ^ а б Кальеро, Лука; Фиори, Алессандро; Гримаудо, Луиджи (01.01.2013). Рамзан, Наим; Звол, фургон Рулоф; Ли, Чон-Сок; Клювер, Кай; Хуа, Сиань-Шэн (ред.). Поиск в социальных сетях. Компьютерные коммуникации и сети. Springer London. стр.169 –189. Дои:10.1007/978-1-4471-4555-4_8. ISBN  9781447145547.
  18. ^ «Facebook доминирует, появление reddit и Hulu: 4 года отвлекающих сайтов на RescueTime». Блог RescueTime. 2011-10-03. Получено 2017-04-07.
  19. ^ Инженеры., Институт электротехники и электроники; Сообщество., IEEE Communications (01.01.2011). 5-я Международная конференция IEEE 2011 г. по архитектуре и применению мультимедийных Интернет-систем: [IMSAA 11]: 12-13 декабря 2011 г., Бангалор, Индия. IEEE. ISBN  9781457713286. OCLC  835764725.
  20. ^ Дэйв., Эванс (01.01.2012). Маркетинг в социальных сетях: час в день. Вайли. ISBN  9781118227671. OCLC  796208293.
  21. ^ а б c Том, Функ (01.01.2013). Продвинутый маркетинг в социальных сетях Как вести, запускать и управлять успешной программой в социальных сетях. Апресс. ISBN  9781430244080. OCLC  981044629.
  22. ^ Эдвардс, Чад; Спенс, Патрик Р .; Джентиле, Кристина Дж .; Эдвардс, Америка; Эдвардс, Осень (01.09.2013). «Сколько у вас Klout… Проверка сгенерированных системой сигналов на достоверность источника». Компьютеры в человеческом поведении. 29 (5): A12 – A16. Дои:10.1016 / j.chb.2012.12.034.
  23. ^ а б Вестерман, Дэвид; Спенс, Патрик Р .; Ван дер Хайде, Брэндон (01.01.2012). «Социальная сеть как информация: влияние отчетов о связности, созданных системой, на доверие в Twitter». Компьютеры в человеческом поведении. 28 (1): 199–206. Дои:10.1016 / j.chb.2011.09.001.
  24. ^ Деското, Жозе (1 сентября 2009 г.). «[Лаура Арчер. Ее пустые руки, ее глаза, ее инстинкт ... и ее страсть]». Перспектива Infirmière. 6 (5): 7–8. ISSN  1708-1890. PMID  20120298.
  25. ^ а б «Китай изобретает цифровое тоталитарное государство». Экономист. 2016-12-17. Получено 2017-04-14.
  26. ^ а б Хаттон, Селия (26 октября 2015 г.). «Социальный кредит Китая: Пекин создает огромную систему». Новости BBC. Получено 2017-04-14.
  27. ^ «Как частные лица и компании могут быть ограничены плохим социальным кредитом в Китае? Начните поиск!». eds.b.ebscohost.com. Получено 2017-09-29.