Социальная революция данных - Social data revolution

В революция социальных данных сдвиг в моделях человеческого общения в сторону более широкого обмена личной информацией и связанных с этим последствий, что стало возможным благодаря росту социальные сети в начале 2000-х гг. Это явление привело к накоплению беспрецедентный объем публичных данных.[1]

Этот большой и часто обновляемый источник данных был описан как новый тип научного инструмента для социальных наук.[2] Несколько независимых исследователей использовали социальные данные для "текущего прогноза" и прогнозов таких тенденций, как безработица, вспышки гриппа,[3] настроение целого населения,[4] расходы на поездки и политические взгляды быстрее, точнее и дешевле, чем стандартные правительственные отчеты или Опросы Gallup.[2]

Социальные данные - это данные, создаваемые людьми, которые сознательно и добровольно передаются ими. Стоимость и накладные расходы ранее делали эту полуобщественную форму общения невозможной, но достижения в области технологий социальных сетей в 2004–2010 годах сделали возможными более широкие концепции совместного использования.[5] Типы данных, которыми обмениваются пользователи, включают геолокация, медицинские данные,[6] предпочтения в свиданиях, открытые мысли, интересные новостные статьи и т. д.

Революция социальных данных позволяет не только создавать новые бизнес-модели, подобные тем, Amazon.com но также предоставляет большие возможности для улучшения принимать решение для государственной политики и Международная разработка.[7]

Анализ большого количества социальных данных приводит к вычислительная социология. Классические примеры включают изучение медиа-контента.[8] или контент в социальных сетях.[3][4][9]

Эволюция социальных данных

Каждая интернет-активность оставляет за собой следы данных ( цифровой след ), который можно использовать, чтобы узнать больше о пользователе.[10] Поскольку использование Интернета становится все более распространенным, датафикация мира быстро прогрессирует: в настоящее время создается около 16 зеттабайт данных в год, а к 2025 году ожидается 163 зеттабайта данных.[11] Это привело к тому, что данные стали критически важным товаром.[10] Это связывает воедино всех субъектов общества: государственные учреждения, частные фирмы, а также отдельных лиц, каждый из которых по-своему полагается на данные.

Правительства собирали данные на протяжении веков, чтобы гарантировать непрерывность институциональных систем, ограничивая риск невозврата кредитов, собирая налоги с дохода и обеспечивая необходимую инфраструктуру с учетом демографического распределения своих граждан.[12] Вначале эти данные включали письменную информацию для ведения учета и контроля, включая систему переписи.[12]

Этот аналогичный процесс был очень затратным по времени и средствам, оставляя мало места для интерпретации больших наборов данных.[12] Тем временем корпоративные технологические разработки переместили офлайн-данные в цифровую эпоху, что позволило визуализировать и анализировать данные.[12][10] В публичной сфере соединение методологий опросов и опросов с вычислениями баз данных дало возможность собирать и хранить большие наборы данных по отдельным лицам.[10]

Веб 2.0 и сайты социальных сетей

За последние несколько десятилетий Интернет перешел от использования в основном как источника информации о мире к использованию в основном для общения, пользовательского контента, обмен данными, и общественное здание.[13] Это то, что многие считают развитием "Веб 2.0 "сайты социальных сетей, такие как Facebook и YouTube являются основой развития Web 2.0 и перехода к обмену данными в социальных сетях.[13]

Ранние примеры веб-сайтов с социальными данными: Craigslist и списки желаний Amazon.com. Оба позволяют пользователям передавать информацию любому, кто ее ищет. Они отличаются своим подходом к личность. Craigslist использует силу анонимности, в то время как Amazon.com использует силу стойкой идентификации, основанную на истории отношений клиента с фирмой. Рынок труда даже формируется благодаря информации, которую люди делятся о себе на таких сайтах, как LinkedIn и Facebook.[14]

Примеры более сложных сайтов с социальными данными: Twitter и Facebook. В Twitter отправить сообщение или твит так же просто, как отправить текстовое SMS-сообщение. Twitter сделал этот C2W клиентом для всего мира: любой твит, который отправляет пользователь, потенциально может быть прочитан всем миром. Facebook фокусируется на взаимодействии между друзьями, C2C на традиционном языке. Он предоставляет множество способов сбора данных от пользователей: "тег «друг на фотографии», «комментирует» то, что он опубликовал, или просто «нравится». Эти данные являются основой сложных моделей взаимоотношений между пользователями. Их можно использовать для значительного увеличения актуальность того, что показано пользователю, и в рекламных целях.[15]

К 2009 году популярность социальных сетей выросла в четыре раза по сравнению с 2005 годом.[16] По данным на 2013 год, у Twitter более 250 миллионов пользователей, которые публикуют почти 500 миллионов твитов в день, а у Facebook более миллиарда пользователей по всему миру.[17]

Деловой сектор и социальные данные

Компании часто используют данные, которыми обмениваются через сайты социальных сетей и другие формы обмена данными, рекламодателей и т. Д.[18] Например, сайты социальных сетей могут продавать пользовательские данные рекламодателям и другим организациям, которые затем могут влиять на решения потребителей.[13] Сбор данных также используется для сбора этой информации.[18]

Хотя веб-сайты и другие приложения были источником этого сбора данных, с развитием технологий многие устройства, которые используются в повседневной жизни, имеют возможность собирать данные о людях и, следовательно, увеличивают объем доступных личных данных (например, смартфоны , технические часы, музыкальные устройства и т. д.).[19][20]

Этот рост людей цифровая идентичность - информация, доступная из этих электронных источников, - используется компаниями и организациями для улучшения продуктов и услуг и снижения затрат, ориентируясь на то, чего хотят / ожидают потребители.[20] Данные, которые могут быть собраны, могут включать опыт покупок, предпочтения в социальных сетях, демографическую информацию и многое другое.[18]

Использование этих данных может позволить лучше персонализировать продукты и стало ожидаемым и жизненно важным аспектом использования и производства продуктов.[19] Доступные данные о потребителях могут быть использованы для определения моделей поведения потребителей.[21] Например, информация о местоположении используется для оценки того, когда и где потребители собираются таргетировать рекламу и рекламные акции в зависимости от того, в какие магазины собираются потребители.[21] Интернет-магазины также получили представление о том, как лучше персонализировать процесс онлайн-покупок с помощью данных, собранных во время онлайн-транзакции.[22]

Компании могут даже использовать данные о потребителях, чтобы определить, влияет ли различное расположение продуктов на полках на решения потребителей о покупке, а также оценить потенциальные возможности межпозиционного маркетинга на основе товаров, часто покупаемых вместе.[23]

Социальная коммерция

Хотя компании и рекламодатели часто пользуются доступными данными о потребителях, потребители также используют информацию других пользователей для принятия решений о покупке. Социальная коммерция сайты, на которых потребители делятся опытом и мнениями о продуктах / услугах и другой информацией.[24] Известный пример такого сайта: Pinterest у которого более 100 миллионов пользователей.[24] Эти сайты и другие онлайн-источники информации о продуктах / брендах влияют на решения потребителей о покупке.[25] По оценкам, около 67% онлайн-клиентов используют эту информацию при принятии решения о покупке.[24] Эти сайты создают среду, которой потребители доверяют, поскольку информация поступает от других потребителей.[24]

Другое использование социальных данных

Благодаря огромному количеству доступных данных о людях, возможности использования этой информации растут.

У сектора здравоохранения есть много потенциальных применений этих данных. Информация, собранная из социальных сетей и других источников обмена социальными данными, может использоваться для прогнозирования гриппа, вспышек заболеваний, мер реагирования на чрезвычайные ситуации и многого другого.[26] С использованием Twitter и геотеги медицинские исследователи могут оценить состояние здоровья в конкретном районе и использовать эту информацию для улучшения охвата населения и предоставления услуг.[26] Medtronic разработала цифровой глюкометр, который позволяет медицинским работникам и пациентам знать о низких уровнях глюкозы в крови.[19]

Социальные данные также можно использовать для оценки реакции на кризисы.[27] После ураган Сэнди исследователи использовали Twitter, чтобы оценить эмоции и проблемы, с которыми столкнулись пострадавшие.[27] Эта информация потенциально может быть использована, чтобы помочь лучше подготовиться к будущим кризисам и отреагировать на них.

Эти данные можно использовать при городском планировании. Город Бостон использовал информацию о гонщиках из Убер улучшить планирование перевозок и содержание дорог.[19]

Вычислительная социология

Использование социальных данных в исследовательских целях привело к развитию вычислительной социальной науки. Вычислительная социальная наука объединяет социальные науки, информатику и сетевую науку.[28] Это поле появилось в 2009 году.[29] До появления социальных данных и технологических достижений, которые поддерживали их, исследователи были ограничены узким взглядом на информацию, основанную на отдельных лицах, поскольку их основная форма исследования основывалась на интервью.[29] Благодаря огромному количеству социальных данных, доступных сегодня, исследователи могут анализировать более широкую группу и получать более широкое представление о информации. Они могут использовать социальные сети, данные сотовых телефонов и проводить онлайн-эксперименты, которые позволяют им собирать больше информации, чем раньше.[29]

Проблемы конфиденциальности

При большом количестве данных о людях, доступных из многих источников, конфиденциальность стала серьезной проблемой. Нарушения безопасности клиентов и другой социальной информации, такие как компрометация более 56 миллионов Home Depot информация о кредитной карте клиента[19] повлияли на заботу о конфиденциальности социальных данных. То, как компании используют собранную личную информацию, и возможное злоупотребление ею, беспокоит большинство потребителей.[19][20] Несмотря на это, многие люди не знают, как сайты социальных сетей и другие источники используют и продают их данные.[30] В исследовании 2014 года только 25% онлайн-пользователей знали, что их местоположение может быть доступно, и только 14% знали, что их история веб-серфинга может быть доступна и опубликована.[19]

Несмотря на то, что забота о конфиденциальности является критическим фактором в обмене людьми личной информацией в Интернете и общем участии в Интернете,[22] большинство людей готовы поделиться этой информацией, если выгода от этого перевешивает потенциальные затраты на конфиденциальность и безопасность.[18][20] Потребители получают удовольствие от персонализации продуктов и услуг, которая возможна благодаря сбору такой информации, и, несмотря на опасения, продолжают их использовать.[19]

Международная разработка

«С макроэкономической точки зрения ожидается, что принятие решений на основе больших данных будет иметь такое же положительное влияние на эффективность и производительность, какое оказали ИКТ в последнее десятилетие».

— Гильберт 2013

В своем исследовании революции данных в международном развитии профессор социальных наук Калифорнийского университета в Дэвисе Мартин Гильберт утверждал, что естественный следующий шаг от информационные общества, питаемый ИКТ, с конца 1990-х гг. общества знаний сообщил Большое количество данных анализ. Принятие решений на основе анализа больших данных повысило как эффективность, так и производительность в развитых странах. Гильберт исследует проблемы и потенциал революции данных в «неуправляемом мире международного развития».[7]

Типы данных

Гильберт выделил четыре типа данных, доступных в больших количествах к 2013 году: слова, местоположения, природа и поведение.[7]

Слова

Индивидуальные взаимодействия с Интернетом, такие как использование слов в комментариях, публикаций в социальных сетях и объемов поисковых запросов Google, являются все более крупным источником больших данных. Обычно статистические данные генерируются посредством переписи населения или вероятностного обследования, например, Ежегодное социально-экономическое приложение (ASEC), Текущее обследование населения (CPS), Исследование американского сообщества (ACS), Национальное интервью по вопросам здоровья (NHIS) в Соединенных Штатах или административные записи, такие как платежная ведомость, безработица, подоходный налог социального обеспечения, данные сканера и данные кредитной карты, а также другие записи коммерческих транзакций.[31]

«Google проанализировал кластеры поисковых запросов по регионам США, чтобы спрогнозировать вспышки гриппа быстрее, чем это было возможно с помощью записей о госпитализации».

— Шоу 2014 «Почему« большие данные »- это большое дело»

Профессор Университета Уэзерхеда Гэри Кинг описал революцию не только в количестве доступных данных, но и в способности что-то сделать с данными на благо общества.[32]

Место расположения

спутниковая система навигации (GPS) мобильные планшеты, телефоны, Определение радиочастоты (RFID) чипы (часть Автоматическая идентификация и сбор данных (AIDC) технологии), телематика, Игры на основе местоположения и т. д. предоставляют данные об абсолютном местоположении и относительном перемещении.

Природа

Гильберт относит данные о природных процессах к категории «Природа», которая включает датчики, которые предоставляют данные о влажности воздуха и температуре.[7]

Поведение

Данные могут быть получены из поведения пользователя в многопользовательские онлайн-игры,[7] Такие как Лига Легенд, Мир Warcraft, Шахтерское ремесло, По зову долга, и Dota 2. Натан Игл 's, специалист по информатике из Института Санта-Фе в Нью-Мексико, начал использовать мобильные телефоны в начале 2000-х годов для сбора точных крупномасштабных данных о реальных социальных взаимодействиях.[33][34][35] Проект был назван одним из «10 технологий, которые, скорее всего, изменят наш образ жизни» Обзор технологий MIT.[36]

Смотрите также

Рекомендации

  1. ^ Weigend, Андреас. «Социальная революция данных». Harvard Business Review. Получено 15 июля, 2009.
  2. ^ а б Хаббард, Дуглас (2011). Pulse: новая наука об использовании интернет-шума для отслеживания угроз и возможностей. Джон Вили и сыновья.
  3. ^ а б Василиос Лампос; Нелло Кристианини (2012). «Прогнозирование событий из социальной сети со статистическим обучением». Транзакции ACM по интеллектуальным системам и технологиям. 3 (4): 1–22. Дои:10.1145/2337542.2337557. 72.
  4. ^ а б Томас Лэнсдалл-Велфар; Василиос Лампос; Нелло Кристианини (август 2012 г.). «Прогноз настроения нации». Журнал значимости. Vol. 9 нет. 4. Дои:10.1111 / j.1740-9713.2012.00588.x.
  5. ^ Свати Дхаршана Найду (декабрь 2009 г.). «Социальная революция данных». Постерный. Получено 2010-07-08.
  6. ^ Дайсон, Эстер (23 марта 2010 г.). "Здоровье, а не здравоохранение!". Huffington Post. Получено 2010-06-08.
  7. ^ а б c d е Гильберт, Мартин (2013). «Большие данные для развития: от информационных к обществам знаний». Научная статья ССРН (2205145). Рочестер, штат Нью-Йорк: Сеть исследований в области социальных наук. SSRN  2205145. Цитировать журнал требует | журнал = (помощь)
  8. ^ Обнаружение макропаттернов в глобальном медиаконтенте
  9. ^ Настроение в Twitter: влияние рецессии на общественное настроение в Великобритании
  10. ^ а б c d Запад, Сара Майерс (2017). «Капитализм данных: новое определение логики слежки и конфиденциальности». Бизнес и общество: 1–22.
  11. ^ Кейв, Андрей (13 апреля 2017). «Что мы будем делать, когда в 2025 году объем мировых данных достигнет 163 зеттабайт?». Forbes. Получено 30 мая 2018.
  12. ^ а б c d Майер-Шенбергер, Виктор; Cukier, Кеннет (2013). Большие данные: революция, которая изменит то, как мы живем, работаем и думаем. Лондон, Великобритания: Джон Мюррей (издатели).
  13. ^ а б c Фукс, Кристиан. 2011. «Веб 2.0, предположение и наблюдение». Наблюдение и общество 8(3): 288-309.
  14. ^ Рид Хоффман (26 июня 2009 г.). «Будущее рабочих мест и революция социальных данных». Techaffair.com. Получено 2010-07-02.
  15. ^ Дайсон, Эстер (11 февраля 2008 г.). "Грядущая рекламная революция". Журнал "Уолл Стрит. Получено 2010-04-10.
  16. ^ Донде, Дипа С., Чопаде, Неха и Ранджит, П.В. 2012. «Социальные сети: новая эра 21 века». SIES Journal of Management 8(1): 66-73.
  17. ^ Осатуи, Бабаджиде. 2013. «Обмен информацией в социальных сетях». Компьютеры в человеческом поведении 29(6): 2622-2631.
  18. ^ а б c d Джай, Тун-Мин и Кинг, Нэнси Дж. 2016. «Конфиденциальность или вознаграждение: повышают ли программы лояльности желание потребителей делиться личной информацией со сторонними рекламодателями и брокерами данных?» Журнал розничной торговли и бытовых услуг 28: 296-303.
  19. ^ а б c d е ж грамм час Мори, Тимоти, Форбат, Теодор и Шуп, Эллисон. 2015. «Данные о клиентах: проектирование для прозрачности и доверия». Harvard Business Review 93(5): 96-105
  20. ^ а б c d Робер, Бьорн; Резе, Олаф; Кноррек, Роберт; Томсен, Бенджамин (2015). «Персональные данные: как контекст влияет на обмен данными потребителей с организациями из различных секторов». Электронные рынки. 25 (2): 95. Дои:10.1007 / s12525-015-0183-0.
  21. ^ а б Смит, Наташа. 2015. «Данные маркетинга». Новости DM: 16+. Извлекаются из http://go.galegroup.com/
  22. ^ а б Ли, Сынсин; Ли, Ёнхи; Ли, Джоинг-Ин; Парк, Чонгкун (2015). «Персонализированные электронные услуги: забота о конфиденциальности потребителей и обмен информацией». Социальное поведение и личность. 43 (5): 729. Дои:10.2224 / sbp.2015.43.5.729.
  23. ^ Цай, Чи-Юань; Хуан, Шэн-Сян (2014). «Подход интеллектуального анализа данных для оптимизации распределения места на полках с учетом покупательского поведения и поведения клиентов». Международный журнал производственных исследований. 53 (3): 850. Дои:10.1080/00207543.2014.937011.
  24. ^ а б c d Лю, Либо, Чунг, Кристи М.К. и Ли, Мэтью К.О. 2016. «Эмпирическое исследование поведения обмена информацией на сайтах социальной коммерции». Международный журнал управления информацией 36(5): 686-699.
  25. ^ Чен, Цзе, Тэн, Лефа, Ю, Инь и Ю, Зир. 2016. «Влияние онлайн-источников информации на покупательские намерения потребителей с высокой и низкой восприимчивостью к информационному влиянию». Журнал бизнес-исследований 69(2): 467-475.
  26. ^ а б Нгуен, Дюк Т. и Юнг, Джай Э. 2016. «Обнаружение событий в реальном времени для поведенческого онлайн-анализа больших социальных данных». Компьютерные системы будущего поколения 66: 137-145.
  27. ^ а б Спенс, Патрик Р., Лахлан, Кеннет А. и Райнер, Адам М. 2016. «Социальные сети и кризисные исследования: сбор данных и направления». Компьютеры в человеческом поведении 54: 667-672.
  28. ^ Чанг, Р. М., Кауфман, Р. Дж., И Квон, Ю. 2014. Понимание смены парадигмы в сторону вычислительной социальной науки в присутствии больших данных. Решение, 63, 67-80.
  29. ^ а б c Манн, А. 2016. Основная концепция: вычислительная социология. ПНАС, 113(3). 468-470. DOI: 10.1073 / pnas.1524881113
  30. ^ Лилли, Стивен, Фрэнсис С. Гродзински и Андра Гамбус. 2012. «Выявление коммерциализированного и послушного пользователя Facebook». Журнал информации, коммуникации и этики в обществе 10(2):82-92
  31. ^ «Методология исследования» (PDF), Статистика, 19 декабря 2014 г., получено 19 декабря, 2013
  32. ^ Шоу, Джонатан (март 2014 г.), «Почему« большие данные »- это большое дело: информатика обещает изменить мир», Гарвардский журнал, получено 23 декабря, 2016
  33. ^ Nature News, апрель 2009 г.
  34. ^ Загрузки Reality Mining
  35. ^ Технический документ Reality Mining
  36. ^ Биография Орла в Гарварде