Информационный взрыв - Information explosion

В информационный взрыв быстрое увеличение количества опубликовано Информация или же данные и последствия этого изобилия.[1] По мере роста количества доступных данных проблема управление информацией становится сложнее, что может привести к информационная перегрузка. Оксфордский онлайн-словарь английского языка указывает на использование этой фразы в мартовском издании 1964 г. Новый государственный деятель статья.[2] Нью-Йорк Таймс впервые использовал эту фразу в своем редакционном содержании в статье Уолтера Салливана от 7 июня 1964 года, в которой он назвал фразу «много обсуждаемой». (стр.11.) [3] Впервые эта фраза использовалась, по-видимому, в рекламном приложении IBM к New York Times, опубликованном 30 апреля 1961 года.[4] и Фрэнком Фремонт-Смитом, директором программы междисциплинарных конференций Американского института биологических наук, в статье, опубликованной в апреле 1961 г. в бюллетене AIBS (стр. 18). [5]

Во многих секторах наблюдается быстрое увеличение объема доступной информации, например, в здравоохранении, супермаркетах и ​​даже правительственных учреждениях с данными свидетельств о рождении и записями о прививках.[6] Еще один сектор, затронутый этим явлением, - журналистика. Такая профессия, которая в прошлом отвечала за распространение информации, может быть подавлена ​​переизбытком информации сегодня.[7]

Методы сбора знаний из переизбытка электронной информации (например, слияние данных может помочь в сбор данных ) существуют с 1970-х годов. Еще один распространенный метод работы с таким объемом информации - качественное исследование.[8] Такие подходы направлены на систематизацию информации, синтез, категоризацию и систематизацию, чтобы сделать ее более удобной для использования и облегчить поиск.

Модели роста

  • Мировые технологические возможности для хранения информации выросли с 2,6 (оптимально сжатых) эксабайт в 1986 году до 15,8 в 1993 году, более 54,5 в 2000 году и до 295 (оптимально сжатых) эксабайт в 2007 году. Это эквивалентно менее чем одному 730 МБ. CD-ROM на человека в 1986 г. (539 МБ на человека), примерно 4 CD-ROM на человека 1993 г., 12 CD-ROM на человека в 2000 году и почти 61 CD-ROM на человека в 2007 году. Накапливая предполагаемые 404 миллиарда CD-ROM с 2007 года будет создавать стек из земной шар к Луна и четверть этого расстояния (при толщине 1,2 мм на CD).[9]
  • Мировой технологический потенциал для одностороннего получения информации транслировать В сетях было 432 экзабайта (оптимально сжатой) информации в 1986 году, 715 (оптимально сжатых) экзабайт в 1993 году, 1200 (оптимально сжатых) эксабайт в 2000 году и 1900 в 2007 году.[9]
  • Эффективная способность мира к двустороннему обмену информацией телекоммуникации сети составляли 0,281 экзабайта (оптимально сжатой) информации в 1986 году, 0,471 в 1993 году, 2,2 в 2000 году и 65 (оптимально сжатых) экзабайт в 2007 году.[9]

Новый показатель, который используется в попытке охарактеризовать рост персональной информации, - это объем дисковой памяти на человека (DSP), который измеряется в мегабайтах на человека (где мегабайты 10 лет6 байты и сокращенно MB). Global DSP (GDSP) - это общее пространство на жестком диске (в МБ), на котором проданы новые устройства за год, деленное на мировое население в том году. Метрика GDSP - это грубая мера того, сколько дискового пространства можно было бы использовать для сбора данных о населении мира по отдельным людям.[6] В 1983 году был выпущен один миллион фиксированных приводов с общим числом 90 терабайты были проданы по всему миру; Диски на 30 МБ занимали самый большой сегмент рынка.[10] В 1996 году было продано 105 миллионов дисков общим объемом 160 623 терабайта с 1 и 2 дисками. гигабайт движет лидером отрасли.[11] К 2000 году, когда в отрасли лидируют диски емкостью 20 ГБ, общий объем проданных жестких дисков за год, по прогнозам, составит 2 829 288 терабайт. В 1997 году объем продаж жестких дисков достигнет 34 миллиардов долларов.

В соответствии с Латанья Суини, сегодня в сборе данных можно выделить три тенденции:

Тип 1. Увеличение количества собираемых полей, известное как тренд «собирать больше».

Тип 2. Замените существующий сбор совокупных данных на сбор данных по конкретному человеку, известный как тренд «собирать конкретно».

Тип 3. Соберите информацию, начав новый сбор данных о конкретных людях, известный как тренд «собери, если сможешь».[6]

Связанные термины

Поскольку «информация» в электронных средствах массовой информации часто используется как синоним «данных», термин информационный взрыв тесно связано с концепцией поток данных (также дублированный поток данных). Иногда термин информационный поток также используется. Все это в основном сводится к постоянно растущему количеству электронные данные обменивается за единицу времени. Осведомленность о неуправляемых объемах данных росла вместе с появлением все более мощной обработки данных с середины 1960-х годов.[12]

Вызовы

Несмотря на то, что обилие информации может быть полезным на нескольких уровнях, некоторые проблемы могут вызывать беспокойство, например: Конфиденциальность, правовые и этические нормы, фильтрация и точность данных.[13] Фильтрация относится к поиску полезной информации среди большого количества данных, что относится к работе специалистов по данным. Типичный пример необходимости фильтрации данных (сбор данных ) находится в сфере здравоохранения, поскольку в ближайшие годы должны появиться электронные записи (Электронные медицинские записи ) имеющихся пациентов. Имея такой объем доступной информации, врачи должны будут иметь возможность определять закономерности и выбирать важные данные для постановки диагноза пациента.[13] С другой стороны, по мнению некоторых экспертов, наличие такого большого количества общедоступных данных затрудняет предоставление фактически анонимных данных.[6]Еще один момент, который следует принять во внимание, - это правовые и этические нормы, которые касаются того, кто будет владельцем данных, как часто он / она обязаны публиковать их и на какой срок.[13]При таком большом количестве источников данных еще одной проблемой будет их точность. Недоверенный источник может быть оспорен другими, заказав новый набор данных, вызывая повторение информации.[13]По словам Эдварда Хута, еще одной проблемой является доступность и стоимость такой информации.[14] Уровень доступности можно улучшить либо за счет снижения затрат, либо за счет повышения полезности информации. По словам автора, сокращение затрат могло бы быть осуществлено ассоциациями, которые должны оценить, какая информация имеет отношение к делу, и собрать ее более организованным образом.

Веб-серверы

По состоянию на август 2005 г. насчитывалось более 70 миллионов веб-серверы.[15] По состоянию на сентябрь 2007 г. было более 135 миллионов веб-серверов.[16]

Блоги

В соответствии с Technorati, количество блоги удваивается примерно каждые 6 месяцев, и на апрель 2006 г. было зарегистрировано 35,3 миллиона блогов..[17] Это пример ранней стадии логистический рост, где рост примерно экспоненциальный, поскольку блоги - недавнее нововведение. По мере того, как количество блогов приближается к количеству возможных производителей (людей), происходит насыщение, рост замедляется, и количество блогов в конечном итоге стабилизируется.

Смотрите также

Рекомендации

  1. ^ Гильберт, М. (2015). Глобальный информационный взрыв:https://www.youtube.com/watch?v=8-AqzPe_gNs&list=PLtjBSCvWCU3rNm46D3R85efM0hrzjuAIg. Цифровые технологии и социальные изменения [Открытый онлайн-курс в Калифорнийском университете], бесплатно доступный по адресу: https://canvas.instructure.com/courses/949415
  2. ^ "Информация." http://dictionary.oed.com. по состоянию на 4 января 2008 г.
  3. ^ https://www.nytimes.com/1964/06/07/u-s-will-remove-reactor-in-arctic.html?_r=0
  4. ^ http://www-03.ibm.com/ibm/history/ibm100/us/en/icons/translation/
  5. ^ Дэвис, Кейт (1973). «Аргументы за и против принятия бизнесом социальных обязательств». Журнал Академии Менеджмента. 16 (2): 312–322. Дои:10.2307/255331. JSTOR  255331.
  6. ^ а б c d Суини, Латанья. «Информационный взрыв». Конфиденциальность, раскрытие информации и доступ к данным: теория и практическое применение для статистических агентств (2001): 43-74.
  7. ^ Фуллер, Джек. Что происходит с новостями: информационный взрыв и кризис журналистики. Издательство Чикагского университета, 2010.
  8. ^ Майор, Клэр Хауэлл и Мэгги Савин-Баден. Введение в качественный синтез исследований: управление информационным взрывом в исследованиях в области социальных наук. Рутледж, 2010.
  9. ^ а б c "The Womartinhilbert.net/WorldInfoCapacity.html" бесплатный доступ к исследованию " и "видео анимация".
  10. ^ Диск / Отчет о тенденциях 1983 г., «Неделя компьютеров». Маунтин-Вью, Калифорния. (46) 11.11.83.
  11. ^ В 1997 году объем продаж жестких дисков превысил 34 миллиарда долларов », - пишет Disk / Trend News. Маунтин-Вью, Калифорния: Disk / Trend, Inc., 1997.
  12. ^ Программа просмотра Google Книг Ngram для условий, упомянутых здесь
  13. ^ а б c d Бернер, Эта С. и Жаклин Мосс. «Информатика вызовет грядущий информационный взрыв для пациентов». Журнал Американской ассоциации медицинской информатики 12.6 (2005): 614-617.
  14. ^ Хут, Эдвард Дж. «Информационный взрыв». Бюллетень Нью-Йоркской медицинской академии 65.6 (1989): 647.
  15. ^ Роберт Х. Закон (15 декабря 2010 г.). "Хронология интернета Гоббса 10.1". zakon.org. Получено 27 августа 2011.
  16. ^ «Обзор веб-серверов, август 2011 г.». netcraft.com. Август 2011 г.. Получено 27 августа 2011.
  17. ^ "Состояние блогосферы, апрель 2006 г. Часть 1: О росте блогосферы". Оповещения Sifry (sifry.com). 17 апреля 2006 г. Архивировано с оригинал 9 января 2013 г.. Получено 27 августа 2011.

внешняя ссылка