Данные, созданные машиной - Machine-generated data

Данные, созданные машиной является Информация автоматически генерируется компьютерный процесс, заявление, или другой механизм без активного вмешательства человека. Хотя этот срок насчитывает более пятидесяти лет,[1] в настоящее время существует некоторая нерешительность относительно объема этого термина. Курт Монаш из Monash Research определяет это как «данные, которые были полностью созданы машинами ИЛИ данные, которые больше касаются наблюдения за людьми, чем записи их выбора».[2] Между тем, Даниэль Абади, профессор CS в Йель, предлагает более узкое определение: «Машинно-генерируемые данные - это данные, которые генерируются в результате решения независимого вычислительного агента или измерения события, которое не вызвано действиями человека».[3] Независимо от различий в определениях, оба исключают данные, введенные вручную человеком.[4] Данные, генерируемые машиной, пересекают все отрасли промышленности. Часто и все чаще люди не осознают, что их действия создают данные.[5]

Актуальность

Машинно сгенерированные данные не имеют единой формы; скорее, тип, формат, метаданные, и частота реагирования на определенные бизнес-цели. Машины часто создают его по определенному расписанию или в ответ на изменение состояния, действие, транзакцию или другое событие. Поскольку событие является историческим, данные не подлежат обновлению или изменению. Отчасти из-за этого качества НАС. судебные системы Считайте машинные данные высоконадежными.[6]

Машинно-генерируемые данные - это источник жизненной силы Интернет вещей (Интернет вещей).[7]

Рост

В 2009, Gartner опубликовал, что данные вырастут на 650% в течение следующих пяти лет.[8] Большая часть роста данных - это побочный продукт данных, генерируемых машинами.[4] По оценке IDC, в 2020 году подключенных устройств будет в 26 раз больше, чем людей.[9] Wikibon прогнозирует, что 514 миллиардов долларов будет потрачено на Промышленный Интернет в 2020 году.[10]

Обработка

Учитывая довольно статичную, но объемную природу машинно-генерируемых данных, владельцы данных полагаются на хорошо масштабируемые инструменты для обработки и анализа полученных результатов. набор данных. Почти все данные, сгенерированные машиной, неструктурированы, но затем преобразуются в общую структуру.[4] Обычно эти производные структуры содержат много точки данных / столбцы. С этими точками данных проблема в основном заключается в анализе данных. Учитывая высокие требования к производительности наряду с большими объемами данных, традиционные индексация базы данных а разделение ограничивает размер и историю набора данных для обработки. Альтернативные подходы существуют с столбчатые базы данных поскольку во время конкретного анализа будут доступны только определенные «столбцы» набора данных.

Примеры

Примечания

Список литературы

  1. ^ Хорафас, Димитрис Н., Функции систем управления и подходы к программированию: приложения, 1966, https://books.google.com/books?id=D1qDu4nTmvsC
  2. ^ Монаш, 30.12.2010
  3. ^ Абади
  4. ^ а б c Монаш, три широкие категории данных
  5. ^ Deloach, данные, созданные машинами
  6. ^ Федеральный обзор доказательств, данные, созданные машинами, не были заявлены и не вызывали никаких слухов
  7. ^ Сет Граймс [@SethGrimes] (8 марта 2016 г.). «Машинно-генерируемые данные - это жизненная сила Интернета вещей (#IoT): ключевой, но упущенный момент» (Твит) - через Twitter.
  8. ^ ScienceLogic
  9. ^ [1], Блог Чака
  10. ^ [2], Викибон
  11. ^ а б c d е Монаш, Примеры данных, генерируемых машиной

Библиография