Бурение данных - Data drilling

Бурение данных (также детализация) относится к любой из различных операций и преобразований табличных, реляционных и многомерных данных. Этот термин широко используется в различных контекстах, но в первую очередь связан со специализированными программного обеспечения разработан специально для анализ данных.

Операции бурения общих данных

Есть определенные операции, которые являются общими для приложений, которые позволяют детализировать данные. Среди них:

Запрос операции:

  • табличный запрос
  • сводный запрос

Табличный запрос

Операции табличных запросов состоят из стандартных операций с таблицами данных.

Среди этих операций:

  • поиск
  • Сортировать
  • фильтр (по значению)
  • фильтр (по расширенной функции или условию)
  • преобразование (например, путем добавления или удаления столбцов)

Рассмотрим следующий пример:

Таблица Фреда и Вильмы (рис 001):

   пол, fname, lname, домашний мужчина, Фред, Шопен, Польша мужчина, Фред, Флинтстоун, Основной мужчина, Фред, Дерст, Женщина США, Вилма, Флинтстоун, Коренная женщина, Вилма, Рудольф, Женщина США, Вилма, Вебб, Мужчина США , Фред, Джонсон, США

Вышеизложенное является примером простой таблицы плоских файлов, отформатированной как значения, разделенные запятыми. В таблице указаны имя, фамилия, пол и страна проживания различных людей по имени Фред или Вильма. Хотя пример отформатирован таким образом, важно подчеркнуть, что операции табличного запроса (а также все операции детализации данных) могут применяться к любым мыслимым тип данных, независимо от основного форматирования. Единственное требование - чтобы данные были доступны для чтения используемому программному приложению.

Сводный запрос

Сводный запрос позволяет несколько представлений данных в соответствии с разными измерениями. Этот тип запроса аналогичен табличному запросу, за исключением того, что он также позволяет представлять данные в итоговом формате в соответствии с гибким выбором пользователя. иерархия. Этот класс операций детализации данных формально (и в общих чертах) известен под разными названиями, включая перекрестный запрос, сводная таблица, пилот данных, избирательная иерархия, переплетение и другие.

Чтобы проиллюстрировать основы операций сводных запросов, рассмотрим Таблица Фреда и Вильмы (рис 001). Быстрый просмотр данных показывает, что в таблице есть избыточная информация. Эта избыточность может быть объединена с помощью схемы или древовидная структура или как-то иначе. Более того, после объединения данные могут иметь множество различных альтернативных макетов.

Используя простой текстовый контур в качестве вывода, можно использовать следующие альтернативные макеты с помощью сводного запроса:

Обобщите по полу (рис. 001):

   женский кремневый камень, вильма рудольф, вильма уэбб, вильма мужской шопен, фред флинтстон, фред дерст, фред джонсон, фред (размеры = пол; табличные поля = lname, fname;)

Резюмируйте по дому, lname (рис. 001):

   коренная порода кремневый камень фред вильма Польша chopin fred usa ... (Размеры = home, lname; Табличные поля = fname;)

Использует

Операции сводных запросов полезны для суммирования совокупности данных несколькими способами, тем самым иллюстрируя различные представления одной и той же базовой информации. Хотя этот тип операций занимает видное место в электронные таблицы и рабочий стол база данных программное обеспечение, его гибкость, вероятно, используется недостаточно. Есть много приложений, которые допускают только «фиксированную» иерархию для представления данных, и это представляет собой существенное ограничение.

Drillup

Drillup противоположность детализации. Например, если вы выполняете детализацию, чтобы увидеть доход от одного продукта, вы можете захотеть выполнить детализацию, чтобы увидеть доход от всех продуктов.[1]

Рекомендации

  1. ^ «Бурение и сверление». IBM. Получено 2020-05-05.