Витрина данных - Data mart

Хранилище данных обзор с витринами данных, показанными в правом верхнем углу.

А витрина данных это структура / шаблон доступа, специфичный для хранилище данных среды, используемые для получения клиентских данных. Витрина данных - это часть хранилища данных, которая обычно ориентирована на конкретное направление бизнеса или команду. В то время как хранилища данных имеют глубину масштаба предприятия, информация в витринах данных относится к одному отделу. В некоторых случаях каждый отдел или бизнес-подразделение считается владелец витрины данных, включая все аппаратное обеспечение, программного обеспечения и данные.[1] Это позволяет каждому отделу изолировать использование, манипулирование и развитие своих данных. В других развертываниях, где используются согласованные измерения, это владение бизнес-единицей не будет выполняться для общих измерений, таких как клиент, продукт и т. Д.

Склады и витрины данных построены потому, что информация в базе данных не организована таким образом, чтобы сделать ее легко доступной. Для этой организации требуются слишком сложные, труднодоступные или ресурсоемкие запросы.

Пока транзакционные базы данных предназначены для обновления, хранилища данных или витрины только чтение. Хранилища данных предназначены для доступа к большим группам связанных записей. Витрины данных сокращают время отклика конечных пользователей, позволяя пользователям иметь доступ к конкретному типу данных, которые им нужно просматривать чаще всего, путем предоставления данных способом, поддерживающим коллективное представление группы пользователей.

Витрина данных - это, по сути, сжатая и более сфокусированная версия хранилища данных, которая отражает правила и спецификации процессов каждого бизнес-подразделения в организации. Каждая витрина данных предназначена для определенной бизнес-функции или региона. Этот набор данных может охватывать многие или все функциональные предметные области предприятия. Обычно несколько витрин данных используются для обслуживания потребностей каждого отдельного бизнес-подразделения (разные витрины данных могут использоваться для получения конкретной информации для различных подразделений предприятия, таких как бухгалтерский учет, маркетинг, продажи и т. Д.).

Связанный термин Spreadmart - уничижительное слово, описывающее ситуацию, которая возникает, когда один или несколько бизнес-аналитиков разрабатывают систему связанных электронные таблицы выполнить бизнес-анализ, а затем довести его до такого размера и степени сложности, которые делают практически невозможным обслуживание. (Термин для этого состояния - «Ад Excel».)

Витрина данных против хранилища данных

Хранилище данных:

  • Поддерживает несколько предметных областей
  • Содержит очень подробную информацию
  • Работает для интеграции всех источников данных
  • Не обязательно использовать размерная модель но кормит размерные модели.

Витрина данных:

  • Часто содержит только одну предметную область, например, финансы или продажи.
  • Может содержать более обобщенные данные (хотя может содержать полную информацию)
  • Концентрируется на интеграция информации из заданной предметной области или набора исходных систем
  • Построен на основе размерной модели с использованием звездообразной схемы.

Схемы дизайна

Причины создания витрины данных

  • Легкий доступ к часто необходимым данным
  • Создает коллективное представление группы пользователей
  • Улучшает конечного пользователя время отклика
  • Легкость создания
  • Более низкая стоимость, чем реализация полного хранилища данных
  • Потенциальные пользователи определены более четко, чем в полном хранилище данных
  • Содержит только важные бизнес-данные и менее загроможден.
  • Он содержит ключевую информацию

Зависимая витрина данных

Согласно Инмон школа хранилищ данных, зависимая витрина данных является логическим подмножеством (Посмотреть ) или физическое подмножество (отрывок) более крупного хранилище данных, изолированного по одной из следующих причин:

  • Необходимость освежения для особенного модель данных или же схема: например, реструктурировать для OLAP
  • Производительность: выгрузить витрину данных в отдельный компьютер для повышения эффективности или устранения необходимости управлять этой рабочей нагрузкой в ​​централизованном хранилище данных.
  • Безопасность: выборочное разделение авторизованного подмножества данных
  • Целесообразность: для обхода управления данными и авторизации, необходимых для включения нового приложения в хранилище данных предприятия.
  • Испытательный полигон: продемонстрировать жизнеспособность и потенциал возврата инвестиций (ROI) приложения перед его переносом в хранилище данных предприятия.
  • Политика: стратегия выживания для ИТ (информационных технологий) в ситуациях, когда группа пользователей имеет большее влияние, чем финансирование, или не является хорошим гражданином в централизованном хранилище данных.
  • Политика: стратегия выживания для потребителей данных в ситуациях, когда команда хранилищ данных не может создать пригодное для использования хранилище данных.

Согласно школе хранилищ данных Инмон, компромиссы, присущие витринам данных, включают ограниченное масштабируемость, дублирование данных, несогласованность данных с другими хранилищами информации и неспособностью использовать корпоративные источники данных.

Альтернативная школа хранения данных - это школа Ральф Кимбалл. По его мнению, хранилище данных - это не что иное, как объединение всех витрин данных. Это представление помогает снизить затраты и обеспечивает быструю разработку, но может создать несовместимое хранилище данных, особенно в крупных организациях. Поэтому подход Кимбалла больше подходит для малых и средних корпораций.[2]

Смотрите также

Рекомендации

  1. ^ Витрина данных не равно хранилищу данных
  2. ^ Paulraj Ponniah. Основы хранилищ данных для ИТ-специалистов. Wiley, 2010, стр. 29–32. ISBN  0470462078.

Библиография

внешняя ссылка