Система гетерогенных баз данных - Heterogeneous database system

А гетерогенная система баз данных это автоматизированная (или полуавтоматическая) система для интеграция разнородных, разрозненных системы управления базами данных чтобы предоставить пользователю единый унифицированный интерфейс запросов.

Гетерогенные системы баз данных (HDB) - это вычислительные модели и программные реализации, обеспечивающие интеграцию гетерогенных баз данных.[1][2]

Проблемы интеграции гетерогенных баз данных

Эта статья не содержит подробностей о системы управления распределенными базами данных (иногда известный как системы федеративных баз данных ).


Техническая неоднородность

Разные форматы файлов, доступ протоколы, языки запросов и т. д. Часто это называется синтаксической неоднородностью с точки зрения данных.

Неоднородность модели данных

Различные способы представления и хранения одних и тех же данных. Декомпозиции таблиц могут различаться, имена столбцов (метки данных) могут быть разными (но иметь одинаковую семантику), данные кодирование схемы могут различаться (т. е. должна ли шкала измерений быть явно включена в поле или должна подразумеваться где-то еще). Также называется схематической неоднородностью.

Семантическая неоднородность

Данные из составляющих баз данных могут быть связаны, но разными. Возможно, система баз данных должна уметь интегрировать геномные и протеомные данные. Они связаны - у гена может быть несколько белковых продуктов, - но данные разные (нуклеотид последовательности и аминокислота последовательности или гидрофильная или -фобная аминокислотная последовательность и положительно или отрицательно заряженные аминокислоты). Может быть много способов взглянуть на семантически похожие, но разные наборы данных.

От системы также может потребоваться предоставить пользователю «новые» знания. Связь между данными может быть установлена ​​в соответствии с правилами, указанными в домене. онтологии.

Смотрите также

Рекомендации

  1. ^ Суджанский, Вальтер (август 2001). «Интеграция гетерогенных баз данных в биомедицине». Журнал биомедицинской информатики. 34 (4): 285–298. Дои:10.1006 / jbin.2001.1024. PMID  11977810.
  2. ^ Sheth, Amit P .; Джеймс А. Ларсон (сентябрь 1990 г.). «Системы федеративных баз данных для управления распределенными, гетерогенными и автономными базами данных» (PDF). Опросы ACM Computing. 22 (3): 183–236. CiteSeerX  10.1.1.381.9176. Дои:10.1145/96602.96604.