KEGG - Википедия - KEGG
Содержание | |
---|---|
Описание | Ресурс биоинформатики для расшифровки генома. |
Организмы | Все |
Контакт | |
Исследовательский центр | Киотский университет |
Лаборатория | Kanehisa Laboratories |
Основное цитирование | PMID 10592173 |
Дата выхода | 1995 |
Доступ | |
Интернет сайт | www |
веб-сервис URL | ОТДЫХ видеть KEGG API |
Инструменты | |
Интернет | KEGG Mapper |
КЕГГ (Киотская энциклопедия генов и геномов) представляет собой набор баз данных, касающихся геномы, биологические пути, болезни, наркотики, и химические субстанции. КЕГГ используется для биоинформатика исследования и образование, включая анализ данных в геномика, метагеномика, метаболомика и другие омики исследования, моделирование и моделирование в системная биология, и трансляционные исследования в разработка лекарств.
Вступление
Проект базы данных KEGG был инициирован в 1995 г. Минору Канехиса, Профессор Института химических исследований, Киотский университет, под тогдашним японским Программа генома человека.[1][2] Предвидение потребности в компьютеризированном ресурсе, который можно использовать для биологической интерпретации данные последовательности генома, он начал разработку базы данных KEGG PATHWAY. Это коллекция нарисованных вручную карт путей KEGG, представляющих экспериментальные знания о метаболизм и различные другие функции клетка и организм. Каждая карта путей содержит сеть молекулярных взаимодействий и реакций и предназначена для связи гены в геноме генные продукты (по большей части белки ) в пути. Это позволило провести анализ, называемый картированием путей KEGG, при котором содержание гена в геноме сравнивается с базой данных KEGG PATHWAY, чтобы изучить, какие пути и связанные с ними функции, вероятно, закодированы в геноме.
По словам разработчиков, KEGG - это «компьютерное представление» биологическая система.[3] Он объединяет строительные блоки и схемы соединений системы, в частности, генетические строительные блоки генов и белков, химические строительные блоки маленькие молекулы и реакции, и электрические схемы молекулярного взаимодействия и реакционных сетей. Эта концепция реализована в следующих базах данных KEGG, которые подразделяются на системные, геномные, химические и медицинские.[4]
- Системная информация
- ПУТЬ - путь карты для функций клеток и организма
- МОДУЛЬ - модули или функциональные единицы генов
- BRITE - иерархическая классификация биологических объектов
- Геномная информация
- Химическая информация
- СОЕДИНЕНИЕ, ГЛИКАН - химические соединения и гликаны
- РЕАКЦИЯ, RPAIR, RCLASS - химические реакции
- ФЕРМЕНТ - номенклатура ферментов
- Информация о здоровье
- ЗАБОЛЕВАНИЕ - человек болезни
- ПРЕПАРАТ, СРЕДСТВО, МЕДИКАМЕНТ - одобренные препараты
- ЭНВИРОН - сырые наркотики и вещества, связанные со здоровьем
Базы данных
Системная информация
База данных KEGG PATHWAY, база данных схем подключения, является ядром ресурса KEGG. Это набор карт путей, объединяющих множество объектов, включая гены, белки, РНК, химические соединения, гликаны и химические реакции, а также гены болезней и мишени для лекарств, которые хранятся в виде отдельных записей в других базах данных KEGG. Карты путей подразделяются на следующие разделы:
- Метаболизм
- Обработка генетической информации (транскрипция, перевод, репликация и ремонт, так далее.)
- Обработка экологической информации (мембранный транспорт, преобразование сигнала, так далее.)
- Клеточные процессы (рост клеток, смерть клетки, клеточная мембрана функции и т. д.)
- Органические системы (иммунная система, эндокринная система, нервная система, так далее.)
- Человек болезни
- Разработка лекарств
Раздел метаболизма содержит эстетически нарисованные глобальные карты, показывающие общую картину метаболизма, в дополнение к обычным картам метаболических путей. Глобальные карты с низким разрешением могут использоваться, например, для сравнения метаболических возможностей различных организмов в исследованиях геномики и различных образцов окружающей среды в исследованиях метагеномики. Напротив, модули KEGG в базе данных KEGG MODULE представляют собой локализованные электрические схемы с более высоким разрешением, представляющие более узкие функциональные единицы в пределах карты путей, такие как подпути, сохраненные среди определенных групп организмов и молекулярных комплексов. Модули KEGG определяются как характерные наборы генов, которые могут быть связаны с определенными метаболическими возможностями и другими фенотипический функции, чтобы их можно было использовать для автоматической интерпретации данных генома и метагенома.
Еще одна база данных, дополняющая KEGG PATHWAY, - это база данных KEGG BRITE. Это онтология база данных, содержащая иерархические классификации различных сущностей, включая гены, белки, организмы, болезни, лекарства и химические соединения. В то время как KEGG PATHWAY ограничивается молекулярными взаимодействиями и реакциями этих сущностей, KEGG BRITE включает в себя множество различных типов отношений.
Геномная информация
Спустя несколько месяцев после начала проекта KEGG в 1995 г., первый отчет о полностью последовательной бактериальный геном был опубликован.[5] С тех пор все опубликованные полные геномы накапливаются в KEGG для обоих эукариоты и прокариоты. База данных KEGG GENES содержит информацию на уровне генов / белков, а база данных KEGG GENOME содержит информацию на уровне организма для этих геномов. База данных KEGG GENES состоит из наборов генов для полных геномов, и гены в каждом наборе приведены аннотации в виде установления соответствий схемам подключения карт путей KEGG, модулей KEGG и иерархий BRITE.
Эти соответствия производятся с использованием концепции ортологи. Карты путей KEGG составлены на основе экспериментальных данных на конкретных организмах, но они разработаны так, чтобы их можно было применить и к другим организмам, поскольку разные организмы, такие как человек и мышь, часто имеют одинаковые пути, состоящие из функционально идентичных генов, называемых ортологическими генами или ортологи. Все гены в базе данных KEGG GENES сгруппированы в такие ортологи в базе данных KEGG ORTHOLOGY (KO). Поскольку узлам (генным продуктам) карт путей KEGG, а также модулям KEGG и иерархиям BRITE присваиваются идентификаторы KO, соответствия устанавливаются после того, как гены в геноме аннотируются идентификаторами KO с помощью аннотация генома процедура в КЕГГ.[4]
Химическая информация
Карты метаболических путей KEGG изображают двойные аспекты метаболической сети: геномную сеть того, как кодируется геном ферменты связаны, чтобы катализировать последовательные реакции и химическую сеть, как химические структуры субстраты и товары трансформируются этими реакциями.[6] Набор генов ферментов в геноме будет идентифицировать сети ферментных отношений при наложении на карты путей KEGG, которые, в свою очередь, характеризуют сети трансформации химической структуры, позволяя интерпретировать биосинтетический и биоразложение потенциалы организма. Как вариант, набор метаболиты Идентификация в метаболоме приведет к пониманию ферментативных путей и вовлеченных ферментных генов.
Базы данных категории химической информации, которые в совокупности называются KEGG LIGAND, организованы путем сбора информации о химической сети. В начале проекта KEGG KEGG LIGAND состоял из трех баз данных: KEGG COMPOUND для химических соединений, KEGG REACTION для химических реакций и KEGG ENZYME для реакций в номенклатуре ферментов.[7] В настоящее время существуют дополнительные базы данных: KEGG GLYCAN для гликанов.[8] и две вспомогательные базы данных реакций, называемые RPAIR (выравнивание пар реагентов) и RCLASS (класс реакции).[9] KEGG COMPOUND также был расширен за счет включения различных соединений, таких как ксенобиотики, помимо метаболитов.
Информация о здоровье
В KEGG болезни рассматриваются как возмущенные состояния биологической системы, вызванные возмущающими воздействиями генетических факторов и факторов окружающей среды, а лекарства рассматриваются как различные типы возмущающих факторов.[10] База данных KEGG PATHWAY включает не только нормальные состояния, но и возмущенные состояния биологических систем. Однако карты путей распространения болезни не могут быть составлены для большинства болезней, поскольку молекулярные механизмы недостаточно изучены. Альтернативный подход используется в базе данных KEGG DISEASE, которая просто каталогизирует известные генетические факторы и факторы окружающей среды болезней. Эти каталоги могут в конечном итоге привести к более полным схемам заболеваний.
База данных KEGG DRUG содержит активные ингредиенты из одобренные препараты в Японии, США и Европе. Они различаются по химическому строению и / или химическим компонентам и связаны с цель молекулы метаболизирующие ферменты и другую информацию о сети молекулярного взаимодействия в картах путей KEGG и иерархиях BRITE. Это позволяет проводить комплексный анализ взаимодействия лекарств с геномной информацией. Сырые наркотики и другие вещества, связанные со здоровьем, которые не входят в категорию одобренных лекарств, хранятся в базе данных KEGG ENVIRON. Базы данных в категории информации о здоровье вместе называются KEGG MEDICUS, что также включает вкладыши в пакеты всех препаратов, продаваемых в Японии.
Модель подписки
В июле 2011 года KEGG представила модель подписки для загрузки по FTP из-за значительного сокращения государственного финансирования. KEGG по-прежнему доступен бесплатно через свой веб-сайт, но модель подписки вызвала дискуссии об устойчивости баз данных биоинформатики.[11][12]
Смотрите также
- База данных сравнительной токсикогеномики CTD объединяет пути KEGG с токсикогеномными данными и данными о заболеваниях
- ConsensusPathDB, база данных молекулярных функциональных взаимодействий, объединяющая информацию из KEGG
- Генная онтология
- PubMed
- Uniprot
- База данных генных болезней
Рекомендации
- ^ Канехиса М, Гото С (2000). "KEGG: Киотская энциклопедия генов и геномов". Нуклеиновые кислоты Res. 28 (1): 27–30. Дои:10.1093 / nar / 28.1.27. ЧВК 102409. PMID 10592173.
- ^ Канехиса М (1997). «База данных для постгеномного анализа». Тенденции Genet. 13 (9): 375–6. Дои:10.1016 / S0168-9525 (97) 01223-7. PMID 9287494.
- ^ Канехиса М., Гото С., Хаттори М., Аоки-Киношита К.Ф., Ито М., Кавасима С., Катаяма Т., Араки М., Хиракава М. (2006). «От геномики к химической геномике: новые разработки в KEGG». Нуклеиновые кислоты Res. 34 (Выпуск базы данных): D354–7. Дои:10.1093 / нар / gkj102. ЧВК 1347464. PMID 16381885.
- ^ а б Канехиса М., Гото С., Сато Й., Кавасима М., Фурумичи М., Танабэ М. (2014). «Данные, информация, знания и принципы: назад к метаболизму в KEGG». Нуклеиновые кислоты Res. 42 (Выпуск базы данных): D199–205. Дои:10.1093 / nar / gkt1076. ЧВК 3965122. PMID 24214961.
- ^ Флейшманн Р.Д., Адамс, доктор медицины, Уайт О., Клейтон Р.А., Киркнесс Э.Ф., Керлаваж А.Р., Булт С.Дж., Томб Дж.Ф., Догерти Б.А., Меррик Дж.М. и др. (1995). «Полногеномное случайное секвенирование и сборка Haemophilus influenzae Rd». Наука. 269 (5223): 496–512. Bibcode:1995Научный ... 269..496F. Дои:10.1126 / science.7542800. PMID 7542800. S2CID 10423613.
- ^ Канехиса М (2013). «Химическая и геномная эволюция сетей реакций, катализируемых ферментами». FEBS Lett. 587 (17): 2731–7. Дои:10.1016 / j.febslet.2013.06.026. HDL:2433/178762. PMID 23816707. S2CID 40074657.
- ^ Гото С., Нисиока Т., Канехиса М. (1999). «База данных LIGAND по ферментам, соединениям и реакциям». Нуклеиновые кислоты Res. 27 (1): 377–9. Дои:10.1093 / nar / 27.1.377. ЧВК 148189. PMID 9847234.
- ^ Хашимото К., Гото С., Кавано С., Аоки-Киношита К.Ф., Уэда Н., Хамадзима М., Кавасаки Т., Канехиса М. (2006). «KEGG как ресурс по информатике glycome». Гликобиология. 16 (5): 63R – 70R. Дои:10.1093 / гликоб / cwj010. PMID 16014746.
- ^ Муто А., Котера М., Токимацу Т., Накагава З., Гото С., Канехиса М. (2013). «Модульная архитектура метаболических путей, выявленная консервативными последовательностями реакций». Модель J Chem Inf. 53 (3): 613–22. Дои:10.1021 / ci3005379. ЧВК 3632090. PMID 23384306.
- ^ Канехиса М., Гото С., Фурумичи М., Танабэ М., Хиракава М. (2010). «KEGG для представления и анализа молекулярных сетей, включающих болезни и лекарства». Нуклеиновые кислоты Res. 38 (Выпуск базы данных): D355–60. Дои:10.1093 / нар / gkp896. ЧВК 2808910. PMID 19880382.
- ^ Гальперин М.Ю., Фернандес-Суарес XM (2012). "Выпуск базы данных исследований нуклеиновых кислот 2012 г. и онлайн-сборник базы данных по молекулярной биологии". Нуклеиновые кислоты Res. 40 (Проблема с базой данных): D1–8. Дои:10.1093 / нар / gkr1196. ЧВК 3245068. PMID 22144685.
- ^ Хайден, EC (2013). «Популярная база данных растений для взимания платы с пользователей». Природа. Дои:10.1038 / природа.2013.13642.
внешняя ссылка
- Сайт KEGG
- Сайт-зеркало GenomeNet
- В вход для KEGG в MetaBase