GeneRIF - Википедия - GeneRIF
А GeneRIF или же Ссылка гена на функцию это короткое (255 символов или меньше) утверждение о функции гена. GeneRIF обеспечивают простой механизм для разрешения ученые добавить в функционал аннотация из гены описанный в Entrez Gene база данных. На практике, функция построен довольно широко. Например, есть GeneRIF, которые обсуждают роль гена в заболевании, GeneRIF, которые указывают зрителю на обзорную статью о гене, и GeneRIF, которые обсуждают структуру гена. Однако заявленное намерение состоит в том, чтобы GeneRIF касались функции генов. В настоящее время создано более полумиллиона geneRIF для генов почти 1000 различных видов.[1]
GeneRIF всегда связаны с конкретными записями в базе данных Entrez Gene. Каждый GeneRIF имеет указатель на PubMed ID (тип идентификатора документа) научной публикации, который обеспечивает доказательство утверждения, сделанного GeneRIF. GeneRIF часто извлекаются непосредственно из документа, который идентифицируется идентификатором PubMed, очень часто из его заголовка или из его последнего предложения.
GeneRIF обычно производятся NCBI индексаторы, но любой может отправить GeneRIF. Для обработки должен существовать действительный идентификатор гена для конкретного гена, или сотрудники гена должны назначить общий идентификатор гена для разновидность. Последний случай реализуется через записи в Gene с символом NEWENTRY. После того, как идентификатор гена будет идентифицирован, для заполнения потребуется всего три типа информации. подчинение:
- краткий фраза описание функции или функций (менее 255 символы по длине, желательно больше, чем повторное изложение названия статьи);
- опубликованный документ, описывающий эту функцию, реализованную путем предоставления PubMed ID цитирования в PubMed;
- действительный Адрес электронной почты (который останется конфиденциальным).
Пример
Вот некоторые GeneRIF, взятые из Entrez Gene для GeneID 7157, гена человека TP53. PubMed идентификаторы документов в примерах не указаны. Обратите внимание на широкую вариативность в отношении наличия или отсутствия знаков препинания и заглавных букв в начале предложения.
- p53 и c-erbB-2 могут играть независимую роль в канцерогенезе рака желчного пузыря.
- Распад эндогенного HIPK2 зависит от присутствия функционального белка p53.
- Аллели 72 кодона p53 влияют на реакцию на противораковые препараты в клетках пожилых людей, регулируя ингибитор клеточного цикла p21WAF1
- Логистический регрессионный анализ показал, что p53 и COX-2 являются зависимыми предикторами канцерогенеза поджелудочной железы, а также взаимной взаимосвязью с прогрессированием неопластов между p53 и COX-2.
GeneRIF представляют собой необычный тип текстового жанра, и недавно они стали предметом ряда статей сообщества разработчиков естественного языка.
внешняя ссылка
- Веб-страница NCBI с описанием GeneRIF
- Митчелл Дж. А., Аронсон А. Р., Морк Дж. Г., Народный LC, Хамфри С. М., Уорд Дж. М. (2003). «Индексирование генов: характеристика и анализ GeneRIF NLM». AMIA Annu Symp Proc: 460–4. ЧВК 1480312. PMID 14728215.
Рекомендации
- Уильям Херш, Рави Теджа Бхупатираджу (2003). Обзор трека TREC Genomics (PDF). Архивировано из оригинал (PDF) на 2005-05-12. Документ с описанием Конференция по поиску текста «общая задача», включающая автоматическое предсказание GeneRIF.
- Лу, Чжиюн; К. Бретоннель Коэн; Лоуренс Хантер (2006). Поиск GeneRIF с помощью аннотаций генной онтологии (PDF). Proc. Тихоокеанский симпозиум по биокомпьютингу, 2006 г., стр. 52–63. Архивировано из оригинал (PDF) на 13 февраля 2006 г. Статья Лу и др., Описывающая систему, которая автоматически предлагает GeneRIF.