ХИКЕШИ - HIKESHI
ХИКЕШИ | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| |||||||||||||||||||||||||
Идентификаторы | |||||||||||||||||||||||||
Псевдонимы | ХИКЕШИ, HSPC179, Hikeshi, L7RN6, OPI10, HSPC138, C11orf73, HLD13, открытая рамка считывания 73 хромосомы 11, Hikeshi, фактор ядерного импорта белка теплового шока, фактор ядерного импорта белка теплового шока hikeshi | ||||||||||||||||||||||||
Внешние идентификаторы | OMIM: 614908 MGI: 96738 ГомолоГен: 6908 Генные карты: ХИКЕШИ | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ортологи | |||||||||||||||||||||||||
Виды | Человек | Мышь | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ансамбль | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (мРНК) | |||||||||||||||||||||||||
RefSeq (белок) | |||||||||||||||||||||||||
Расположение (UCSC) | Chr 11: 86,3 - 86,35 Мб | Chr 7: 89.92 - 89.94 Мб | |||||||||||||||||||||||
PubMed поиск | [3] | [4] | |||||||||||||||||||||||
Викиданные | |||||||||||||||||||||||||
|
ХИКЕШИ это белок важен для развития легких и многоклеточного организма[5] что у людей кодируется ХИКЕШИ ген.[6] HIKESHI обнаружен на хромосоме 11 у человека и хромосоме 7 у мышей. Подобные последовательности (ортологи ) встречаются у большинства видов животных и грибов. Гомолог мыши, летальный ген на 7 хромосоме белок Ринчик 6 кодируется l7Rn6 ген.[7] Когда белок l7Rn6 нарушается у мышей, мыши проявляют тяжелую эмфизема при рождении в результате дезорганизации аппарат Гольджи и образование аберрантных везикулярных структур внутри клубные клетки.[5][нуждается в обновлении ]
Ген
HIKESHI - это ген, кодирующий белок, у Homo sapiens. Альтернативные названия гена - FLJ43020, HSPC138, HSPC179 и L7RN6. Расположен на длинном плече хромосомы 11 в области q14.2, весь ген, включая интроны и экзоны 42 698 пар оснований на положительной цепи. В мРНК Варианта 1 HIKESHI включает экзоны 1, 3, 4, 5 и 7, составляющие 1183 пары оснований, при этом пары оснований с 239 по 832 представляют собой кодирующие области.
Альтернативная сварка
Вариант 1 - самый длинный и наиболее распространенный вариант кодирования белка. В трех других основных вариантах используется альтернативная последовательность экзона, которая выходит за пределы рамки считывания, вызывая преждевременное завершение последовательности мРНК и разрушая белок. В таблице ниже показаны различные варианты и использование экзонов.
Вариант | Экзон 1 | Экзон 2 | Экзон 3 | Экзон 4 | Экзон 5 | Экзон 6 | Экзон 7 | Кодирование белков |
---|---|---|---|---|---|---|---|---|
1 | Икс | Икс | Икс | Икс | Икс | да | ||
2 | Икс | Икс | Икс | Икс | Икс | Икс | Нет | |
3 | Икс | Икс | Икс | Икс | Икс | Нет | ||
4 | Икс | Икс | Икс | Икс | Нет |
Четыре варианта, показанные в таблице выше, являются наиболее распространенными. изоформы найдено в клетках человека. Всего существует 13 последовательностей с альтернативным сплайсингом и три формы без сплайсинга, которые используют два альтернативных промотора. Варианты мРНК различаются комбинацией 8 разных экзонов, альтернативными, перекрывающимися экзонами и сохранением интроны. Помимо альтернативы сращивание, мРНК отличаются усечением на 3 ’конце. Вариант 1 - это одна из десяти мРНК, которые, как было показано, кодируют белок, в то время как остальные, похоже, связаны бессмысленным распадом мРНК.[8] представление изоформ C11orf73
Промоутер
Регион промотора, GXP 47146, был найден с помощью ElDorado.[9] инструмент от Genomatix. Последовательность 840 п.н. расположена перед геном HIKESHI в точках ДНК с 86012753 по 86013592. Промотор консервативен в 12 из 12 ортологов и кодирует 6 соответствующих транскриптов.
Консервированные сайты связывания факторов транскрипции из инструмента Genomatix ElDorado:
Подробная информация о семье | От | Чтобы | Якорь | Ориентация | Сохранено в Mus Musculus | Матрица Сим | Последовательность | Вхождение |
---|---|---|---|---|---|---|---|---|
Регуляторы клеточного цикла: элемент гомологии клеточного цикла | 137 | 149 | 143 | + прядь | консервированный | 0.943 | ggacTTGAattca | 1 |
Факторы связывания GATA | 172 | 184 | 178 | + прядь | консервированный | 0.946 | taaAGATttgagg | 1 |
Фактор белка, связывающего ТАТА позвоночных | 193 | 209 | 201 | + прядь | консервированный | 0.983 | tcctaTAAAatttggat | 1 |
Факторы теплового шока | 291 | 315 | 303 | + прядь | консервированный | 0.992 | cacagaaacgttAGAAgcatctctt | 4 |
Факторы ETS1 человека и мыши | 512 | 532 | 522 | + прядь | консервированный | 0.984 | taagccccGGAAgtacttgtt | 3 |
Фактор транскрипции цинкового пальца RU49, Zipro1 | 522 | 528 | 525 | + прядь | консервированный | 0.989 | АГТАКТ | 2 |
Круппель подобные факторы транскрипции | 618 | 634 | 626 | + прядь | консервированный | 0.925 | tggaGGGGcagacaccc | 1 |
SOX / SRY-определение пола / яичек и факторы HMG box | 636 | 658 | 647 | + прядь | консервированный | 0.925 | cccgcaAATTctggaaggttctt | 1 |
Прекращение
Окончание продукта мРНК кодируется внутри кДНК гена. Концевая терминация продукта мРНК обычно имеет три основных особенности: сигнал поли А, поли Хвост, и область последовательности, которая может образовывать стержень петля структура. Сигнал поли А представляет собой высококонсервативный сайт, последовательность длиной шесть нуклеотидов. У эукариот последовательность представляет собой AATAAA и расположена примерно в 10-30 нуклеотидах от сайта поли А. Последовательность AATAAA представляет собой высококонсервативный эукариотический сигнал полиА, который сигнализирует о полиаденилировании продукта мРНК через 10-30 пар оснований после сигнальной последовательности. Сайт polyA для C11orf73 - это GTA.
Экспрессия гена
Было установлено, что HIKESHI экспрессируется повсеместно на высоком уровне в 2,3 раза выше среднего. C11orf73 экспрессируется в большом количестве тканей человека.[10][11] Между профилями экспрессии и профилем EST на UniGene было показано, что только 11 тканей не экспрессируют C11orf73, скорее всего, из-за небольшого размера образцов в ткани.
Протеин
Ген HIKESHI человека кодирует белок, называемый неохарактеризованный белок C11orf73.[6] Гомологичный ген L7rn6 мыши кодирует белок, называемый летальный ген на 7 хромосоме Ринчик 6.[7]
1 mfgclvagrl vqtaaqqvae dkfvfdlpdy esinhvvvfm lgtipfpegm ggsvyfsypd61 sngmpvwqll gfvtngkpsa ifkisglksg egsqhpfgam nivrtpsvaq igisvellds121 maqqtpvgna avssvdsftq ftqkmldnfy nfassfavsq aqmtpspsem fipanvvlkw181 yenfqrrlaq nplfwkt
Кодируемый человеческий белок состоит из 197 аминокислот и весит 21 628 дальтон. По аналогии с белком мыши, гипотетическая функция белка HIKESHI человека заключается в организации и функции секреторного аппарата в клетках легких.[5]
Белок неизвестной функции (DUF775) | |||||||||
---|---|---|---|---|---|---|---|---|---|
Идентификаторы | |||||||||
Символ | DUF775 | ||||||||
Pfam | PF05603 | ||||||||
ИнтерПро | IPR008493 | ||||||||
|
В белковый домен известный как DUF775 (домен с неизвестной функцией 775), находится в белках HIKESHI человека и L7rn6 мыши. Домен DUF775 состоит из 197 аминокислот, такой же длины, как и белок. Другие белки, которые составляют суперсемейство DUF 775 по определению, включают все ортологи C11orf73.
Анализ гидропатии показывает, что в белке нет обширных гидрофобных участков, и, следовательно, можно сделать вывод, что HIKESHI является цитоплазматическим белком. Изоэлектрическая точка для C11orf73 составляет 5,108, что позволяет предположить, что он оптимально функционирует в более кислой среде.
SNP
Единственный SNP,[13] или однонуклеотидный полиморфизм, для последовательности C11orf73 приводит к замене аминокислот в белке. Отсутствие других SNP, скорее всего, связано с высоким уровнем консервации HIKESHI и смертельным эффектом, который мутация в белке оказывает на организм. Фенотип SNP неизвестен.
Функция | dbSNP Аллель | Белковый остаток | Положение кодона | Аминокислотная позиция |
---|---|---|---|---|
Справка | C | Пролин [P] | 1 | 47 |
Миссенс | г | Аланин [A] | 1 | 47 |
Gene Neighborhood
Окружающие HIKESHI гены - это CCDC81, ME3, и EED. Генетическое соседство исследуется, чтобы лучше понять возможную функцию гена, глядя на функцию окружающих генов.
Ген CCDC81 кодирует не охарактеризованный белковый продукт и ориентирован на положительную цепь. CCDC81 обозначает домен coiled-coil, содержащий 81 изоформу 1.
Ген ME3 обозначает предшественник митохондриального яблочного фермента 3. Яблочный фермент катализирует окислительное декарбоксилирование малат к пируват используя либо НАД + или НАДФ + в качестве кофактора. Ткани млекопитающих содержат 3 различных изоформы яблочного фермента: цитозольную НАДФ (+) - зависимую изоформу, митохондриальную НАДФ (+) - зависимую изоформу и митохондриальную НАД (+) - зависимую изоформу. Этот ген кодирует митохондриальную НАДФ (+) - зависимую изоформу. Для этого гена было обнаружено множество альтернативно сплайсированных вариантов транскриптов, но биологическая ценность некоторых вариантов не была определена.[15]
Ген EED означает эмбриональный эктодерма изоформа развития b и является членом Поликомб-групп (PcG) семья. Члены семейства PcG образуют мультимерные белковые комплексы, которые участвуют в поддержании репрессивного состояния транскрипции генов на протяжении последующих поколений клеток. Этот белок взаимодействует с энхансером zeste 2, цитоплазматическим хвостом интегрин бета7, вирус иммунодефицита типа 1 (ВИЧ -1) белок МА и белки гистондеацетилазы. Этот белок опосредует подавление активности гена посредством деацетилирования гистонов и может действовать как специфический регулятор функции интегрина. Для этого гена были идентифицированы два варианта транскрипта, кодирующие разные изоформы.[16]
Взаимодействия
Программы STRING[17] и любимый ген Сигмы-Олдрича[18] предположили возможные белковые взаимодействия с C11orf73. ARGUL1, CRHBP и EED были получены из текстового майнинга, а HNF4A - от Sigma-Aldrich.
Протеин | Описание | Метод | Гол |
---|---|---|---|
ARGUL1 | Неизвестно | Textmining | 0.712 |
CRHBP | Белок, связывающий рилизинг-гормон кортикотропина | Textmining | 0.653 |
EED | Развитие эмбриональной эктодермы | Textmining | 0.420 |
HNF4A | Регулятор транскрипции | Сигма-Олдрич | Нет данных |
ARGUL1 - неизвестный белок с неизвестной функцией. CRHBP представляет собой белок, связывающий рилизинг-гормон кортикотропина, который, возможно, может играть роль в сигнальном каскаде, который включает или активирует HIKESHI. EED, белок, соседний с C11orf73, является белком развития эмбриональной эктодермы и является членом семейства Polycomb-group (PcG). Члены семейства PcG образуют мультимерные белковые комплексы, которые участвуют в поддержании репрессивного состояния транскрипции генов на протяжении последующих поколений клеток. HNF4A является регулятором транскрипции, и неизвестно, регулирует ли HNF4A экспрессию C11orf73 или просто взаимодействует с ним.[12
Эволюционная история
История эволюции организмов может быть определена с использованием последовательностей ортологов в качестве привязки ко времени для создания филогенетического дерева. CLUSTALW[19] сравнивает несколько последовательностей, программа также может быть использована для создания такого филогенетического дерева на основе ортологов C11orf73. Дерево справа показывает сгенерированное филогенетическое дерево с временной шкалой, основанной на времени дивергенции. Дерево, сделанное из ортологов HIKESHI, идентично литературному филогенетическому дереву, даже объединяя похожие организмы, такие как рыбы, птицы и грибы.
Ортологи
Гомологические последовательности являются ортологичными, если они были разделены событием видообразования: когда вид разделяется на два отдельных вида, расходящиеся копии одного гена в результирующем виде называются ортологичными. Ортологи или ортологичные гены - это гены разных видов, которые похожи друг на друга, потому что произошли от общего предка. Ортологические последовательности предоставляют полезную информацию для таксономической классификации и филогенетических исследований организмов. Паттерн генетической дивергенции может быть использован для отслеживания родства организмов. Два очень близкородственных организма, вероятно, будут иметь очень похожие последовательности ДНК между двумя ортологами. Напротив, организм, который далее эволюционно отделен от другого организма, вероятно, будет демонстрировать большее расхождение в последовательности изучаемых ортологов.
Таблица хромосомы 11 открытая рамка считывания 73 Ортологи
Виды | Распространенное имя | Название белка | Регистрационный номер | Длина NT | NT идентичность | Длина AA | Идентичность AA | E-Value |
---|---|---|---|---|---|---|---|---|
Homo sapiens | Человек | C11orf73 | NM_016401 | 1187 п.н. | 100% | 197 аа | 100% | 0 |
Bon Taurus | Корова | LOC504867 | NP_001029398 | 996 п.н. | 73.60% | 197 аа | 98% | 5.30E-84 |
Mus musculus | Мышь | l7Rn6 | NP_080580 | 1045 п.н. | 72.90% | 197 аа | 97% | 4.80E-83 |
Gallus gallus | Курица | LOC427034 | Нет данных | 851 п.н. | 56.20% | 197 аа | 88.3% | 5.60E-76 |
Taeniopygia guttata | Зебра Финч | LOC100190155 | ACH44077 | 997 п.н. | 61.60% | 997 лет назад | 87.80% | 1.20E-75 |
Xenopus laevis | Лягушка | MGC80709 | NP_001087012 | 2037 п.н. | 36.50% | 197 аа | 86.80% | 1,70E-75 |
Oncorhynchus mykiss | Радужная форель | CK073 | NP_001158574 | 940 п.н. | 52.20% | 197 аа | 75.10% | 2,70E-66 |
Тетрадон нигровиридис | Тетрадон | безымянный белковый продукт | CAF89643 | Нет данных | Нет данных | 197 аа | 70.90% | 1,40E-61 |
Trichoplax adhaerens | Trichoplax adhaerens | TRIADDRAFT_19969 | XP_002108733 | 600 п.н. | 33.10% | 199 лет назад | 52.30% | 2.00E-47 |
Culex quinquefasciatus | Комар | консервативный гипотетический белок | XP_001843282 | 594 п.н. | 30.70% | 197 аа | 49.30% | 2,50E-41 |
Дрозофилия меланогастер | Летать | CG13926 | NP_647633 | 594 п.н. | 31.50% | 197 аа | 48.50% | 4,50E-39 |
Лаккария двухцветная | Гриб | предсказанный белок | XP_001878996 | 696 п.н. | 36.40% | 202 аа | 35.20% | 8.30E-24 |
грибковые микроорганизмы албиканс | Грибы | CaO19,13758 | XP_716157 | 666 п.н. | 36.10% | 221 аа | 24% | 5.70E-11 |
В таблице показаны 13 последовательностей (12 ортологов, 1 исходная последовательность) вместе с названием белка, номерами доступа, идентичностью нуклеотидов, идентичностью белка и E-значениями. Номера доступа - это идентификационные номера из базы данных NCBI Protein. Доступ к нуклеотидной последовательности можно получить со страницы последовательности белка из DBSOURCE, которая дает номер доступа и является ссылкой на страницу последовательности нуклеотида. Длина как нуклеотидной, так и белковой последовательности для каждого ортолога и соответствующего ему организма также указана в таблице. Рядом с длинами последовательностей указаны идентичности ортолога исходного гена HIKESHI. Идентификационные данные и E-значения были получены с использованием программы глобального сопоставления ALIGN из SDSC Biology Workbench и BLAST из NCBI.
График показывает процент идентичности ортолога в зависимости от времени расхождения организма для получения в основном линейной кривой. Два основных сочленения кривой указывают на время удвоения генов, около 450 миллионов лет и 1150 миллионов лет назад соответственно. Паралоги от дупликаций генов, вероятно, настолько отличаются от высококонсервативных ортологов HIKESHI, что не были обнаружены с помощью инструментов Blink или BLAST.
Значение m (общее количество аминокислотных изменений, произошедших в 100-аминокислотном сегменте), которое является скорректированным значением n (количество аминокислотных отличий от матричной последовательности), также используется для расчета λ (среднее значение аминокислотной кислотных изменений в год, обычно представленных в значениях λE9).
m / 100 = –ln (1-n / 100) λ = (m / 100) / (2 * T)
использованная литература
- ^ а б c ГРЧ38: Ансамбль выпуск 89: ENSG00000149196 - Ансамбль, Май 2017
- ^ а б c GRCm38: выпуск Ensembl 89: ENSMUSG00000062797 - Ансамбль, Май 2017
- ^ "Справочник человека по PubMed:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
- ^ "Ссылка на Mouse PubMed:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
- ^ а б c Фернандес-Вальдивия Р., Чжан Ю., Пай С., Мецкер М.Л., Шумахер А. (январь 2006 г.). «l7Rn6 кодирует новый белок, необходимый для функции клеток Клары при развитии легких у мышей». Генетика. 172 (1): 389–99. Дои:10.1534 / генетика.105.048736. ЧВК 1456166. PMID 16157679.
- ^ а б Чжан QH, Ye M, Wu XY, Ren SX, Zhao M, Zhao CJ, Fu G, Shen Y, Fan HY, Lu G, Zhong M, Xu XR, Han ZG, Zhang JW, Tao J, Huang QH, Zhou J , Ху GX, Gu J, Chen SJ, Chen Z (октябрь 2000 г.). «Клонирование и функциональный анализ кДНК с открытыми рамками считывания для 300 ранее неопределенных генов, экспрессируемых в CD34 + гемопоэтических стволовых / клетках-предшественниках». Genome Res. 10 (10): 1546–60. Дои:10.1101 / гр.140200. ЧВК 310934. PMID 11042152.
- ^ а б Ринчик Е.М., Карпентер Д.А. (1993). «Индуцированные N-этил-N-нитрозомочевиной пренатальные летальные мутации определяют по крайней мере две группы комплементации в локусе развития (eed) эмбриональной эктодермы в хромосоме 7 мыши». Мамм. Геном. 4 (7): 349–53. Дои:10.1007 / BF00360583. PMID 8358168. S2CID 24689449.
- ^ Информация о генах AceView NCBI AceView В архиве 7 апреля 2006 г., по адресу WebCite
- ^ Инструмент Genomatix ElDorade для анализа промоторов Страница продукта ElDorado В архиве 6 октября 2008 г. Wayback Machine
- ^ «Профиль экспрессии для C11orf73». GeneNote версии 2.4. Институт науки Вейцмана. Сентябрь 2009 г.
- ^ "Профиль EST - Hs.283322". Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
- ^ Группа компаний Saier Lab Bioinformatics http://www.tcdb.org/progs/hydro.php
- ^ База данных NCBI SNP https://www.ncbi.nlm.nih.gov/snp/ В архиве 26 января 2006 г., г. WebCite
- ^ NCBI Entrez https://www.ncbi.nlm.nih.gov/nuccore/NC_000011.9?from=86011067&to=86059171&report=graph
- ^ База данных RefSeq NCBI https://www.ncbi.nlm.nih.gov/RefSeq/ В архиве 30 марта 2006 г., г. WebCite
- ^ «RefSeq: База данных эталонных последовательностей NCBI».
- ^ STRING (инструмент поиска для поиска взаимодействующих генов / белков) http://string-db.org/ В архиве 23 июля 2010 г., в WebCite
- ^ Любимый ген Сигмы-Олдрича http://www.sigmaaldrich.com/life-science/your-favorite-gene-search.html
- ^ Программа CLUSTALW Джули Д. Томпсон, Десмонд Г. Хиггинс и Тоби Дж. Гибсон http://workbench.sdsc.edu/ В архиве 30 марта 2006 г., г. WebCite
внешние ссылки
- Человек C11orf73 расположение генома и C11orf73 страница сведений о генах в Браузер генома UCSC.