Спиральный домен, содержащий 142 - Coiled-Coil Domain Containing 142

В спиральный домен, содержащий 142 (CCDC142) представляет собой ген, который у человека кодирует белок CCDC142. Ген CCDC142 расположен на хромосоме 2 (2p13), охватывает 4339 пар оснований и содержит 9 экзонов. Ген кодирует домен спиральной спирали, содержащий белок 142 (CCDC142), функция которого еще недостаточно изучена.[1][2] Известны две изоформы CCDC142.[1] Белки CCDC142, продуцируемые из этих транскриптов, имеют размер от 743 до 665 аминокислот и содержат сигналы, указывающие на перемещение белка между цитозоль и ядро.[3] Гомологичный Гены CCDC142 обнаружены у многих животных, включая позвоночные и беспозвоночные но нет грибок, растения, протисты, архея, или же бактерии.[1] Хотя функция этого белка не совсем понятна, он содержит домен спиральной спирали и RINT1 Мотив _TIP1, расположенный внутри спиральный домен.[3][4]

Locus

Генный локус CCDC142[1]

CCDC142 обнаружен на - цепи хромосомы 2 (2p13.1) с геномной последовательностью, охватывающей основания от 74 472 832 до 74 483 230.[1] Кодирующая область имеет длину 8292 пары оснований, кодируя две изоформы белка длиной от 743 до 665 аминокислот.[1] На теломерной стороне за CCDC142 следует МОГИ и гены MRPL53. На центромерной стороне за ним следуют C31, LBX2, LBX2-AS1 и PCGF1 гены.[1]

мРНК

В Homo sapiens, ген CCDC142 кодирует две альтернативно сплайсированные изоформы мРНК, называемые изоформой 1 и изоформой 2.[3] Обе эти изоформы имеют 9 экзонов. Изоформа 1 является более длинной из двух и имеет длину 4339 п.н., а изоформа 2 - 2253 п.н.[3] Основное различие между изоформами состоит в том, что изоформа 2 имеет более короткие экзоны 9 и 3 ' UTR.[3] Изоформа 1 - самый длинный вариант гена и белка, которому и посвящена данная статья.[1]

Сохранение

Паралоги

CCDC142 не имеет паралогов в Homo sapiens.

Ортологи

Ниже приведена таблица различных ортологи CCDC142, идентичность белковой последовательности которого сравнивали с Homo sapiens аминокислотная последовательность белка. CCDC142 имеет более 73% аминокислотного сходства в млекопитающие, но менее консервативен в других позвоночные И в беспозвоночные.[5]

Род и видРаспространенное имяДата отклонения от человеческого происхождения (MYA)% личность
Homo sapiensЧеловек0100
Пан троглодитыШимпанзе6.696
Горилла горилла гориллаГорилла8.998
Jaculus jaculusМалый египетский тушканчик90.973
Bos mutusЯк97.574
Eptesicus fuscusБольшая коричневая летучая мышь97.574
Питон бивиттатусБирманский питон320.536
Gallus gallusКурица320.535
Haliaeetus leucocephalusБелоголовый орлан320.533
Анолис каролинскийКаролина аноле (ящерица)320.533
Calidris pugnaxЕрш (птица)320.532
Xenopus tropicalisЗападная когтистая лягушка355.733
Callorhinchus miliiАвстралийская акула-призрак429.636
Lepisosteus oculatusПятнистый гар429.634
Эсокс ЛюциусСеверная щука429.633
Данио РериоДанио429.633
Lingula anatinaХвостатая мидия84729
Crassostrea gigasТихоокеанская устрица84729
Осьминог бимакулоидныйКалифорнийский двухточечный осьминог84727
Drosophila melanogasterПлодовая муха84723

Филогения

CCDC142 имеет близкое родство у млекопитающих, моллюски и амфибии, рептилии и птицы, И в рыбы.[5] Ген CCDC142 появился еще в Drosophila melanogaster, которые отделились от человеческого рода 847 миллионов лет назад. CCDC142 мутировал чаще, чем оба Цитохром с (высококонсервативный белок) и Фибриноген А (быстро мутирующий белок). Это указывает на то, что CCDC142 представляет собой быстро мутирующий ген с увеличивающейся скоростью мутации (то есть эволюции) с течением времени.

Скорость мутации CCDC142 по сравнению с эталонными белками, цитохромом C и фибриногеном A, которые мутируют медленно и быстро соответственно. Скорость мутации, м, который представляет собой скорректированный процент аминокислотных изменений между белком Homo sapiens и его ортологами, нанесен на график против логарифм числа миллионов лет с даты расхождения линии передачи Homo sapiens и линии передачи вида, в которой встречается ортолог. Точки на графике рассчитываются согласно м/ 100 = –ln (1–п/ 100), где м - общее количество аминокислотных изменений, произошедших в 100-аминокислотном сегменте белка, и п - наблюдаемое количество аминокислотных изменений на 100 остатков по сравнению с белковой последовательностью Homo sapiens.

Протеин

Доменная структура белка CCDC142. Высококонсервативные области вне мотива RINT1_TIP1 отмечены черным цветом. Предполагаемый сигнал ядерной локализации - красный.

Первичная структура, варианты и изоформы

Основная изоформа белка CCDC142 имеет длину 743 аминокислоты, а вторая изоформа - 665 аминокислот. Разница в длине полностью обусловлена ​​отсутствием аминокислот на С-конце изоформы 2.[1]

Домены и мотивы

Концептуальный перевод CCDC142
Легенда концептуального перевода CCDC142

Предсказанный спиральный домен CCDC142 состоит из аминокислот 308-719.[2] А RINT1 Мотив _TIP1 также присутствует из аминокислот 490–621. RINT1_TIP1 - это семейство, которое включает RINT-1 (белок, участвующий в радиационно-индуцированном контроле контрольных точек) и TIP-1 (дрожжевой белок, который участвует в Гольджи транспорт ).[4] Дополнительные ~ 250 аминокислот, обнаруженные в удаленных белках ортолога CCDC142, не обнаруживаются в Homo sapiens геном ближнего гена CCDC142.

Посттрансляционные модификации

CCDC142, по прогнозам, будет иметь 6 фосфорилирование сайтов, 4 метилирование сайтов, 1 пальмитоилирование сайт, 1 сумоилирование сайт и 1 слабый Сигнал ядерной локализации.[6][7][8][9][10] Эти модификации указывают на то, что CCDC142 локализован в ядро и цитозоль. Аннотации этих сайтов в белке см. В Концептуальном переводе.

Прогнозирование структуры

Вторичная структура CCDC142 содержит только α-спирали как предсказывают программы Quick2D и Phyre2.[11][12] Предполагается, что CCDC142 содержит восемь консервативных α-спирали, шесть из которых расположены в области спиральной спирали белка.[11][12] Предсказанный третичная структура of CCDC142 содержит большой домен coiled-coil из аминокислот 308-719.[2][13]

I-TASSER предсказал третичную структуру CCDC142.[13] Эта структура имеет C-балл -,75 (измерено по шкале от -5 до 2, более высокие значения соответствуют более высокой достоверности) и плотность кластера 0,375 (по шкале от 0 до 1, с более высокими значениями, указывающими на больший охват предсказания белка). C-оценка учитывает как значимость структуры модели, так и качество предсказания других белков.[13]

Выражение

Промоутеры и регулирующие факторы

Промоторная область для CCDC142 была идентифицирована с использованием программы El Dorado в Геноматикс, он охватывает основания 74482896–74483908 в хромосоме 2.[14] Эта область размером 1013 пар оснований охватывает 1071–58 пар оснований перед стартовым кодоном CCDC142.[14] В промоторе есть область, которая связывает большое количество Krueppel-подобные факторы транскрипции и Белки с цинковыми пальцами BED.[14] В этом регионе нет однонуклеотидные полиморфизмы (SNP) расположенные в нем.[15] Многие из факторов транскрипции, которые связываются с промоторной областью CCDC142, имеют функции, связанные с подавлением опухоли, нейрогенез, Повреждение ДНК и фоторецепция.[14] Этот промоторный регион также содержит LTR TATA бокс C-типа млекопитающих который перекрывается с сайтом начала транскрипции гена.[14]

РНК-связывающие белки

Ряд возможных связывающих РНК белков связывается как с 3 ’, так и с 5’ непереведенные регионы (UTRs) мРНК CCDC142. В PABPC1 и RBMX сайты связывания белка встречаются с высокой частотой в 3 ’UTR, с 49 и 21 сайтом соответственно.[16]

Выражение

Выше Атлас человеческого мозга Аллена данные по экспрессии на CCDC142, красный цвет указывает на более низкую экспрессию, а зеленый - на более высокую.[17] в Homo sapiens головного мозга было обнаружено, что CCDC142 слабо экспрессируется в кора мозжечка, таламус и гипоталамус. CCDC142 также высоко экспрессируется в черная субстанция, мосты, клаустр, и средний мозг.[17] Существует также относительно более высокая экспрессия CCDC142 в рот и вилочковая железа.[18]

Приведенные выше экспериментальные данные экспрессии показывают много возможных открытий для CCDC142.[19] Сверхэкспрессия SNAI1, а белок цинковых пальцев, коррелирует со снижением экспрессии CCDC142 в Homo sapiens.[20] А Mus musculus выбивной из МЕКК 2/3, который помогает регулировать вспомогательная Т-клетка дифференцировка, также показала пониженную экспрессию CCDC142.[21] Другой Mus musculus эксперимент с упором на кардиомиопатия у мышей показали более низкие уровни CCDC142 у мышей с поврежденным клетки миокарда.[20]

Функция и биохимия

Сочинение

CCDC142 имеет относительно типичное распределение аминокислот по сравнению с другими Homo sapiens белки.[5] Однако в ортологах отмечаются некоторые различия.[5] Лейцин присутствует в больших количествах по сравнению с другими белками (более 15% белка) и аспарагин присутствует в небольших количествах по сравнению с другими белками (менее 0,7% белка).[5]

Домен спиральной спирали и мотив RINT1_TP1 CCDC142 содержат большее количество лейцина по сравнению с остальным белком (более 16,6% области), более высокие количества лейцина. глутамин (более 8,4% от региона) и столь же низкие количества аспарагина (менее 0,7% от региона).[5]

Взаимодействующие белки

Для CCDC142 не обнаружено белковых взаимодействий.

Клиническое значение

Патология и болезни

Увеличение числа копий в локусах CCDC142, включая 25 других генов, показало фенотип задержки развития и значительные онтогенетические или морфологические фенотипы.[22] Один результат с потерей числа копий в локусах CCDC142, включая 29 других генов, показал фенотипы низкого роста, аномальной формы лица, задержки речи и языкового развития, перекрытия пальцев стопы, задержка внутриутробного развития, открытый артериальный проток и задержка развития крупной моторики.[22] Однако влияние CCDC142 могло быть искажено для этих фенотипов, поскольку были также аномалии во многих других геномных секциях.

Мутации

В гене CCDC142 находится ряд SNP. Некоторые из них в промоутер область и 5 ’UTR находятся в якорных последовательностях для факторы транскрипции, и влияют на связывание факторов транскрипции, если они изменены.

В кодирующей последовательности белка есть много SNP, которые изменяют аминокислотный состав CCDC142. Один SNP с высокой степенью распространенности в популяции (1,8%) примечателен своим химическим изменением, с тирозин к сдвигу аспарагина в аминокислоте 548.[15]

Также существует множество SNP, расположенных в большом 3 ’UTR гена, причем многие из них связываются с областями, содержащими структуры петли стебля в мРНК. SNP с распространенностью 7,7% (гуанин к аденозин at bp4285) находится в 3 ’UTR, но не находится в консервативной области петли стебля.[15]

Эти SNP аннотированы в концептуальном переводе, расположенном в разделе «Белки» выше.

Выравнивание нескольких последовательностей

В приведенном выше выравнивании множественной последовательности (созданном с помощью CLUSTALW и программы TEXSHADE в SDSC Biology Workbench) организмы маркируются по первой букве своего рода и первым двум буквам своего вида. Весь белок CCDC142 является высококонсервативным у млекопитающих.[5] Регионы, содержащие Homo sapiens Домен спиральной спирали и область мотива RINT1_TIP1 высоко консервативны в отдаленных гомологах.[5] 12 из 15 аминокислот, которые совпадают у всех организмов в этой области, неполярны.[5] Консервативный регион 1 содержит в основном неполярные аминокислоты.[5] Консервативный регион 2 содержит в основном неполярные и основные аминокислоты. Консервативный регион 3 содержит как полярные, так и неполярные аминокислоты.[5] Консервативный регион 5 содержит в основном неполярные и основные аминокислоты.[5]

Дополнительная информация о факторах транскрипции

Аннотация сайта связывания фактора транскрипции
Легенда сайта связывания фактора транскрипции

Рекомендации

  1. ^ а б c d е ж грамм час я "CCDC142 домен спиральной спирали, содержащий 142 [Homo sapiens (человек)] - Ген - NCBI". www.ncbi.nlm.nih.gov. Получено 2016-05-01.
  2. ^ а б c "белок 142, содержащий домен спиральной спирали [Homo sapiens] - белок - NCBI". www.ncbi.nlm.nih.gov. Получено 2016-05-01.
  3. ^ а б c d е «CCDC142 - белок, содержащий домен спиральной спирали 142 - Homo sapiens (человек) - ген и белок CCDC142». www.uniprot.org. Получено 2016-05-01.
  4. ^ а б "Результат поиска SSDB Motif: hsa: 84865". www.kegg.jp. Получено 2016-05-01.
  5. ^ а б c d е ж грамм час я j k л "SDSC Biology Workbench".
  6. ^ "Сервер NetPhos 2.0". www.cbs.dtu.dk. Получено 2016-05-01.
  7. ^ "Памятка: Прогноз метилирования белков". www.bioinfo.tsinghua.edu.cn. Архивировано из оригинал на 2016-03-14. Получено 2016-05-01.
  8. ^ "::: NBA-Palm - Прогнозирование сайта пальмитоилирования, реализованное с помощью наивного байесовского алгоритма :::". www.bioinfo.tsinghua.edu.cn. Архивировано из оригинал на 2016-06-09. Получено 2016-05-01.
  9. ^ "Программа анализа SUMOplot ™ | Abgent". www.abgent.com. Получено 2016-05-01.
  10. ^ "NLS_Mapper". nls-mapper.iab.keio.ac.jp. Получено 2016-05-01.
  11. ^ а б Келли, Лоуренс. "Сервер распознавания складок PHYRE2". www.sbg.bio.ic.ac.uk. Получено 2016-05-01.
  12. ^ а б Реммерт, Майкл. «Quick2D». toolkit.tuebingen.mpg.de. Получено 2016-05-01.
  13. ^ а б c «Сервер I-TASSER для предсказания структуры и функции белков». zhanglab.ccmb.med.umich.edu. Получено 2016-05-01.
  14. ^ а б c d е «Genomatix - Анализ данных NGS и персонализированная медицина». www.genomatix.de. Получено 2016-05-01.
  15. ^ а б c snpdev. «SNP, связанный с геном (geneID: 84865) через аннотацию Contig». www.ncbi.nlm.nih.gov. Получено 2016-05-01.
  16. ^ «RBPDB: База данных специфичностей связывания РНК». rbpdb.ccbr.utoronto.ca. Получено 2016-05-01.
  17. ^ а б "Данные микромассивов :: Атлас мозга Аллена: мозг человека". human.brain-map.org. Получено 2016-05-01.
  18. ^ "Профиль EST - Hs.430199". www.ncbi.nlm.nih.gov. Получено 2016-05-01.
  19. ^ гео. «Главная - ГЕО - NCBI». www.ncbi.nlm.nih.gov. Получено 2016-05-01.
  20. ^ а б "GDS3596 / 1451178_at". www.ncbi.nlm.nih.gov. Получено 2016-05-01.
  21. ^ "GDS4795 / ILMN_3023885". www.ncbi.nlm.nih.gov. Получено 2016-05-01.
  22. ^ а б ClinVar. "Ничего не найдено - ClinVar - NCBI". www.ncbi.nlm.nih.gov. Получено 2016-05-05.

дальнейшее чтение

  • Орехова, А. С .; Свердлова, П. С .; Спирин, П. В .; Леонова, О.Г .; Попенко, В. И .; Прасолов, В. С .; Рубцов, П. М. (01.06.2011). «Новый двунаправленный промотор из генома человека». Молекулярная Биология. 45 (3): 486–495. ISSN  0026-8984. PMID  21790010.