FAM214A - FAM214A

FAM214A
Расположение гена FAM214A на хромосоме 15.png
Идентификаторы
ПсевдонимыFAM214A, KIAA1370, семейство со сходством последовательностей 214 член A
Внешние идентификаторыMGI: 2387648 ГомолоГен: 35065 Генные карты: FAM214A
Расположение гена (человек)
Хромосома 15 (человек)
Chr.Хромосома 15 (человек)[1]
Хромосома 15 (человек)
Геномное расположение FAM214A
Геномное расположение FAM214A
Группа15q21.2-q21.3Начинать52,581,317 бп[1]
Конец52,709,817 бп[1]
Ортологи
РазновидностьЧеловекМышь
Entrez
Ансамбль
UniProt
RefSeq (мРНК)

NM_001286495
NM_019600

NM_001113283
NM_153584
NM_001359816

RefSeq (белок)

NP_001273424
NP_062546

NP_001106754
NP_705812
NP_001346745

Расположение (UCSC)Chr 15: 52,58 - 52,71 МбChr 9: 74.95 - 75.03 Мб
PubMed поиск[3][4]
Викиданные
Просмотр / редактирование человекаПросмотр / редактирование мыши

Белок FAM214A, также известный как семейство белков со сходством последовательностей 214, A (FAM214A) - это белок который у человека кодируется FAM214A ген. FAM214A - это ген с неизвестной функцией, обнаруженный в локусе q21.2-q21.3 на Хромосома 15 (человек).[5] В белок Продукт этого гена имеет два консервативных домена, один с неизвестной функцией (DUF4210) и другой, называемый Chromosome_Seg.[6] Хотя функция белка FAM214A не охарактеризована, предполагается, что и DUF4210, и Chromosome_Seg играют роль в сегрегации хромосом во время мейоза.[7]

Ген

Обзор

В FAM214A ген находится на отрицательной цепи ДНК (см. Смысл (молекулярная биология) ) хромосомы 15 между положениями 52 873 514 и 53 002014; таким образом, ген 97,303 пар оснований (bp) длинный.[5][8][9] FAM214A ранее был помечен двумя другими псевдонимами, известными как KIAA1370 и FLJ10980.[5] В FAM214A Предполагается, что ген будет содержать 12 экзонов, которые составляют конечный транскрипт мРНК размером 4231 п.н. после транскрипция произошло.[10] Именно этот продукт мРНК затем переведено в конечный белок FAM214A с помощью промоутер последовательность и факторы транскрипции. Промотор для последовательности мРНК FAM214A был предсказан и проанализирован программой El Dorado на Genomatix.[11] Этот промотор имеет длину 601 пару оснований и охватывает часть 5'-UTR.[11]

FAM214A расположение на хромосоме 15[5]
Схема FAM214A ген, включая интроны и экзоны на хромосоме 15[9]

Экспрессия гена

Данные экспрессии FAM214A, полученные с генных карт[12]

Согласно ряду источников, таких как BioGPS и Expression Atlas, FAM214A экспрессируется повсеместно (или почти так) на низких уровнях.[12][13][14] Как можно увидеть на изображении BioGPS ниже, уровень экспрессии в связанных с иммунитетом клетках и тканях значительно выше, что свидетельствует об иммунной роли; однако конкретных на месте доказательства в поддержку этого утверждения. Данные по экспрессии были собраны в результате ряда исследований, выполненных на большом диапазоне генов, поэтому некоторые данные носят противоречивый характер.

Данные по экспрессии FAM214A, полученные из BioGPS[13]

Протеин

Обзор

Функция белка FAM214A у человека до сих пор неизвестна; тем не менее, существует три функциональных ассоциации терминов, включая «биологический процесс», «клеточный компонент» и молекулярную функцию, которые описывают функцию этого белка в «Онтологии генов», которая предсказывает последствия его основной функции. in vivo.[15][16] Белковый продукт FAM214A состоит из 1076 аминокислоты (aa), было предсказано молекулярная масса из 121 700 Дальтон, и имеет изоэлектрическая точка вокруг pH 7.7.[6][17][18] Предполагается, что этот белок останется в ядре после транскрипции из-за отсутствия в нем сигнальный пептид последовательность и предсказания программы PSORTII.[19] Из-за альтернативного сплайсинга наблюдались две другие изоформы (Q32MH5-2 и Q32MH5-3). Они немного отличаются от основного продукта.[20] Изоформа 2 имеет четыре разные аминокислоты из оснований 960-960 и не имеет конца последовательности из оснований 964-1076.[20] Изоформа 3 содержит семь дополнительных аминокислот, добавленных в начало последовательности после метионина.[20]

Предполагается, что после трансляции белок FAM214A останется в ядре более чем одним типом подпрограмм на PSORT II.[19] Этот белок имеет сигнал pat4, один из двух «классических» сигналы ядерной локализации (NLS), начиная с остатка 709.[21] Несмотря на то, что в нем нет второго «классического» NLS, pat7, или «неклассического» двудольного NLS, по оценкам NCNN, он по-прежнему будет нацелен на ядро.[21][22] Эта оценка предсказывает, нацелен ли белок на ядро ​​или цитоплазму, на основе аминокислотной последовательности.[21][22] Для белка FAM214A оценка NCNN предсказывала ядерную локализацию с достоверностью 94,1%.[21][22] Основываясь на этой информации, PSORT генерирует общий прогноз субклеточной локализации белка. Для FAM214A прогнозируемые значения составляли 69,6% для ядра по сравнению с 13,0% для митохондрий, 8,7% для цитоплазмы и 4,3% для секреторных пузырьков и эндоплазматического ретикулума.[19]

Посттрансляционные модификации

Предсказанные фосфорилированные сайты, обнаруженные в белке FAM214A[23]

Этот белок, скорее всего, не подвергается значительному количеству посттрансляционных модификаций из-за отсутствия последовательности сигнального пептида, предсказанной NetNGlyc и NetOGlyc на веб-сервере ExPASy.[24][25] Это связано с тем, что большая часть внутриклеточного аппарата, выполняющего посттрансляционные модификации, требует, чтобы белок перемещался через органеллы, такие как эндоплазматический ретикулум и аппарат Гольджи. Без последовательности сигнального пептида белок обычно не покидает ядро, что было предсказано PSORT II, ​​как описано выше.[19]

SAPS-анализ этого белка был выполнен в отношении базы данных swp23s.q, которая показала наличие аномально большого количества аминокислот серина и аномально малого количества аминокислот аланина в этом белке.[17] Согласно обзорной статье Fayard et al., Фосфоинозитид-зависимая киназа 2 (PDK2) представляет собой серин / треонинкиназа это важно для регулирования клеточного цикла. Поскольку белок FAM214A имеет большее количество сериновых групп, чем считается нормальным, существует вероятность того, что PDK2 оказывает важное влияние на этот белок.[26] Чтобы определить, действительно ли предполагается, что избыточное количество серинов будет фосфорилироваться, последовательность белка прогоняли через программу NetPhos с веб-сервера ExPASy.[23] Эта программа предсказала фосфорилирование 69 серинов, 14 треонинов и 9 тирозинов.[23] Согласно приведенному выше анализу SAPS, всего существует 134 серина, что указывает на то, что примерно половина из них, по прогнозам, будет фосфорилирована. in vivo. Диаграмма прогнозов фосфорилирования показана справа.

Еще один тип посттрансляционной модификации был предсказан для белка FAM214A программой NetCorona на ExPASy.[27] Программа предсказала единственный сайт расщепления между положениями 214 и 215 в последовательности белка FAM214A после трансляции.[27]

Белковые взаимодействия

Есть ряд фактор транскрипции участок связывания предсказано для промоторной последовательности FAM214A.[11] Некоторые из них с наивысшим прогнозом достоверности представлены в таблице ниже.[11]

Предполагаемые возможные факторы транскрипции для связывания с последовательностью промотора FAM214A

Прогнозируемый фактор транскрипцииНачинатьКонецStrandУверенность
Элемент распознавания фактора транскрипции II B (TFIIB)97103Отрицательный1.0
Миелоидный белок цинкового пальца MZF1151161Отрицательный1.0
Миелиновый фактор транскрипции 1, нейрональный фактор 1 цинкового пальца C2HC388400Отрицательный0.945
Сайт связывания рецептора андрогена, сайты IR3495513Отрицательный0.923
Подавитель опухолей Вильмса117Положительный0.968
Сайты связывания непалиндромного ядерного фактора I2747Положительный0.988
Альтернативный вариант сплайсинга FOXP1, активированный в ESC383383Положительный1.0
Ген 1 плеоморфной аденомы488510Положительный1.0
ETS-подобный ген 1 (ELK-1)569589Положительный0.961
Нетранскрипционный фактор предсказал взаимодействие белков FAM214A

Единственный белок, предсказанный согласно НИТЬ для взаимодействия с белком FAM214A называется MFSD6L. Этот белок принадлежит к суперсемейству основных фасилитаторов, как предполагается, как трансмембранный белок. Как и FAM214A, функция этого белка еще не охарактеризована с помощью экспериментов или исследований.[28][29] Поскольку этот белок MFSD6L является единственным взаимодействием белка FAM214A, предсказываемым с какой-либо достоверностью, его последовательность была обработана с помощью программы PSORT II. Данные подпрограммы NLS предсказывают присутствие одной последовательности pat4 и двух pat7 NLS, что указывает на возможную ядерную локализацию.[19][21] Оценка NCNN, с другой стороны, предсказывала цитоплазматическую локализацию с достоверностью 94,1%, таким образом оставляя общий балл PSORT II на уровне 39,1% плазматической мембраны, 39,1% эндоплазматического ретикулума, 4,3% вакуоля, 4,3% везикул секреторной системы, 4,3% Гольджи, 4,3% митохондриальных и 4,3% ядерных.[21][22] Это противоречиво, поскольку существует три общих сигнала ядерной локализации, но это может быть связано с тем, что значительная трансмембранная природа белка MFSD6L может вызывать проблемы с этими предсказаниями.[21]

Небольшой процент третичной структуры FAM214A[30]

Вторичная и третичная структура

Вторичная структура белка FAM214A состоит из ряда альфа спирали и бета-листы как предсказано Biology Workbench и пRotein ЧАСомология / аналогY рпознание Engine (PHYRE).[30][31] Программа PHYRE предсказывает, что 66 процентов вторичной структуры FAM214A неупорядочены и поэтому не могут быть проанализированы и преобразованы в предсказание третичной структуры.[30] Это было; тем не менее, он способен предсказать примерно 10 процентов структуры белка с 95-процентной значимостью.[30] Схема для этого показана слева.[30]

Сохранение

Паралог

Один паралогичный ген был обнаружен на хромосоме 9 у Homo sapiens и назван FAM214B (семейство со сходством последовательностей, B).[32] FAM214B, хотя и считается паралог, имеет последовательность белка, значительно отличающуюся от последовательности белка FAM214A. Когда эти два сравнивали друг с другом на BLAST NCBI, единственное существенное сходство наблюдали в пределах последних 200 аминокислот (где расположены домены DUF4210 и Chromosome_Seg).[33] Хотя сходство между FAM214A и B невелико, эти два белка относятся к одному семейству белков и содержат одинаковые два белка. сохраненные домены.[7][34]

Ортологи

Белок FAM214A имеет значительное количество ортологи через большое количество таксономические группы включая Млекопитающие, Авес, Рептилии, Амфибия, Актиноптеригии, Echinoidea, Насекомое, Трематода, Ракообразные, Трикоплация, Антозоа, и Евротиомицеты.[35] Это указывает на то, что белок FAM214A хорошо консервативен в пределах Эукариоты но, похоже, не сохраняется в Бактерии или же Археи. Во всех ортологах наиболее консервативная область находилась на конце белка, где находятся консервативные домены (см. Ниже). Ортологи для человек Белок FAM214A был обнаружен еще в Клубень меланоспорум, Talaromyces stipitatus и Aspergillus nidulans, которые все разошлись примерно 1215 миллионов лет назад.

Ортологи белка FAM214A

Род РазновидностьРаспространенное имяОтклонение от человеческого происхождения (MYA) [36]Регистрационный номер белка NCBIДлина последовательностиПроцент идентичности человеческой последовательности [33]Общее название гена
Homo sapiensЧеловек-NP_062546.21076100FAM214A
Пан троглодитыОбыкновенный шимпанзе6.3XP_003314724108399FAM214A
Пан панискусБонобо6.3XP_003827895.11076100FAM214A
Раттус норвегикусКрыса92.3NP_0011003081074100LOC300836
Bos taurusКорова94.2XP_6011521087100KIAA1370
Canus lupus FamiliesСобака94.2XP_5446821081100KIAA1370
Орниторинхус анатинусУтконос167.4XP_001515207116995KIAA1370
Gallus gallusКурица296.0NP_001005811109399FAM214A
Taeniopygia guttataЗебра Финч296.0XP_002196177111299FAM214A
Анолис каролинскийКаролина Аноль296.0XP_003227400108699KIAA1370
Xenopus tropicalisТропическая когтистая лягушка371.2NP_00101570294698FAM214A
Данио РериоДанио400.1NP_001189349102175FAM214A
Apis melliferaПчела782.7XP_393903133945LOC410423
Стронгилоцентротус пурпуратусМорской еж742.9XP_79917929727FAM214A-подобный
Drosophila melanogasterФруктовая муха782.7NP_610688129727CG9005
Schistosoma mansoniШистосомный паразит792.4XP_00257928576626Гипотетический белок
Дафния пулексОбыкновенная водяная блоха782.7EFX8751620018Гипотетический белок DAPPUDRAFT_207300
Nematostella vectensisАктинии855,3 млн лет назадXP_00163354019118Гипотетический белок
Клубень меланоспорумТрюфель1215.8XP_00284183362215Гипотетический белок
Talaromyces stipitatus-1215.8XP_00247856779725Консервированный гипотетический белок
Aspergillus nidulansНитчатый гриб1215.8XP_65860572815гипотетический белок AN1001.2

Филогения

Эволюционная связь между FAM214A и его ортологическими белками[31]

Некорневой филогенетическое дерево из 20 ортологи был создан программой CLUSTALW на Biology Workbench, чтобы продемонстрировать эволюционные отношения между FAM214A и его ортологами.[31]

Сохраненные домены

В белке FAM214A есть три хорошо консервативных участка. К ним относятся хорошо сохранившаяся область около n-конец белка и два сохраненные домены включая домен неизвестной функции 4210 (DUF4210) и домен Chromosome_Seg рядом с c-конец.[7] Схематическая диаграмма этих трех регионов показана ниже. Предполагается, что хорошо консервативная область около n-конца белка не будет содержать какие-либо известные домены или мотивы; однако сайт расщепления, предсказанный NetCorona выше, находится в этой области и хорошо консервативен в большинстве белков, ортологичных FAM214A.[27] Два консервативных домена, расположенные на конце этого белка, являются наиболее важной частью пептида, исходя из истории эволюции. Все организмы в таблице ортологов выше, кроме утконоса (у которого отсутствует домен Chromosome_Seg), содержат оба этих консервативных домена в своей белковой последовательности.[7]

Схема белка FAM214A человека (Homo sapiens), на которой показаны хорошо консервативные области и их расположение

Рекомендации

  1. ^ а б c ГРЧ38: Ансамбль выпуск 89: ENSG00000047346 - Ансамбль, Май 2017
  2. ^ а б c GRCm38: выпуск ансамбля 89: ENSMUSG00000034858 - Ансамбль, Май 2017
  3. ^ "Справочник человека по PubMed:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
  4. ^ «Ссылка на Mouse PubMed:». Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
  5. ^ а б c d «Генные карты: семейство FAM214A со сходством последовательностей 214, A».
  6. ^ а б «Протеин FAM214A». NCBI. Получено 2 февраля 2013.
  7. ^ а б c d «Сохраненные домены NCBI».
  8. ^ "Область карты Gene Loc вокруг гена FAM214a". Генные карты.
  9. ^ а б «Семейство FAM214A со сходством последовательностей 214, A». NCBI.
  10. ^ «Семейство Homo sapiens со сходством последовательностей 214, член A (FAM214A), мРНК». NCBI. 2013-04-17.
  11. ^ а б c d "Геноматикс: Эльдорадо". Геноматикс.
  12. ^ а б «Экспрессия гена FAM214A с генных карт». Генные карты.
  13. ^ а б «Экспрессия гена FAM214A из BioGPS». BioGPS.
  14. ^ "Экспрессия гена FAM214A из Атласа экспрессии". Архивировано из оригинал на 2013-06-16.
  15. ^ «Генная онтология».
  16. ^ «Генная онтология: ассоциации терминов».
  17. ^ а б "Инструмент биологии: SAPS".
  18. ^ Козловский, Л.П. (2016). «IPC - Калькулятор изоэлектрической точки». Биология Директ. 11 (1): 55. Дои:10.1186 / s13062-016-0159-9. ЧВК  5075173. PMID  27769290. Архивировано из оригинал на 2013-04-29. Получено 2016-12-16.
  19. ^ а б c d е «Прогноз PSORT II».
  20. ^ а б c «Белок FAM214A - Homo sapiens (человек)». UniProt.
  21. ^ а б c d е ж грамм «ПСОРТ II NLS». PSORT.
  22. ^ а б c d Рейнхардт А., Хаббард Т. (май 1998 г.). «Использование нейронных сетей для предсказания субклеточного расположения белков». Исследования нуклеиновых кислот. 26 (9): 2230–6. Дои:10.1093 / нар / 26.9.2230. ЧВК  147531. PMID  9547285.
  23. ^ а б c «НетФос». ExPASy.
  24. ^ "NetNGlyc". ExPASy.
  25. ^ "Нетоглик". ExPASy.
  26. ^ Файярд Э., Тинтиньяк Л.А., Бодри А., Хеммингс Б.А. (декабрь 2005 г.). «Краткий обзор протеинкиназы B / Akt». Журнал клеточной науки. 118 (Пт 24): 5675–8. Дои:10.1242 / jcs.02724. PMID  16339964.
  27. ^ а б c "НетКорона". ExPASy.
  28. ^ «Генные карты MFSD6L». Генные карты.
  29. ^ «УниПрот MFSD6L». UniProt.
  30. ^ а б c d е "Сервер распознавания складок PHYRE Protein".
  31. ^ а б c «Верстак биологии».
  32. ^ «Генные карты-паралоги». Генные карты.
  33. ^ а б "NCBI BLAST". NCBI.
  34. ^ «Консервированные домены FAM214B». NCBI.
  35. ^ «Генные карты-ортологи». Генные карты.
  36. ^ Hedges, SB; Дадли Дж; Кумар С (2006). «TimeTree: общедоступная база знаний о временах расхождения между организмами». С. 2971–2972.

р