FAM214A - FAM214A
FAM214A | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Идентификаторы | |||||||||||||||||||||||||
Псевдонимы | FAM214A, KIAA1370, семейство со сходством последовательностей 214 член A | ||||||||||||||||||||||||
Внешние идентификаторы | MGI: 2387648 ГомолоГен: 35065 Генные карты: FAM214A | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ортологи | |||||||||||||||||||||||||
Разновидность | Человек | Мышь | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ансамбль | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (мРНК) | |||||||||||||||||||||||||
RefSeq (белок) | |||||||||||||||||||||||||
Расположение (UCSC) | Chr 15: 52,58 - 52,71 Мб | Chr 9: 74.95 - 75.03 Мб | |||||||||||||||||||||||
PubMed поиск | [3] | [4] | |||||||||||||||||||||||
Викиданные | |||||||||||||||||||||||||
|
Белок FAM214A, также известный как семейство белков со сходством последовательностей 214, A (FAM214A) - это белок который у человека кодируется FAM214A ген. FAM214A - это ген с неизвестной функцией, обнаруженный в локусе q21.2-q21.3 на Хромосома 15 (человек).[5] В белок Продукт этого гена имеет два консервативных домена, один с неизвестной функцией (DUF4210) и другой, называемый Chromosome_Seg.[6] Хотя функция белка FAM214A не охарактеризована, предполагается, что и DUF4210, и Chromosome_Seg играют роль в сегрегации хромосом во время мейоза.[7]
Ген
Обзор
В FAM214A ген находится на отрицательной цепи ДНК (см. Смысл (молекулярная биология) ) хромосомы 15 между положениями 52 873 514 и 53 002014; таким образом, ген 97,303 пар оснований (bp) длинный.[5][8][9] FAM214A ранее был помечен двумя другими псевдонимами, известными как KIAA1370 и FLJ10980.[5] В FAM214A Предполагается, что ген будет содержать 12 экзонов, которые составляют конечный транскрипт мРНК размером 4231 п.н. после транскрипция произошло.[10] Именно этот продукт мРНК затем переведено в конечный белок FAM214A с помощью промоутер последовательность и факторы транскрипции. Промотор для последовательности мРНК FAM214A был предсказан и проанализирован программой El Dorado на Genomatix.[11] Этот промотор имеет длину 601 пару оснований и охватывает часть 5'-UTR.[11]
Экспрессия гена
Согласно ряду источников, таких как BioGPS и Expression Atlas, FAM214A экспрессируется повсеместно (или почти так) на низких уровнях.[12][13][14] Как можно увидеть на изображении BioGPS ниже, уровень экспрессии в связанных с иммунитетом клетках и тканях значительно выше, что свидетельствует об иммунной роли; однако конкретных на месте доказательства в поддержку этого утверждения. Данные по экспрессии были собраны в результате ряда исследований, выполненных на большом диапазоне генов, поэтому некоторые данные носят противоречивый характер.
Протеин
Обзор
Функция белка FAM214A у человека до сих пор неизвестна; тем не менее, существует три функциональных ассоциации терминов, включая «биологический процесс», «клеточный компонент» и молекулярную функцию, которые описывают функцию этого белка в «Онтологии генов», которая предсказывает последствия его основной функции. in vivo.[15][16] Белковый продукт FAM214A состоит из 1076 аминокислоты (aa), было предсказано молекулярная масса из 121 700 Дальтон, и имеет изоэлектрическая точка вокруг pH 7.7.[6][17][18] Предполагается, что этот белок останется в ядре после транскрипции из-за отсутствия в нем сигнальный пептид последовательность и предсказания программы PSORTII.[19] Из-за альтернативного сплайсинга наблюдались две другие изоформы (Q32MH5-2 и Q32MH5-3). Они немного отличаются от основного продукта.[20] Изоформа 2 имеет четыре разные аминокислоты из оснований 960-960 и не имеет конца последовательности из оснований 964-1076.[20] Изоформа 3 содержит семь дополнительных аминокислот, добавленных в начало последовательности после метионина.[20]
Предполагается, что после трансляции белок FAM214A останется в ядре более чем одним типом подпрограмм на PSORT II.[19] Этот белок имеет сигнал pat4, один из двух «классических» сигналы ядерной локализации (NLS), начиная с остатка 709.[21] Несмотря на то, что в нем нет второго «классического» NLS, pat7, или «неклассического» двудольного NLS, по оценкам NCNN, он по-прежнему будет нацелен на ядро.[21][22] Эта оценка предсказывает, нацелен ли белок на ядро или цитоплазму, на основе аминокислотной последовательности.[21][22] Для белка FAM214A оценка NCNN предсказывала ядерную локализацию с достоверностью 94,1%.[21][22] Основываясь на этой информации, PSORT генерирует общий прогноз субклеточной локализации белка. Для FAM214A прогнозируемые значения составляли 69,6% для ядра по сравнению с 13,0% для митохондрий, 8,7% для цитоплазмы и 4,3% для секреторных пузырьков и эндоплазматического ретикулума.[19]
Посттрансляционные модификации
Этот белок, скорее всего, не подвергается значительному количеству посттрансляционных модификаций из-за отсутствия последовательности сигнального пептида, предсказанной NetNGlyc и NetOGlyc на веб-сервере ExPASy.[24][25] Это связано с тем, что большая часть внутриклеточного аппарата, выполняющего посттрансляционные модификации, требует, чтобы белок перемещался через органеллы, такие как эндоплазматический ретикулум и аппарат Гольджи. Без последовательности сигнального пептида белок обычно не покидает ядро, что было предсказано PSORT II, как описано выше.[19]
SAPS-анализ этого белка был выполнен в отношении базы данных swp23s.q, которая показала наличие аномально большого количества аминокислот серина и аномально малого количества аминокислот аланина в этом белке.[17] Согласно обзорной статье Fayard et al., Фосфоинозитид-зависимая киназа 2 (PDK2) представляет собой серин / треонинкиназа это важно для регулирования клеточного цикла. Поскольку белок FAM214A имеет большее количество сериновых групп, чем считается нормальным, существует вероятность того, что PDK2 оказывает важное влияние на этот белок.[26] Чтобы определить, действительно ли предполагается, что избыточное количество серинов будет фосфорилироваться, последовательность белка прогоняли через программу NetPhos с веб-сервера ExPASy.[23] Эта программа предсказала фосфорилирование 69 серинов, 14 треонинов и 9 тирозинов.[23] Согласно приведенному выше анализу SAPS, всего существует 134 серина, что указывает на то, что примерно половина из них, по прогнозам, будет фосфорилирована. in vivo. Диаграмма прогнозов фосфорилирования показана справа.
Еще один тип посттрансляционной модификации был предсказан для белка FAM214A программой NetCorona на ExPASy.[27] Программа предсказала единственный сайт расщепления между положениями 214 и 215 в последовательности белка FAM214A после трансляции.[27]
Белковые взаимодействия
Есть ряд фактор транскрипции участок связывания предсказано для промоторной последовательности FAM214A.[11] Некоторые из них с наивысшим прогнозом достоверности представлены в таблице ниже.[11]
Предполагаемые возможные факторы транскрипции для связывания с последовательностью промотора FAM214A
Прогнозируемый фактор транскрипции | Начинать | Конец | Strand | Уверенность |
Элемент распознавания фактора транскрипции II B (TFIIB) | 97 | 103 | Отрицательный | 1.0 |
Миелоидный белок цинкового пальца MZF1 | 151 | 161 | Отрицательный | 1.0 |
Миелиновый фактор транскрипции 1, нейрональный фактор 1 цинкового пальца C2HC | 388 | 400 | Отрицательный | 0.945 |
Сайт связывания рецептора андрогена, сайты IR3 | 495 | 513 | Отрицательный | 0.923 |
Подавитель опухолей Вильмса | 1 | 17 | Положительный | 0.968 |
Сайты связывания непалиндромного ядерного фактора I | 27 | 47 | Положительный | 0.988 |
Альтернативный вариант сплайсинга FOXP1, активированный в ESC | 383 | 383 | Положительный | 1.0 |
Ген 1 плеоморфной аденомы | 488 | 510 | Положительный | 1.0 |
ETS-подобный ген 1 (ELK-1) | 569 | 589 | Положительный | 0.961 |
Единственный белок, предсказанный согласно НИТЬ для взаимодействия с белком FAM214A называется MFSD6L. Этот белок принадлежит к суперсемейству основных фасилитаторов, как предполагается, как трансмембранный белок. Как и FAM214A, функция этого белка еще не охарактеризована с помощью экспериментов или исследований.[28][29] Поскольку этот белок MFSD6L является единственным взаимодействием белка FAM214A, предсказываемым с какой-либо достоверностью, его последовательность была обработана с помощью программы PSORT II. Данные подпрограммы NLS предсказывают присутствие одной последовательности pat4 и двух pat7 NLS, что указывает на возможную ядерную локализацию.[19][21] Оценка NCNN, с другой стороны, предсказывала цитоплазматическую локализацию с достоверностью 94,1%, таким образом оставляя общий балл PSORT II на уровне 39,1% плазматической мембраны, 39,1% эндоплазматического ретикулума, 4,3% вакуоля, 4,3% везикул секреторной системы, 4,3% Гольджи, 4,3% митохондриальных и 4,3% ядерных.[21][22] Это противоречиво, поскольку существует три общих сигнала ядерной локализации, но это может быть связано с тем, что значительная трансмембранная природа белка MFSD6L может вызывать проблемы с этими предсказаниями.[21]
Вторичная и третичная структура
Вторичная структура белка FAM214A состоит из ряда альфа спирали и бета-листы как предсказано Biology Workbench и пRotein ЧАСомология / аналогY рпознание Engine (PHYRE).[30][31] Программа PHYRE предсказывает, что 66 процентов вторичной структуры FAM214A неупорядочены и поэтому не могут быть проанализированы и преобразованы в предсказание третичной структуры.[30] Это было; тем не менее, он способен предсказать примерно 10 процентов структуры белка с 95-процентной значимостью.[30] Схема для этого показана слева.[30]
Сохранение
Паралог
Один паралогичный ген был обнаружен на хромосоме 9 у Homo sapiens и назван FAM214B (семейство со сходством последовательностей, B).[32] FAM214B, хотя и считается паралог, имеет последовательность белка, значительно отличающуюся от последовательности белка FAM214A. Когда эти два сравнивали друг с другом на BLAST NCBI, единственное существенное сходство наблюдали в пределах последних 200 аминокислот (где расположены домены DUF4210 и Chromosome_Seg).[33] Хотя сходство между FAM214A и B невелико, эти два белка относятся к одному семейству белков и содержат одинаковые два белка. сохраненные домены.[7][34]
Ортологи
Белок FAM214A имеет значительное количество ортологи через большое количество таксономические группы включая Млекопитающие, Авес, Рептилии, Амфибия, Актиноптеригии, Echinoidea, Насекомое, Трематода, Ракообразные, Трикоплация, Антозоа, и Евротиомицеты.[35] Это указывает на то, что белок FAM214A хорошо консервативен в пределах Эукариоты но, похоже, не сохраняется в Бактерии или же Археи. Во всех ортологах наиболее консервативная область находилась на конце белка, где находятся консервативные домены (см. Ниже). Ортологи для человек Белок FAM214A был обнаружен еще в Клубень меланоспорум, Talaromyces stipitatus и Aspergillus nidulans, которые все разошлись примерно 1215 миллионов лет назад.
Ортологи белка FAM214A
Род Разновидность | Распространенное имя | Отклонение от человеческого происхождения (MYA) [36] | Регистрационный номер белка NCBI | Длина последовательности | Процент идентичности человеческой последовательности [33] | Общее название гена |
Homo sapiens | Человек | - | NP_062546.2 | 1076 | 100 | FAM214A |
Пан троглодиты | Обыкновенный шимпанзе | 6.3 | XP_003314724 | 1083 | 99 | FAM214A |
Пан панискус | Бонобо | 6.3 | XP_003827895.1 | 1076 | 100 | FAM214A |
Раттус норвегикус | Крыса | 92.3 | NP_001100308 | 1074 | 100 | LOC300836 |
Bos taurus | Корова | 94.2 | XP_601152 | 1087 | 100 | KIAA1370 |
Canus lupus Families | Собака | 94.2 | XP_544682 | 1081 | 100 | KIAA1370 |
Орниторинхус анатинус | Утконос | 167.4 | XP_001515207 | 1169 | 95 | KIAA1370 |
Gallus gallus | Курица | 296.0 | NP_001005811 | 1093 | 99 | FAM214A |
Taeniopygia guttata | Зебра Финч | 296.0 | XP_002196177 | 1112 | 99 | FAM214A |
Анолис каролинский | Каролина Аноль | 296.0 | XP_003227400 | 1086 | 99 | KIAA1370 |
Xenopus tropicalis | Тропическая когтистая лягушка | 371.2 | NP_001015702 | 946 | 98 | FAM214A |
Данио Рерио | Данио | 400.1 | NP_001189349 | 1021 | 75 | FAM214A |
Apis mellifera | Пчела | 782.7 | XP_393903 | 1339 | 45 | LOC410423 |
Стронгилоцентротус пурпуратус | Морской еж | 742.9 | XP_799179 | 297 | 27 | FAM214A-подобный |
Drosophila melanogaster | Фруктовая муха | 782.7 | NP_610688 | 1297 | 27 | CG9005 |
Schistosoma mansoni | Шистосомный паразит | 792.4 | XP_002579285 | 766 | 26 | Гипотетический белок |
Дафния пулекс | Обыкновенная водяная блоха | 782.7 | EFX87516 | 200 | 18 | Гипотетический белок DAPPUDRAFT_207300 |
Nematostella vectensis | Актинии | 855,3 млн лет назад | XP_001633540 | 191 | 18 | Гипотетический белок |
Клубень меланоспорум | Трюфель | 1215.8 | XP_002841833 | 622 | 15 | Гипотетический белок |
Talaromyces stipitatus | - | 1215.8 | XP_002478567 | 797 | 25 | Консервированный гипотетический белок |
Aspergillus nidulans | Нитчатый гриб | 1215.8 | XP_658605 | 728 | 15 | гипотетический белок AN1001.2 |
Филогения
Некорневой филогенетическое дерево из 20 ортологи был создан программой CLUSTALW на Biology Workbench, чтобы продемонстрировать эволюционные отношения между FAM214A и его ортологами.[31]
Сохраненные домены
В белке FAM214A есть три хорошо консервативных участка. К ним относятся хорошо сохранившаяся область около n-конец белка и два сохраненные домены включая домен неизвестной функции 4210 (DUF4210) и домен Chromosome_Seg рядом с c-конец.[7] Схематическая диаграмма этих трех регионов показана ниже. Предполагается, что хорошо консервативная область около n-конца белка не будет содержать какие-либо известные домены или мотивы; однако сайт расщепления, предсказанный NetCorona выше, находится в этой области и хорошо консервативен в большинстве белков, ортологичных FAM214A.[27] Два консервативных домена, расположенные на конце этого белка, являются наиболее важной частью пептида, исходя из истории эволюции. Все организмы в таблице ортологов выше, кроме утконоса (у которого отсутствует домен Chromosome_Seg), содержат оба этих консервативных домена в своей белковой последовательности.[7]
Рекомендации
- ^ а б c ГРЧ38: Ансамбль выпуск 89: ENSG00000047346 - Ансамбль, Май 2017
- ^ а б c GRCm38: выпуск ансамбля 89: ENSMUSG00000034858 - Ансамбль, Май 2017
- ^ "Справочник человека по PubMed:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
- ^ «Ссылка на Mouse PubMed:». Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
- ^ а б c d «Генные карты: семейство FAM214A со сходством последовательностей 214, A».
- ^ а б «Протеин FAM214A». NCBI. Получено 2 февраля 2013.
- ^ а б c d «Сохраненные домены NCBI».
- ^ "Область карты Gene Loc вокруг гена FAM214a". Генные карты.
- ^ а б «Семейство FAM214A со сходством последовательностей 214, A». NCBI.
- ^ «Семейство Homo sapiens со сходством последовательностей 214, член A (FAM214A), мРНК». NCBI. 2013-04-17.
- ^ а б c d "Геноматикс: Эльдорадо". Геноматикс.
- ^ а б «Экспрессия гена FAM214A с генных карт». Генные карты.
- ^ а б «Экспрессия гена FAM214A из BioGPS». BioGPS.
- ^ "Экспрессия гена FAM214A из Атласа экспрессии". Архивировано из оригинал на 2013-06-16.
- ^ «Генная онтология».
- ^ «Генная онтология: ассоциации терминов».
- ^ а б "Инструмент биологии: SAPS".
- ^ Козловский, Л.П. (2016). «IPC - Калькулятор изоэлектрической точки». Биология Директ. 11 (1): 55. Дои:10.1186 / s13062-016-0159-9. ЧВК 5075173. PMID 27769290. Архивировано из оригинал на 2013-04-29. Получено 2016-12-16.
- ^ а б c d е «Прогноз PSORT II».
- ^ а б c «Белок FAM214A - Homo sapiens (человек)». UniProt.
- ^ а б c d е ж грамм «ПСОРТ II NLS». PSORT.
- ^ а б c d Рейнхардт А., Хаббард Т. (май 1998 г.). «Использование нейронных сетей для предсказания субклеточного расположения белков». Исследования нуклеиновых кислот. 26 (9): 2230–6. Дои:10.1093 / нар / 26.9.2230. ЧВК 147531. PMID 9547285.
- ^ а б c «НетФос». ExPASy.
- ^ "NetNGlyc". ExPASy.
- ^ "Нетоглик". ExPASy.
- ^ Файярд Э., Тинтиньяк Л.А., Бодри А., Хеммингс Б.А. (декабрь 2005 г.). «Краткий обзор протеинкиназы B / Akt». Журнал клеточной науки. 118 (Пт 24): 5675–8. Дои:10.1242 / jcs.02724. PMID 16339964.
- ^ а б c "НетКорона". ExPASy.
- ^ «Генные карты MFSD6L». Генные карты.
- ^ «УниПрот MFSD6L». UniProt.
- ^ а б c d е "Сервер распознавания складок PHYRE Protein".
- ^ а б c «Верстак биологии».
- ^ «Генные карты-паралоги». Генные карты.
- ^ а б "NCBI BLAST". NCBI.
- ^ «Консервированные домены FAM214B». NCBI.
- ^ «Генные карты-ортологи». Генные карты.
- ^ Hedges, SB; Дадли Дж; Кумар С (2006). «TimeTree: общедоступная база знаний о временах расхождения между организмами». С. 2971–2972.
р