Тест глобального расстояния - Global distance test
В глобальный тест на расстояние (GDT), также записывается как GDT_TS для представления «общего балла» - это мера сходства между двумя белковые структуры с известными аминокислотными соответствиями (например, идентичные аминокислотные последовательности ) но разные третичные структуры. Чаще всего используется для сравнения результатов предсказание структуры белка к экспериментально определенной структуре, как измерено Рентгеновская кристаллография или же белок ЯМР. Метрика GDT, описанная ее автором Адамом Земла[1] предназначен для более точного измерения, чем более распространенный RMSD метрика, чувствительная к выброс регионов, созданных, например, из-за плохого моделирования отдельных петля области в структуре, которая в остальном достаточно точна. Измерения GDT_TS используются в качестве основных критериев оценки при получении результатов от Критическая оценка предсказания конструкции (CASP), крупномасштабный эксперимент в сообществе предсказателей структуры, посвященный оценке текущих методов моделирования и выявлению их основных недостатков.[1][2][3] В общем, чем выше GDT_TS, тем лучше данная модель по сравнению с эталонной структурой.
Оценка GDT рассчитывается как наибольший набор аминокислота остатки альфа-углерод атомы в модельной структуре попадают в пределы определенного расстояния, отсекающего их положение в экспериментальной структуре, после наложения двух структур. По оригинальному дизайну (№ патента: США 8 024 127 B2 ) алгоритм GDT вычисляет 20 оценок GDT, то есть для каждого из 20 последовательных отсечений расстояния (0,5 Å, 1,0 Å, 1,5 Å, ... 10,0 Å). Для оценки подобия структуры предполагается использовать баллы GDT из нескольких значений отсечки, и баллы обычно увеличиваются с увеличением отсечки. Плато в этом увеличении может указывать на крайнее расхождение между экспериментальной и предсказанной структурами, так что никакие дополнительные атомы не включаются ни в какое ограничение разумного расстояния (см. Графики GDT ). Обычный общий балл GDT_TS в CASP - средний результат отсечки на 1, 2, 4 и 8 Å.[1][4]
Исходный GDT_TS рассчитывается на основе наложений и оценок GDT, полученных программой Local Global Alignment (LGA).[1] Версия с высокой точностью, называемая GDT_HA, создается путем выбора меньших расстояний отсечки (половина размера GDT_TS) и, следовательно, является более строгой. Он использовался в категории высокой точности CASP7.[5] CASP8 определяет новую «оценку TR», которая представляет собой GDT_TS за вычетом штрафа за остатки, сгруппированные для закрытия, предназначенные для представления стерических конфликтов, изобретенных предсказателем, иногда для игры с мерой отсечения GDT.[6][7] Первичная оценка GDT использует только атомы Cα. Чтобы применить оценку на основе суперпозиции к функциональным концам боковых цепей белков, в 2008 году в рамках программы LGA была разработана и реализована оценка, подобная GDT, называемая вычислением глобального расстояния для боковых цепей (GDC_sc).[1][8] Вместо сравнения положений остатков на основе Cαs, GDC_sc использует характеристический атом около конца каждого типа боковой цепи для оценки отклонений расстояния между остатками. Вариант «все атомы» оценки GDC (GDC_all) рассчитывается с использованием информации о полной модели и является одним из стандартных показателей, используемых организаторами и экспертами CASP для оценки точности прогнозируемых структурных моделей.[8][9]
Смотрите также
- Среднеквадратичное отклонение (биоинформатика) - Другая мера сравнения структур.
- TM-оценка - Другая мера сравнения структур.
- Самый длинный непрерывный сегмент (LCS) - Другая мера сравнения структур, реализованная в программе LGA.
- Расчет глобального расстояния (GDC_sc, GDC_all) - Меры сравнения структур, которые используют информацию полной модели (а не только α-углерод) для оценки сходства.
- Локальное глобальное выравнивание (LGA) - Программа выравнивания структуры и измерение подобия структуры GDT, GDC, LCS и LGA_S.
Рекомендации
- ^ а б c d е Земля А (2003). «LGA: метод нахождения трехмерного сходства в белковых структурах». Исследования нуклеиновых кислот. 31 (13): 3370–3374. Дои:10.1093 / нар / gkg571. ЧВК 168977. PMID 12824330.
- ^ Земла А., Венцловас С., Молт Дж., Фиделис К. (1999). «Обработка и анализ предсказаний структуры белка CASP3». Белки. S3: 22–29. Дои:10.1002 / (SICI) 1097-0134 (1999) 37: 3+ <22 :: AID-PROT5> 3.0.CO; 2-W. PMID 10526349.
- ^ Земла А., Венцловас С., Молт Дж., Фиделис К. (2001). «Обработка и оценка прогнозов в CASP4». Белки. 45 (S5): 13–21. Дои:10.1002 / prot.10052. PMID 11835478.
- ^ Крыштафович А; Прлик, А; Дмитриев, З; Данилюк, П; Милостан, М; Эйрих, В; Хаббард, Т; Фиделис, К. (2007). «Новые инструменты и расширенные возможности анализа данных в Центре прогнозирования структуры белка». Белки. 69 Дополнение 8: 19–26. Дои:10.1002 / prot.21653. ЧВК 2656758. PMID 17705273.
- ^ Прочтите, Рэнди Дж .; Чавали, Гаятри (2007). «Оценка прогнозов CASP7 в категории высокоточного моделирования на основе шаблонов». Белки. 69 (S8): 27–37. Дои:10.1002 / prot.21662. PMID 17894351.
- ^ Ши, S; Пей, Дж; Садреев Р.И.; Кинч, LN; Маджумдар, я; Тонг, Дж; Cheng, H; Kim, BH; Гришин, Н.В. (2009). «Анализ целей CASP8, прогнозы и методы оценки». База данных: журнал биологических баз данных и курирования. 2009: bap003. Дои:10.1093 / база данных / bap003. ЧВК 2794793. PMID 20157476.. Связанная страница
- ^ Садреев Р.И.; Ши, S; Бейкер, Д; Гришин, Н.В. (15 мая 2009 г.). «Мера подобия структуры со штрафом за близкие неэквивалентные остатки». Биоинформатика. 25 (10): 1259–63. Дои:10.1093 / биоинформатика / btp148. ЧВК 2677741. PMID 19321733.
- ^ а б Keedy, D.A .; Уильямс, CJ; Headd, JJ; Арендалл, ВБ; Чен, В.Б .; Капрал, ГДж; Гиллеспи, РА; Блок, JN; Земля, А; Ричардсон, округ Колумбия; Ричардсон, Дж. С. (2009). «Остальные 90% белка: оценка за пределами α-углерода для высокоточных моделей на основе шаблона CASP8». Белки. 77 (Дополнение 9): 29–49. Дои:10.1002 / prot.22551. ЧВК 2877634. PMID 19731372.
- ^ Моди В., Сюй К.Ф., Адхикари С., Данбрак Р.Л. (2016). «Оценка основанного на шаблонах моделирования структуры белка в CASP11». Белки. 84: 200–220. Дои:10.1002 / prot.25049. ЧВК 5030193. PMID 27081927.
внешняя ссылка
- Графики GDT пример графиков из GDT-анализа структурных моделей, оцененных в эксперименте CASP5
- Описание GDC, GDT, LCS и LGA услуги и документация по сравнению структур и мерам сходства