Тест Макдональда – Крейтмана - McDonald–Kreitman test
В Тест Макдональда – Крейтмана[1] это статистический тест, который часто используется эволюционными и популяционными биологами для обнаружения и измерения количества адаптивная эволюция внутри вида путем определения того, произошла ли адаптивная эволюция, и доли замен, возникших в результате положительного отбора (также известного как направленный выбор ). Для этого тест Макдональда-Крейтмана сравнивает степень изменчивости внутри вида (полиморфизм ) к расхождению между видами (заменам) на двух типах сайтов, нейтральных и ненейтральных. Замена относится к нуклеотиду, который фиксируется в пределах одного вида, но другой нуклеотид фиксируется во втором виде на той же паре оснований гомологичных последовательностей ДНК.[2] Сайт не нейтрален, если он полезен или вреден.[3] Эти два типа сайтов могут быть либо синонимичными, либо несинонимичными в пределах области, кодирующей белок. В последовательности ДНК, кодирующей белок, сайт является синонимом, если точечная мутация на этом сайте не изменит аминокислоту, также известную как тихая мутация. Поскольку мутация не привела к изменению аминокислоты, которая изначально кодировалась последовательностью, кодирующей белок, фенотип или наблюдаемый признак организма, как правило, не изменяется молчащей мутацией.[4] Сайт в последовательности ДНК, кодирующей белок, несинонимичен, если точечная мутация в этом сайте приводит к изменению аминокислоты, что приводит к изменению фенотипа организма.[3] Обычно молчащие мутации в областях, кодирующих белок, используются в качестве «контроля» в тесте Макдональда-Крейтмана.
В 1991 году Джон Х. Макдональд и Мартин Крейтман получил тест Макдональда-Крейтмана при выполнении эксперимента с Дрозофила (плодовые мушки) и их различия в аминокислотной последовательности гена алкогольдегидрогеназы. Макдональд и Крейтман предложили этот метод для оценки доли замен, которые фиксируются положительным выбором, а не генетический дрейф.[5]
Чтобы настроить тест Макдональда – Крейтмана, мы должны сначала настроить двусторонний Таблица сопряженности наших данных об исследуемых видах, как показано ниже:
Фиксированный | Полиморфный | |
---|---|---|
Синоним | Ds | пs |
Несинонимный | Dп | пп |
- Ds: количество синонимичных замен на ген
- Dп: количество несинонимичных замен на ген
- пs: количество синонимичных полиморфизмов на ген
- пп: количество несинонимичных полиморфизмов на ген
Для количественной оценки значений для Ds, Dп, пs, и пп, вы подсчитываете количество различий в кодирующей белок области для каждого типа переменной в таблице непредвиденных обстоятельств.
В нулевая гипотеза теста Макдональда-Крейтмана состоит в том, что соотношение несинонимичных и синонимичных вариаций внутри вида будет равно отношению несинонимичных вариаций к синонимичным между видами (т. е. Dп/Ds = пп/пs). Когда положительный или отрицательный отбор (естественный отбор) влияет на несинонимичные вариации, отношения больше не будут равны. Отношение несинонимичной вариации к синонимичной вариации между видами будет ниже, чем отношение несинонимичной вариации к синонимичной вариации внутри вида (т.е. Dп/Ds < пп/пs), когда действует отрицательный отбор и вредные мутации сильно влияют на полиморфизм. Отношение несинонимичной вариации к синонимичной вариации внутри вида ниже, чем отношение несинонимичной вариации к синонимичной вариации между видами (т. Е. Dп/Ds > пп/пs), когда мы наблюдаем положительный отбор. Поскольку мутации при положительном отборе быстро распространяются в популяции, они не вносят вклад в полиморфизм, но влияют на дивергенцию.[6]
Используя уравнение, полученное Смитом и Эйром-Уокером, мы можем оценить долю замен оснований, зафиксированную естественным отбором, α,[7] по следующей формуле:
Альфа представляет собой долю замен, вызванных положительным выбором. Альфа может быть равна любому числу от -∞ до 1. Отрицательные значения альфы возникают из-за ошибки выборки или нарушений модели, таких как сегрегация слегка вредных аминокислотных мутаций.[8] Как и выше, наша нулевая гипотеза заключается в том, что α = 0, и мы ожидаем Dп/Ds в равной пп/пs.[5]
Индекс нейтральности
Индекс нейтральности (NI) количественно определяет направление и степень отклонения от нейтралитета (где пп/пs и Dп/Ds соотношения равны). Если предположить, что молчащие мутации нейтральны, индекс нейтральности больше 1 (то есть NI> 1) указывает на то, что действует отрицательный отбор, что приводит к избытку полиморфизма аминокислот. Это происходит потому, что естественный отбор способствует очищающему отбору и удалению вредных аллелей.[9] Поскольку молчащие мутации нейтральны, индекс нейтральности ниже 1 (то есть NI <1) указывает на избыток немой дивергенции, которая возникает, когда в популяции работает положительный отбор. Когда на вид действует положительный отбор, естественный отбор отдает предпочтение конкретному фенотипу по сравнению с другими фенотипами, и предпочтительный фенотип начинает фиксироваться у вида по мере увеличения частоты аллелей для этого фенотипа.[10] Чтобы найти индекс нейтральности, мы можем использовать следующее уравнение:
Источники ошибок с тестом Макдональда – Крейтмана
Одним из недостатков выполнения теста Макдональда – Крейтмана является то, что он уязвим для ошибок, как и любой другой статистический тест. Многие факторы могут способствовать ошибкам в оценке уровня адаптивной эволюции, в том числе наличие слегка вредных мутаций, вариации скорости мутаций по геному, вариации сливающихся историй по геному и изменения эффективного размера популяции. Все эти факторы приводят к занижению значения α.[11] Однако, согласно исследованию, проведенному Charlesworth (2008),[3] Андольфатто (2008),[12] и Эйр-Уокер (2006),[8] Ни один из этих факторов не является достаточно значимым, чтобы заставить ученых поверить в ненадежность теста Макдональда-Крейтмана, за исключением наличия слегка вредных мутаций у видов.
В целом, тест Макдональда-Крейтмана часто считают ненадежным из-за того, насколько сильно тест склонен недооценивать степень адаптивной эволюции при наличии слегка вредных мутаций. Слегка вредная мутация может быть определена как мутация, на которую отрицательный отбор воздействует очень слабо, так что ее судьба определяется как отбором, так и случайным генетическим дрейфом.[3] Если в популяции сегрегируют слегка вредные мутации, тогда становится трудно обнаружить положительный отбор, и степень положительного отбора недооценивается. Слабо вредные мутации имеют больше шансов внести свой вклад в полиморфизм, чем сильно вредные мутации, но все же имеют низкую вероятность фиксации. Это создает смещение в оценке степени адаптивной эволюции, полученной при помощи теста Макдональда – Крейтмана, что приводит к значительно более низкой оценке α. Напротив, поскольку сильно вредные мутации не вносят вклад ни в полиморфизм, ни в дивергенцию, сильно вредные мутации не искажают оценки α.[13] Наличие слегка вредных мутаций тесно связано с генами, которые испытали наибольшее сокращение эффективной численности популяции.[14] Это означает, что вскоре после недавнего уменьшения эффективной численности популяции у вида, такого как «узкое место», мы наблюдаем большее присутствие слегка вредных мутаций в областях, кодирующих белок.[15] Мы можем установить прямую связь с увеличением числа слегка вредных мутаций и недавним уменьшением эффективной численности популяции.[14] Для получения дополнительной информации о том, почему размер популяции влияет на тенденцию к увеличению частоты слегка вредных мутаций, см. Статью Почти нейтральная теория молекулярной эволюции.
Кроме того, как и в случае любого статистического теста, всегда есть шанс получить ошибка типа I и ошибка типа II в тесте Макдональда Крейтмана. Используя статистические тесты, мы должны больше стараться избегать ошибок типа I, чтобы не отвергать нулевую гипотезу, когда она на самом деле верна.[16] Однако тест Макдональда Крейтмана очень уязвим для ошибок типа I из-за множества факторов, которые могут привести к случайному отклонению истинной нулевой гипотезы. К таким факторам относятся вариации в скорости рекомбинации, неравновесная демография, небольшие размеры выборки и сравнения с участием недавно разошедшихся видов.[14] Все эти факторы могут влиять на способность теста Макдональда-Крейтмана обнаруживать положительный отбор, а также на уровень положительного отбора, действующего на вид. Эта неспособность правильно определить уровень положительного отбора, действующего на вид, часто приводит к ложному положительному результату и неправильному отклонению нулевой гипотезы.
При выполнении теста Макдональда – Крейтмана ученые также должны избегать слишком большого количества ошибок типа II. В противном случае результаты теста могут быть слишком ошибочными, а его результаты будут сочтены бесполезными.
Механизмы исправления ошибок теста Макдональда – Крейтмана
Продолжается больше экспериментов с тестом Макдональда – Крейтмана и с тем, как улучшить точность теста. Самая важная ошибка, которую необходимо исправить, - это ошибка, заключающаяся в том, что α сильно недооценивается при наличии слегка вредных мутаций, как обсуждалось в предыдущем разделе «Источники ошибок с тестом Макдональда-Крейтмана». Эта возможная корректировка теста Макдональда-Крейтмана включает удаление полиморфизмов ниже определенного значения из набора данных для улучшения и увеличения количества замен, которые произошли из-за адаптивной эволюции.[3] Чтобы свести к минимуму влияние слегка вредных мутаций, было предложено исключить полиморфизмы, которые ниже определенной частоты отсечки, например <8% или <5% (все еще много споров о том, каким должно быть лучшее значение отсечения). Не включая полиморфизмы с определенной частотой, вы можете уменьшить смещение, создаваемое слегка вредными мутациями, поскольку будет учитываться меньшее количество полиморфизмов. Это повысит оценку α. Таким образом, оценка степени адаптивной эволюции не будет настолько сильно недооценена, что критерий Макдональда – Крейтмана будет более надежным.[13]
Одна необходимая регулировка - это контроль за ошибка типа I в тесте Макдональда-Крейтмана см. обсуждение этого в предыдущем разделе «Источники ошибок с тестом Макдональда Крейтмана». Один из способов избежать ошибок типа I - избегать использования популяций, которые недавно столкнулись с узким местом, что означает, что они недавно подверглись недавнему уменьшению эффективного размера популяции.[14] Чтобы сделать анализ максимально точным в тесте Макдональда – Крейтмана, лучше всего использовать большие размеры выборки, но все еще ведутся споры о том, насколько велик «большой».[16] Питер Андольфатто (2008) предлагает еще один метод контроля ошибок типа I - установить уровни значимости путем объединения моделирования с рекомбинацией при сканировании по всему геному для отбора некодирующей ДНК. Таким образом вы сможете повысить точность своего статистического теста и избежать ложноположительных результатов. [12] Имея все эти возможные способы избежать ошибок типа I, ученые должны осторожно выбирать, какие популяции они анализируют, чтобы избежать анализа популяций, который приведет к неточным результатам.
Смотрите также
Рекомендации
- ^ Макдональд, Дж. Х. Крейтман (1991). «Адаптивная эволюция белка в Adh локус в Дрозофила" (PDF). Природа. 351 (6328): 652–654. Bibcode:1991Натура.351..652М. Дои:10.1038 / 351652a0. PMID 1904993. S2CID 205024070.
- ^ Футуйма, Д. Дж. 2013. Эволюция. Sinauer Associates, Inc .: Сандерленд.
- ^ а б c d е Чарльзуорт, Дж. Эйр-Уокер (2008). «Тест Макдональда – Крейтмана и слегка вредные мутации». Молекулярная биология и эволюция. 25 (6): 1007–1015. Дои:10.1093 / молбев / msn005. PMID 18195052.
- ^ Kimchi-Sarfaty, M. M .; Ой, С .; Kim, J.M .; Сауна, I .; Calcagno, Z. E .; Амбудкар, А. М .; Готтесман, С. В. (2007). «Молчаливый» полиморфизм гена MDR1 изменяет субстратную специфичность ». Наука. 315 (5811): 525–528. Bibcode:2007Наука ... 315..525K. Дои:10.1126 / science.1135308. PMID 17185560. S2CID 15146955.
- ^ а б Эйр-Уокер, А (2006). «Геномный темп адаптивной эволюции» (PDF). Тенденции в экологии и эволюции. 21 (10): 569–575. Дои:10.1016 / j.tree.2006.06.015. PMID 16820244.
- ^ Барбадилья, С. Эгеа; Касильяс, А. (2008). «Стандартный и обобщенный тест Макдональда-Крейтмана: веб-сайт для обнаружения отбора путем сравнения различных классов сайтов ДНК». Исследования нуклеиновых кислот. 36 (Выпуск веб-сервера): 157–162. Дои:10.1093 / nar / gkn337. ЧВК 2447769. PMID 18515345.
- ^ Smith, N.G.C .; Эйр-Уокер, А. (2002). «Адаптивная эволюция белков у дрозофилы». Природа. 415 (6875): 1022–1024. Bibcode:2002Натура.415.1022S. Дои:10.1038 / 4151022a. PMID 11875568. S2CID 4426258.
- ^ а б Эйр-Уокер, А (2002). «Изменение эффективного размера популяции и тест Макдональда-Крейтмана» (PDF). Общество генетиков Америки. 162: 2017–2024.
- ^ Meiklejohn, Colin D .; Montooth, Kristi L .; Рэнд, Дэвид М. (2007). «Положительный и отрицательный отбор по митохондриальному геному». Тенденции в генетике. 23 (6): 259–263. Дои:10.1016 / j.tig.2007.03.008. PMID 17418445.
- ^ Столецки, Н. Эйр-Уокер (2010). «Оценка индекса нейтральности». Молекулярная биология и эволюция. 28 (1): 63–70. Дои:10.1093 / molbev / msq249. PMID 20837603.
- ^ Бейнс, Дж. Чжан; Парш, Дж. Ф. (2008). «Влияние демографии и слабого отбора на тест Макдональда – Крейтмана: эмпирическое исследование на дрозофиле». Молекулярная биология и эволюция. 26 (3): 691–698. Дои:10.1093 / molbev / msn297. PMID 19126864.
- ^ а б Андольфатто, П. (2008). «Контроль ошибки типа I теста Макдональда-Крейтмана при сканировании генома для отбора некодирующих ДНК». Генетика. 180 (3): 1767–1771. Дои:10.1534 / генетика.108.091850. ЧВК 2581974. PMID 18791238.
- ^ а б Мессер, П. В. Петров (2013). «Частая адаптация и тест Макдональда – Крейтмана». Труды Национальной академии наук Соединенных Штатов Америки. 110 (21): 8615–8620. Bibcode:2013ПНАС..110.8615М. Дои:10.1073 / pnas.1220835110. ЧВК 3666677. PMID 23650353.
- ^ а б c d Парш, З. Бейнс; Чжан, Дж. (2009). «Влияние демографии и слабого отбора на тест Макдональда – Крейтмана: эмпирическое исследование на дрозофиле». Молекулярная биология и эволюция. 26 (3): 691–698. Дои:10.1093 / molbev / msn297. PMID 19126864.
- ^ Эллегрен, Ханс (2009). «Модель выбора молекулярной эволюции с учетом эффективного размера популяции». Эволюция. 63 (2): 301–305. Дои:10.1111 / j.1558-5646.2008.00560.x. PMID 19215289. S2CID 9490559.
- ^ а б Россман, А. Дж. Шанс, Б. Л. 2012. Обнаружение статистики семинара с данными. Джон Уайли и сыновья: Дэнверс.