Индекс фиксации - Fixation index

В индекс фиксации (FST) является мерой дифференциация населения из-за генетическая структура. Часто оценивается по генетический полиморфизм данные, такие как однонуклеотидные полиморфизмы (SNP) или микроспутники. Разработан как частный случай Райта F-статистика, это одна из наиболее часто используемых статистических популяционная генетика.

Определение

Два наиболее часто используемых определения FST в данном локусе основаны на дисперсии частоты аллелей между популяциями, и от вероятности Идентичность по происхождению.

Если средняя частота аллеля в общей популяции, - это дисперсия частоты аллеля между различными субпопуляциями, взвешенная по размеру субпопуляций, и - дисперсия аллельного состояния в общей популяции, FST определяется как [1]

Райта определение показывает, что FST измеряет количество генетических отклонений, которые можно объяснить структурой популяции. Это также можно рассматривать как долю от общего разнообразия, которая не является следствием среднего разнообразия внутри субпопуляций, где разнообразие измеряется вероятностью того, что два случайно выбранных аллеля различны, а именно . Если частота аллеля в -я популяция и относительный размер -я популяция , тогда

В качестве альтернативы,[2]

куда вероятность идентичности по происхождению двух особей при условии, что эти два человека принадлежат к одной субпопуляции, и - это вероятность того, что два человека из общей популяции идентичны по происхождению. Используя это определение, FST можно интерпретировать как измерение того, насколько близки два человека из одной субпопуляции по сравнению со всем населением. Если скорость мутации мала, эту интерпретацию можно сделать более явной, связав вероятность идентичности по происхождению с время слияния: Пусть T0 и T обозначают среднее время до слияния для особей из одной субпопуляции и всей популяции соответственно. Потом,

Эта формулировка имеет то преимущество, что ожидаемое время коалесценции можно легко оценить по генетическим данным, что привело к разработке различных оценок для FST.

Оценка

На практике ни одна из величин, используемых в определениях, не может быть легко измерена. Как следствие, были предложены различные оценки. Особенно простая оценка, применимая к данным последовательности ДНК:[3]

куда и представляют среднее количество попарных различий между двумя людьми, отобранными из разных подгрупп () или из той же подгруппы населения (). Среднюю парную разницу в популяции можно рассчитать как сумму парных различий, деленную на количество пар. Однако эта оценка оказывается необъективной, если размеры выборки малы или если они различаются между популяциями. Поэтому используются более сложные методы для вычисления FST на практике. Две из наиболее широко используемых процедур - это оценка Weir & Cockerham (1984),[4] или выполнение Анализ молекулярной дисперсии. Список реализаций доступен в конце этой статьи.

Интерпретация

Это сравнение генетической изменчивости внутри популяций и между ними часто используется в прикладных целях. популяционная генетика. Диапазон значений от 0 до 1. Нулевое значение означает полное панмиксис; это означает, что две популяции свободно скрещиваются. Значение единицы означает, что все генетические вариации объясняются структурой популяции и что эти две популяции не имеют общего генетического разнообразия.

Для идеализированных моделей, таких как Модель конечного острова Райта, FST можно использовать для оценки скорости миграции. Согласно этой модели, скорость миграции составляет

,

куда м скорость миграции на поколение, и - частота мутаций на поколение.[5]

Интерпретация FST может быть затруднительно, если анализируемые данные сильно полиморфны. В этом случае вероятность идентичности по спуску очень мала и FST может иметь произвольно низкую верхнюю границу, что может привести к неверной интерпретации данных. Также, строго говоря, FST это не расстояние в математическом смысле, поскольку он не удовлетворяет неравенство треугольника.

Для населения растения которые явно принадлежат к одному разновидность, значения FST более 15% считаются «большой» или «значительной» дифференциацией, а значения ниже 5% считаются «небольшой» или «незначительной» дифференциацией.[6]Ценности для млекопитающее населения между подвид или близкородственных видов, типичные значения составляют порядка 5–20%. FST между Евразийский и североамериканское население серый волк были зарегистрированы на уровне 9,9%, между Красный волк и серый волк население составляет от 17% до 18%. В Восточный волк, недавно признанный сильно смешанный «волкоподобный вид» имеет значения FST ниже 10% по сравнению как с евразийскими (7,6%), так и с североамериканскими серыми волками (5,7%), с красным волком (8,5%), и даже ниже значение в паре с Койот (4.5%).[7]

FST в людях

FST значения сильно зависят от выбора популяций. Близкородственные этнические группы, такие как Датчане против нидерландский язык, или Французский против Испанцы показывают значения значительно ниже 1%, неотличимые от панмиксии. Было обнаружено, что в Европе самые разные этнические группы имеют значения порядка 7% (Саамы против. Сардинцы ).

Более высокие значения обнаруживаются при сравнении сильно расходящихся однородных групп: наибольшее найденное значение было около 46%, между Мбути и Папуасы.[8]

Аутосомные генетические дистанции на основе классических маркеров

В своем исследовании История и география генов человека (1994), Cavalli-Sforza, Menozzi и Piazza предоставляют одни из наиболее подробных и всеобъемлющих оценок генетических расстояний между человеческими популяциями внутри и между континентами. Их исходная база данных содержит 76 676 частот генов (с использованием 120 полиморфизмов крови), что соответствует 6 633 образцам в разных местах. Отбирая и объединяя такие образцы, они ограничивают свой анализ 491 популяцией. Они сосредоточены на коренное население которые находились на их нынешнем месте в конце 15 века, когда начались большие переселения европейцев.[9] При изучении генетических различий на мировом уровне число сокращается до 42 репрезентативных популяций, объединяющих субпопуляции, характеризующиеся высоким уровнем генетического сходства. Для этих 42 популяций Кавалли-Сфорца и соавторы сообщают о двусторонних расстояниях, рассчитанных на основе 120 аллелей. Среди этого набора из 42 мировых популяций наибольшее генетическое расстояние наблюдается между пигмеями мбути и жителями Папуа-Новой Гвинеи, где расстояние Fst составляет 0,4573, а наименьшее генетическое расстояние (0,0021) - между датчанами и англичанами. При рассмотрении более дезагрегированных данных по 26 европейским популяциям наименьшее генетическое расстояние (0,0009) находится между голландцами и датчанами, а наибольшее (0,0667) - между саамами и сардинцами. Среднее генетическое расстояние среди 861 доступной пары из 42 выбранных популяций оказалось 0,1338.[страница нужна ]. Генетическое расстояние 0,1338 означает, что родство между неродственными особями одного и того же происхождения по отношению к мировой популяции эквивалентно родству между полукровными братьями и сестрами в случайно спаривающейся популяции. Это также означает, что если человек из данной предковой популяции имеет смешанного сводного брата, этот человек генетически ближе к неродственной особи их предковой популяции, чем к их смешанному сводному брату. [10]

Аутосомные генетические дистанции на основе SNP

Исследование 2012 года, основанное на Международный проект HapMap данные оценочные FSTмежду тремя основными «континентальными» популяциями Европейцы (объединены жители штата Юта северного и западноевропейского происхождения из коллекции CEPH и итальянцы из Тосканы), Выходцы из Восточной Азии (объединяя ханьских китайцев из Пекина, китайцев из столичного Денвера и японцев из Токио, Япония) и Африканцы к югу от Сахары (объединение Лухья Вебуе, Кения, Масаи Киньява, Кения и Йоруба Ибадана, Нигерия). Он сообщил о значении, близком к 12% между континентальными популяциями, и значениях, близких к панмиксия (менее 1%) среди континентального населения.[11]

Межконтинентальные аутосомные генетические дистанции на основе SNP[12]
Европа (CEU)Африка к югу от Сахары (йоруба)Восточная Азия (японский)
Африка к югу от Сахары (йоруба)0.153
Восточная Азия (японский)0.1110.190
Восточная Азия (китайский)0.1100.1920.007
Внутриевропейские / средиземноморские аутосомные генетические дистанции на основе SNP[12][13]
ИтальянцыПалестинцыШведскийФинныиспанскийНемцыРоссиянеФранцузскийГреки
Палестинцы0.0064
Шведский0.0064-0.00900.0191
Финны0.0130-0.02300.0050-0.0110
испанский0.0010-0.00500.01010.0040-00550.0110-0.0170
Немцы0.0029-0.00800.01360.0007-0.00100.0060-0.01300.0015-0.0030
Россияне0.0088-0.01200.02020.0030-0.00360.0060-0.01200.0070-0.00790.0030-0.0037
Французский0.0030-0.00500.00200.0080-0.01500.00100.00100.0050
Греки0.00000.00570.00840.00350.00390.0108

Программы для расчета FST

Модули для расчета FST

Рекомендации

  1. ^ Holsinger, Kent E .; Брюс С. Вейр (2009). «Генетика в географически структурированных популяциях: определение, оценка и интерпретация FST». Нат Рев Жене. 10 (9): 639–650. Дои:10.1038 / nrg2611. ISSN  1471-0056. ЧВК  4687486. PMID  19687804.
  2. ^ Ричард Дарретт (12 августа 2008 г.). Вероятностные модели эволюции последовательности ДНК. Springer. ISBN  978-0-387-78168-6. Получено 25 октября 2012.
  3. ^ Hudson, RR .; Слаткин, М .; Мэддисон, WP. (Октябрь 1992 г.). «Оценка уровней потока генов по данным последовательностей ДНК». Генетика. 132 (2): 583–9. ЧВК  1205159. PMID  1427045.
  4. ^ Weir, B.S .; Кокерхэм, К. Кларк (1984). «Оценка F-статистики для анализа структуры населения». Эволюция. 38 (6): 1358–1370. Дои:10.2307/2408641. ISSN  0014-3820. JSTOR  2408641. PMID  28563791.
  5. ^ Питер Бирли, Оценка скорости миграции и численности населения в географически структурированных популяциях (1998), Достижения в молекулярной экологии (редактор Дж. Карвалью). НАТО Science Series A: Life Sciences, IOS Press, Amsterdam, 39-53.
  6. ^ Франкхэм, Р., Баллоу, Дж. Д., Бриско, Д. А., 2002. Введение в генетику сохранения. Cambridge University Press, Cambridge.Hartl DL, Clark AG (1997) Принципы популяционной генетики, 3-е изд. Sinauer Associates, Inc, Сандерленд, Массачусетс.
  7. ^ Б. М. фон Холдт и др., «Анализ последовательности всего генома показывает, что два эндемичных вида североамериканского волка представляют собой смесь койота и серого волка», Достижения науки 27 июля 2016: т. 2, вып. 7, e1501714, DOI: 10.1126 / sciadv.1501714.
  8. ^ Кавалли-Сфорца и др. (1994), цитируется по В. Гинзбург, С. Вебер, Справочник Palgrave по экономике и языку, Springer (2016), п. 182.
  9. ^ Кавалли-Сфорца и др., 1994, стр. 24
  10. ^ Харпендинг, Генри (2002). «Родство и деление населения». Население и окружающая среда. 24 (2): 141–147. Дои:10.1023 / А: 1020815420693. S2CID  15208802.
  11. ^ Эльхайк, Эран (2012). «Эмпирические распределения FST из крупномасштабных данных о полиморфизме человека». PLOS ONE. 7 (11): e49837. Bibcode:2012PLoSO ... 749837E. Дои:10.1371 / journal.pone.0049837. ЧВК  3504095. PMID  23185452.
  12. ^ а б Нелис, Мари; и другие. (2009-05-08). Флейшер, Роберт С. (ред.). «Генетическая структура европейцев: взгляд с северо-востока». PLOS ONE. 4 (5): e5472. Bibcode:2009PLoSO ... 4.5472N. Дои:10.1371 / journal.pone.0005472. ЧВК  2675054. PMID  19424496., см. таблицу
  13. ^ Тиан, Чао; и другие. (Ноябрь 2009 г.). "Генетическая субструктура европейского населения: дальнейшее определение информативных маркеров происхождения для различения различных европейских этнических групп". Молекулярная медицина. 15 (11–12): 371–383. Дои:10.2119 / молмед.2009.00094. ISSN  1076-1551. ЧВК  2730349. PMID  19707526., см. таблицу
  14. ^ Кроуфорд, Николас Г. (2010). "смог: программа для измерения генетического разнообразия ». Ресурсы по молекулярной экологии. 10 (3): 556–557. Дои:10.1111 / j.1755-0998.2009.02801.x. PMID  21565057.
  15. ^ Китада С., Китакадо Т., Кишино Н. (2007). «Эмпирический байесовский вывод о попарном F (ST) и его распределении в геноме». Генетика. 177 (2): 861–73. Дои:10.1534 / genetics.107.077263. ЧВК  2034649. PMID  17660541.

дальнейшее чтение

  • Эволюция и генетика популяций Том 2: теория частот генов, стр. 294–295, S. Wright, Univ. из Chicago Press, Чикаго, 1969 г.
  • Карта гаплотипов генома человека, Международный консорциум HapMap, Nature 2005

внешняя ссылка