UniFrac - UniFrac

UniFrac это метрика расстояния используется для сравнения биологические сообщества. Он отличается от таких мер несходства, как Несходство Брея-Кертиса в том, что он включает информацию об относительном родстве членов сообщества путем включения филогенетических расстояний между наблюдаемыми организмами в вычислениях.

Как взвешенные (количественные), так и невзвешенные (качественные) варианты UniFrac[1] широко используются в микробная экология, где первое учитывает изобилие наблюдаемых организмов, а второе учитывает только их присутствие или отсутствие. Метод был разработан Екатерина Лозупоне, когда она работала под Роб Найт[2] из Колорадский университет в Боулдере в 2005 году.[3][4]

Методы исследования

Расстояние рассчитывается между парами образцов (каждый образец представляет собой сообщество организмов). Все таксоны, обнаруженные в одном или обоих образцах, помещаются на филогенетическое дерево. Ветвь, ведущая к таксонам из обоих образцов, помечена как «общая», а ветви, ведущие к таксонам, которые встречаются только в одной выборке, помечены как «неразделенные». Затем расстояние между двумя образцами рассчитывается как:



Это определение удовлетворяет требованиям метрика расстояния, неотрицательный, ноль только тогда, когда объекты идентичны, транзитивны и соответствуют неравенство треугольника.

Три примера неравенства треугольника для треугольников со сторонами длин Икс, у, z. В верхнем примере показан случай, когда z намного меньше суммы Икс + у двух других сторон, а в нижнем примере показан случай, когда сторона z лишь немного меньше, чем Икс + у.

Если имеется несколько различных образцов, матрицу расстояний можно создать, построив дерево для каждой пары образцов и вычислив их меру UniFrac. Впоследствии стандартные многомерные статистические методы, такие как кластеризация данных и анализ главных координат может быть использован.

Можно определить статистическую значимость расстояния UniFrac между двумя образцами, используя Моделирование Монте-Карло. Путем рандомизации выборочной классификации каждого таксона в дереве (без изменения структуры ветвей) и создания распределения значений расстояния UniFrac можно получить распределение значений UniFrac. Исходя из этого, p-значение может быть присвоено фактическому расстоянию между образцами.

Кроме того, существует взвешенная версия метрики UniFrac, которая учитывает относительную численность каждого из таксонов в сообществах. Это обычно используется в метагеномный исследования, в которых количество метагеномных считываний может исчисляться десятками тысяч, и уместно «объединить» эти считывания в операционные таксономические единицы, или OTU, которые затем можно рассматривать как таксоны в рамках UniFrac.

В 2012 году обобщенная версия UniFrac,[5] который объединяет взвешенное и невзвешенное расстояние UniFrac в единую структуру. Взвешенное и невзвешенное расстояние UniFrac придает слишком большое значение либо многочисленным линиям, либо редким линиям. Их способность обнаруживать влияние окружающей среды ограничена в некоторых условиях, когда в основном затронуты умеренно многочисленные линии. Обобщенное расстояние UniFrac исправляет ограничение взвешенного / взвешенного расстояния UniFrac путем уменьшения их акцента на обильных или редких линиях.

Рекомендации

  1. ^ Lozupone, C.A .; Хамади, М; Kelley, S.T .; Найт, Р. (2007). «Количественные и качественные показатели бета-разнообразия позволяют по-разному понимать факторы, которые структурируют микробные сообщества». Прикладная и экологическая микробиология. 73 (5): 1576–85. Дои:10.1128 / AEM.01996-06. ЧВК  1828774. PMID  17220268.
  2. ^ Рыцарь, Роб (2015). Следуй за своим кишечником: огромное влияние крошечных микробов. Саймон и Шустер / TED. п. 89. ISBN  978-1-4767-8475-5.CS1 maint: ref = harv (связь)
  3. ^ Lozupone, C .; Найт, Р. (2005). «UniFrac: новый филогенетический метод сравнения микробных сообществ». Прикладная и экологическая микробиология. 71 (12): 8228–8235. Дои:10.1128 / AEM.71.12.8228-8235.2005. ЧВК  1317376. PMID  16332807.
  4. ^ Хамади, М; Лозупон, С; Рыцарь, Р. (2010). "Fast Uni" Гидроразрыв: Содействие высокопроизводительному филогенетическому анализу микробных сообществ, включая анализ пиросеквенирования и филогенетического анализа. Чип данные". Журнал ISME. 4 (1): 17–27. Дои:10.1038 / ismej.2009.97. ЧВК  2797552. PMID  19710709.
  5. ^ Chen, J .; Биттингер, К .; Чарлсон, Э. С .; Hoffmann, C .; Lewis, J .; Wu, G.D .; Collman, R.G .; Бушман, Ф. Д .; Ли, Х. (2012). «Связывание состава микробиома с ковариатами окружающей среды с использованием обобщенных расстояний UniFrac». Биоинформатика. 28 (16): 2106–2113. Дои:10.1093 / биоинформатика / bts342. ЧВК  3413390. PMID  22711789.

внешняя ссылка