UniFrac - UniFrac
Статистика |
---|
|
UniFrac это метрика расстояния используется для сравнения биологические сообщества. Он отличается от таких мер несходства, как Несходство Брея-Кертиса в том, что он включает информацию об относительном родстве членов сообщества путем включения филогенетических расстояний между наблюдаемыми организмами в вычислениях.
Как взвешенные (количественные), так и невзвешенные (качественные) варианты UniFrac[1] широко используются в микробная экология, где первое учитывает изобилие наблюдаемых организмов, а второе учитывает только их присутствие или отсутствие. Метод был разработан Екатерина Лозупоне, когда она работала под Роб Найт[2] из Колорадский университет в Боулдере в 2005 году.[3][4]
Методы исследования
Расстояние рассчитывается между парами образцов (каждый образец представляет собой сообщество организмов). Все таксоны, обнаруженные в одном или обоих образцах, помещаются на филогенетическое дерево. Ветвь, ведущая к таксонам из обоих образцов, помечена как «общая», а ветви, ведущие к таксонам, которые встречаются только в одной выборке, помечены как «неразделенные». Затем расстояние между двумя образцами рассчитывается как:
Это определение удовлетворяет требованиям метрика расстояния, неотрицательный, ноль только тогда, когда объекты идентичны, транзитивны и соответствуют неравенство треугольника.
Если имеется несколько различных образцов, матрицу расстояний можно создать, построив дерево для каждой пары образцов и вычислив их меру UniFrac. Впоследствии стандартные многомерные статистические методы, такие как кластеризация данных и анализ главных координат может быть использован.
Можно определить статистическую значимость расстояния UniFrac между двумя образцами, используя Моделирование Монте-Карло. Путем рандомизации выборочной классификации каждого таксона в дереве (без изменения структуры ветвей) и создания распределения значений расстояния UniFrac можно получить распределение значений UniFrac. Исходя из этого, p-значение может быть присвоено фактическому расстоянию между образцами.
Кроме того, существует взвешенная версия метрики UniFrac, которая учитывает относительную численность каждого из таксонов в сообществах. Это обычно используется в метагеномный исследования, в которых количество метагеномных считываний может исчисляться десятками тысяч, и уместно «объединить» эти считывания в операционные таксономические единицы, или OTU, которые затем можно рассматривать как таксоны в рамках UniFrac.
В 2012 году обобщенная версия UniFrac,[5] который объединяет взвешенное и невзвешенное расстояние UniFrac в единую структуру. Взвешенное и невзвешенное расстояние UniFrac придает слишком большое значение либо многочисленным линиям, либо редким линиям. Их способность обнаруживать влияние окружающей среды ограничена в некоторых условиях, когда в основном затронуты умеренно многочисленные линии. Обобщенное расстояние UniFrac исправляет ограничение взвешенного / взвешенного расстояния UniFrac путем уменьшения их акцента на обильных или редких линиях.
Рекомендации
- ^ Lozupone, C.A .; Хамади, М; Kelley, S.T .; Найт, Р. (2007). «Количественные и качественные показатели бета-разнообразия позволяют по-разному понимать факторы, которые структурируют микробные сообщества». Прикладная и экологическая микробиология. 73 (5): 1576–85. Дои:10.1128 / AEM.01996-06. ЧВК 1828774. PMID 17220268.
- ^ Рыцарь, Роб (2015). Следуй за своим кишечником: огромное влияние крошечных микробов. Саймон и Шустер / TED. п. 89. ISBN 978-1-4767-8475-5.CS1 maint: ref = harv (связь)
- ^ Lozupone, C .; Найт, Р. (2005). «UniFrac: новый филогенетический метод сравнения микробных сообществ». Прикладная и экологическая микробиология. 71 (12): 8228–8235. Дои:10.1128 / AEM.71.12.8228-8235.2005. ЧВК 1317376. PMID 16332807.
- ^ Хамади, М; Лозупон, С; Рыцарь, Р. (2010). "Fast Uni" Гидроразрыв: Содействие высокопроизводительному филогенетическому анализу микробных сообществ, включая анализ пиросеквенирования и филогенетического анализа. Чип данные". Журнал ISME. 4 (1): 17–27. Дои:10.1038 / ismej.2009.97. ЧВК 2797552. PMID 19710709.
- ^ Chen, J .; Биттингер, К .; Чарлсон, Э. С .; Hoffmann, C .; Lewis, J .; Wu, G.D .; Collman, R.G .; Бушман, Ф. Д .; Ли, Х. (2012). «Связывание состава микробиома с ковариатами окружающей среды с использованием обобщенных расстояний UniFrac». Биоинформатика. 28 (16): 2106–2113. Дои:10.1093 / биоинформатика / bts342. ЧВК 3413390. PMID 22711789.