Сюжет MA - MA plot

An Сюжет MA это приложение График Блэнда – Альтмана для визуального представления геномный данные. График визуализирует различия между измерениями, выполненными в двух выборках, путем преобразования данных в M (коэффициент логарифма) и A (среднее среднее ) шкалы, а затем нанесите эти значения на график. Хотя изначально применялся в контексте двухканального Микрочип ДНК данные экспрессии генов, графики MA также используются для визуализации высокопроизводительное секвенирование анализ.[1][2]

Объяснение

Микрочип данные часто нормализуются в массивах для контроля систематических ошибок связывания красителей и эффективности гибридизации, а также других технических ошибок в ДНК-зондах и наконечнике для печати, используемом для определения массива.[3] Сводя к минимуму эти систематические вариации, можно найти истинные биологические различия. Чтобы определить, нужна ли нормализация, можно построить график Cy5 (R) интенсивности против Cy3 (G) интенсивности и посмотрите, составляет ли наклон линии около 1. Усовершенствованный метод, который в основном представляет собой масштабированный поворот на 45 градусов графика R против G, представляет собой график MA.[4] MA-график представляет собой график распределения отношения интенсивностей красного / зеленого («M»), построенный по средней интенсивности («A»). M и A определяются следующими уравнениями.

M, следовательно, двоичный логарифм отношения интенсивностей (или разницы между логарифмической интенсивностью), а А - это средняя логарифмическая интенсивность для точки на графике. Графики МА затем используются для визуализации зависящего от интенсивности отношения необработанных данных микроматрицы (микроматрицы обычно показывают здесь систематическую ошибку, причем чем выше A, тем выше | M |, т.е. чем ярче пятно, тем более вероятно наблюдаемое различие между образцом и контролем). На графике MA переменная M на уось и А на Икс-оси и дает краткий обзор распространение данных.

Во многих экспериментах по экспрессии генов на микрочипах основное предположение состоит в том, что большинство генов не увидят никаких изменений в своей экспрессии; поэтому большинство точек на у-ось (M) будет расположен в 0, поскольку log (1) равен 0. Если это не так, то нормализация метод, такой как ЛЕСС следует применять к данным перед статистическим анализом. (На диаграмме ниже вы увидите красную линию, идущую ниже нулевой отметки до нормализации, она должна быть прямой. Поскольку это не прямая линия, данные должны быть нормализованы. После нормализации красная линия проходит прямо на нулевой линии и отображается как розовый / черный.)

Пакеты

Несколько Биокондуктор пакеты, для Программное обеспечение R, предоставить возможность для создания графиков MA. К ним относятся affy (ma.plot, mva.pairs), limma (plotMA), marray (maPlot) и edgeR (maPlot)

Аналогичный Участки "РА" может быть сгенерирован с помощью функции raPlot в caroline КРАН р упаковка.

Пример на языке программирования R

библиотека(affy)если (требовать(affydata)) {     данные(Разбавление)}у <- (exprs(Разбавление)[, c(«20Б», «10А»)])x11()ma.plot( rowMeans(log2(у)), log2(y [, 1])-log2(y [, 2]), cex=1 )заглавие(«Набор данных разведения (массив 20B v 10A)»)библиотека(preprocessCore)# сделать квантильную нормализациюИкс <- normalize.quantiles(у)x11()ma.plot( rowMeans(log2(Икс)), log2(Икс[, 1])-log2(Икс[, 2]), cex=1 ) заглавие("Post Norm: Dilutions Dataset (массив 20B v 10A)")
MA График для необработанных данных, обратите внимание на искажения в верхних диапазонах.
Предварительная нормализация
График MA для квантильных нормализованных данных.
Пост нормализация
МА Сюжеты.

Смотрите также

Рекомендации

  1. ^ Робинсон, М. Д .; Маккарти, Д. Дж .; Смит, Г. К. (11 ноября 2009 г.). «edgeR: пакет Bioconductor для анализа дифференциальной экспрессии цифровых данных экспрессии генов». Биоинформатика. 26 (1): 139–140. Дои:10.1093 / биоинформатика / btp616. ЧВК  2796818. PMID  19910308.
  2. ^ С любовью, Майкл I; Хубер, Вольфганг; Андерс, Саймон (5 декабря 2014 г.). «Умеренная оценка кратного изменения и дисперсии данных RNA-seq с помощью DESeq2». Геномная биология. 15 (12): 550. Дои:10.1186 / s13059-014-0550-8. ЧВК  4302049. PMID  25516281.
  3. ^ YH Ян, С Дудуа, П Луу, ДМ Линь, В Пэн, Дж Нгаи, Скорость TP. (2002). Нормализация данных микроматрицы кДНК: надежный составной метод, учитывающий систематические вариации на одном или нескольких слайдах. Исследования нуклеиновых кислот т. 30 (4) с. E15.
  4. ^ Дудуа, С, Ян, YH, Кэллоу, MJ, Скорость, ТП. (2002). Статистические методы для идентификации дифференциально экспрессируемых генов в экспериментах с реплицированными микрочипами кДНК. Стат. Грех. 12:1 111–139