РА сюжет - RA plot
В средний коэффициент (RA) сюжет - это целочисленная версия Сюжет MA для визуализации данных подсчета с двумя условиями. Его характерная стреловидная форма проистекает из того, что он включает condition-unique (0,п) или же (п, 0) указывает на график через эпсилон фактор.
Определение
An РА сюжет, как и его двоюродный брат, Сюжет MA, является а измененный масштаб и (45 градусов) повернутая версия а простой двумерный график рассеяния а против б куда а и б - векторы положительных измерений равной длины. Такое изменение масштаба и вращение позволяет лучше видеть и выделять важные точки выбросов, которые различаются в зависимости от двух условий измерения.[1] По сути, это график отношения логарифма [R] к среднему логарифму [A] каждой пары элементов а иб. Однако, в отличие от графика MA, поскольку график RA принимает в качестве входных данных неотрицательные целые числа, он должен использовать обходные пути для включения математически невидимых точек (например, точек, в которых один или оба элемента пары равны нулю).
Если мы изменим наш оригинал а (или же б) вектор через:
куда
тогда р и А можно определить как:
р, подобно M, наносится на у-оси и представляет собой логарифмическое (кратное изменение) отношение между а иб. А нанесен на Икс-axis и представляет собой среднюю численность для пары координат. График RA обеспечивает быстрый обзор распределения и размера набора данных, состоящего из ненулевых значений.
Этимология
Префикс аббревиатуры "R.A." иногда произносится как односложное слово «луч» из-за сильного сходства сюжета с геометрический луч. Эта характерная стреловидная форма проистекает из двух ключевых особенностей: справа на вектор origin, длинный асимптотический хвост и слева (образующие наконечник стрелки) два (часто плотных) участка уникальных по условиям точек.
Обходы для видимости и включения точек
Условие уникальных точек
Поскольку большая часть пар а и б содержат нули в одном или обоих условиях, их невозможно отобразить как есть в логарифмической шкале. Другие функции построения графиков скользящей средней искусственно включают эти уникальные по условиям точки на графике, распределяя их по вертикали в виде "мазка" слева или по горизонтали в виде "коврик "в самом верху и внизу графика. На графике RA, напротив, уникальные объекты включаются путем добавления небольшого эпсилон фактор (между .1 и .5), что помещает их в более статистически подходящее место на графике.
Overplotting
Другая проблема с построением этого (или любого) типа данных подсчета - перерисовка который решается на графике RA дрожь точки расположены далеко друг от друга, но не настолько, чтобы сливаться с другими координатами. Результатом этой функции является лоскутный вид сюжета, который исчезает по мере того, как А увеличивается.
Пакеты
В Caroline CRAN R пакет содержит единственную известную реализацию сюжета RA. Однако мета-транскриптомика Пакет R "манта" предоставляет оболочку для реализации этого графика RA и используется для оценки кратного изменения транскрипции генов (точек) при одновременной визуализации таксономических распределений каждого гена в виде отдельных точек круговой диаграммы.[2]
Примеры
библиотека (каролина) a <- rnbinom (n = 10000, mu = 5, size = 2) b <- rnbinom (n = 10000, mu = 5, size = 2) raPlot (a, b)
Рекомендации
- ^ Дудуа, С, Ян, YH, Кэллоу, MJ, Скорость, ТП. (2002). Статистические методы для идентификации дифференциально экспрессируемых генов в экспериментах с реплицированными микрочипами кДНК. Стат. Грех. 12:1 111–139
- ^ Шрут, Д. и Маркетти, А. (2011). Нормализованный анализ транскриптов микробной сборки. Пакет R версии 0.9.5.