Самоподобие анализа сетевых данных - Self-Similarity of Network Data Analysis

В компьютерная сеть, самоподобие это особенность динамики передачи данных по сети. При моделировании динамики сетевых данных используются традиционные модели временных рядов, такие как модель авторегрессионного скользящего среднего (ARMA (p, q)) не подходят. Это связано с тем, что эти модели предоставляют только конечное число параметров в модели и, следовательно, взаимодействие в конечном временном окне, но сетевые данные обычно имеют дальняя зависимость временная структура. Самоподобный процесс - это один из способов моделирования динамики сетевых данных с такой большой корреляцией. В этой статье определяется и описывается динамика сетевой передачи данных в контексте самоподобного процесса. Показаны свойства процесса и приведены методы для построение графиков и оценка параметров, моделирующих самоподобие сетевых данных.

Определение

Предполагать быть слабо стационарный (стационарный 2-го порядка) процесс со средним , дисперсия , и автокорреляция функция .Предположим, что автокорреляционная функция имеет форму в качестве , куда и это медленно меняющаяся функция в бесконечность, то есть для всех .Например, и - медленно меняющиеся функции.
Позволять ,куда , обозначают агрегированный точечный ряд по неперекрывающимся блокам размера , для каждого это положительное число.

Точно самоподобный процесс

  • называется в точности самоподобным процессом, если существует автомодельный параметр такой, что имеет то же распределение, что и . Пример точно самоподобного процесса с является Дробный гауссовский шум (FGN) с .

Определение: дробный гауссов шум (FGN)

называется дробным гауссовским шумом, где это Дробное броуновское движение.[1]

самоподобный процесс точно второго порядка

  • называется самоподобным процессом ровно второго порядка, если существует автомодельный параметр такой, что имеет такую ​​же дисперсию и автокорреляцию, что и .

асимптотический самоподобный процесс второго порядка

  • называется асимптотический автомодельный процесс второго порядка с автомодельным параметром если в качестве ,

Некоторые относительные ситуации самоподобных процессов

Дальняя зависимость (LRD)

Предполагать - слабо стационарный (стационарный 2-го порядка) процесс со средним и дисперсия . Автокорреляционная функция (АКФ) запаздывания дан кем-то

Определение:

Слабо стационарный процесс называется «дальнодействующим», если

Процесс, который удовлетворяет в качестве как говорят, имеет долгосрочную зависимость. В спектральная плотность функция дальнодействующей зависимости следует сила закона рядом с исходной точкой. Эквивалентно , имеет дальнодействующую зависимость, если функция спектральной плотности автокорреляционной функции, , имеет вид в качестве куда , медленно меняется на 0.

также см

Медленно убывающие отклонения


Когда автокорреляционная функция автомодельного процесса удовлетворяет в качестве , это означает, что он также удовлетворяет в качестве , куда - конечная положительная постоянная, не зависящая от m, и 0 <β <1.

Оценка параметра самоподобия «H»

R / S анализ

Предположим, что основной процесс - дробный гауссовский шум. Рассмотрим серию , и разреши .

Выборочная дисперсия является

Определение: статистика R / S


Если FGN, то
Рассмотрите возможность использования регрессионной модели:, куда
В частности, для временного ряда длиной разделить данные временного ряда на группирует каждую по размеру , вычислить для каждой группы.
Таким образом, для каждого n мы имеем пары данных ().Есть баллы за каждый , так что мы можем уместить регрессионная модель чтобы оценить точнее. Если наклон линия регрессии находится между 0,5 ~ 1, это самоподобный процесс.

График отклонения от времени

Дисперсия выборочного среднего определяется как .
Для оценки H рассчитайте образец означает за подсерия длины .
Общее среднее значение может быть выражено как , выборочная дисперсия .
Графики дисперсии-времени получены путем построения графика против и мы можем провести простую линию наименьших квадратов через полученные точки на плоскости, игнорируя малые значения k.

Для больших значений , точки на графике должны быть разбросаны по прямой с отрицательным наклоном .Для краткосрочной зависимости или независимости между наблюдениями наклон прямой равен -1.
Самоподобие может быть выведено из значений оцененного наклона, который асимптотически находится между –1 и 0, а оценка степени самоподобия дается выражением

Анализ на основе периодограммы

Приближенная оценка максимального правдоподобия Уиттла (MLE ) применяется для решения параметра Херста через спектральная плотность из . Это не только инструмент для визуализации параметра Херста, но также метод для выполнения некоторых статистических выводов о параметрах с помощью асимптотических свойств MLE. Особенно, следует за Гауссовский процесс. Пусть спектральная плотность ,, куда, и построить модель авторегрессии краткосрочных временных рядов (AR), то есть .

Таким образом, оценка Уиттла из минимизирует функцию , где I (w) обозначает периодограмму X как и . Эти интеграции можно оценить с помощью суммы Римана.

потом асимптотически следует нормальному распределению, если может быть выражена в виде модели бесконечной скользящей средней.

Чтобы оценить , сначала нужно рассчитать эту периодограмму. С - оценка спектральной плотности, ряд с дальнодействующей зависимостью должен иметь периодограмму, пропорциональную близко к происхождению. График периодограммы получается путем нанесения против .
Затем подбирая регрессионную модель на должен дать наклон . Наклон подобранной прямой также является оценкой . Таким образом, оценка получается.

Примечание:
Когда мы применяем метод периодограммы, возникают две общие проблемы. Во-первых, если данные не подчиняются гауссовскому распределению, преобразование данных может решить такие проблемы. Во-вторых, спектр образца, который отклоняется от предполагаемой спектральной плотности, является другим. Для решения этой проблемы предлагается метод агрегирования. Если - гауссовский процесс, а функция спектральной плотности удовлетворяет в качестве , функция,сходится по распределению к FGN как .

Рекомендации

  • П. Уиттл, "Оценка и информация в стационарных временных рядах", ст. Мат. 2, 423-434, 1953.
  • К. ПАРК, У. УИЛЛИНГЕР, Самоподобный сетевой трафик и оценка производительности, WILEY, 2000.
  • У. Э. Леланд, У. Виллинджер, М. С. Такку, Д. В. Уилсон, «О самоподобной природе трафика Ethernet», ACM SIGCOMM Computer Communication Review 25,202-213,1995.
  • У. Виллинджер, М. С. Такку, У. Э. Леланд, Д. В. Уилсон, «Самоподобие в высокоскоростном пакетном трафике: анализ и моделирование измерений трафика Ethernet», Статистическая наука 10,67-85,1995.
  1. ^ У. Э. Леланд, У. Виллинджер, М. С. Такку, Д. В. Уилсон, «О самоподобной природе трафика Ethernet», ACM SIGCOMM Computer Communication Review 25,202-213,1995.