Суррогатные данные - Surrogate data

Суррогатные данные, иногда известный как аналогичные данные,[1] обычно относится к Временные ряды данные, полученные с использованием четко определенных (линейных) моделей, таких как ARMA процессы, которые воспроизводят различные статистические свойства, такие как автокорреляция структура набора измеренных данных.[2] Полученные суррогатные данные затем могут быть использованы, например, для тестирования нелинейной структуры эмпирических данных.

Суррогатные или аналогичные данные могут относиться к данным, используемым для дополнения имеющихся данных, из которых математическая модель построено. Согласно этому определению, он может быть сгенерирован (т. Е. синтетические данные ) или преобразованы из другого источника.[1]

Использует

Суррогатные данные используются в экологических и лабораторных условиях, когда данные исследования из одного источника используются для оценки характеристик другого источника.[3] Например, он использовался для моделирования популяционных тенденций среди видов животных.[4] Его также можно использовать для моделирования биоразнообразия, поскольку было бы сложно собрать фактические данные по всем видам в данном районе.[5]

При прогнозировании могут использоваться суррогатные данные. Данные из аналогичных рядов могут быть объединены для повышения точности прогнозов.[6] Использование суррогатных данных может позволить модели учесть закономерности, не видимые в исторических данных.[7]

Другое использование суррогатных данных - проверка моделей на нелинейность. Период, термин тестирование суррогатных данных относится к алгоритмам, используемым для анализа моделей таким образом.[8] Эти тесты обычно включают генерацию данных, тогда как суррогатные данные в целом могут быть получены или собраны разными способами.[1]

Методы

Один из методов суррогатных данных - найти источник с похожими условиями или параметрами и использовать эти данные при моделировании.[4] Другой метод состоит в том, чтобы сосредоточиться на закономерностях базовой системы и поискать аналогичную закономерность в связанных источниках данных (например, закономерностях в других связанных видах или областях окружающей среды).[5]

Вместо использования существующих данных из отдельного источника, суррогатные данные могут быть получены с помощью статистических процессов,[2] что может включать генерацию случайных данных[1] с использованием ограничений модели или системы.[8]

Смотрите также

Рекомендации

  1. ^ а б c d Кефер, Пол Э. (2015). Преобразование данных аналоговых временных рядов для повышения точности прогнозов спроса на природный газ (Кандидатская диссертация). Marquette University. Получено 2016-02-18.
  2. ^ а б Причард; Тейлер (1994). «Создание суррогатных данных для временных рядов с несколькими одновременно измеряемыми переменными» (PDF). Письма с физическими проверками. 73 (7): 951–954. arXiv:комп-газ / 9405002. Bibcode:1994ПхРвЛ..73..951П. Дои:10.1103 / Physrevlett.73.951. PMID  10057582.
  3. ^ «Значение суррогатных данных». Columbia Analytical Services, Inc., теперь ALS Environmental. Получено 15 февраля, 2017. Что такое суррогатные данные? Данные исследований тестовых организмов или тестируемого вещества, которые используются для оценки характеристик или воздействия на другой организм или вещество.
  4. ^ а б Эрнандес-Камачо, Клаудиа Дж .; Баккер, Виктория. J .; Ауриолес-Гамбоа, Дэвид; Лааке, Джефф; Гербер, Лия Р. (Сентябрь 2015 г.). Аарон В. Рид (ред.). «Использование суррогатных данных в анализе демографической жизнеспособности населения: пример калифорнийских морских львов». PLOS ONE. 10 (9): e0139158. Bibcode:2015PLoSO..1039158H. Дои:10.1371 / journal.pone.0139158. ЧВК  4587556. PMID  26413746.
  5. ^ а б Faith, D.P .; Уокер, П.А. (1996). «Экологическое разнообразие: наилучшее возможное использование суррогатных данных для оценки относительного биоразнообразия наборов территорий». Биоразнообразие и сохранение. Springer Nature. 5 (4): 399–415. Дои:10.1007 / BF00056387.
  6. ^ Дункан, Джордж Т .; Gorr, Wilpen L .; Щипула, Януш (2001). «Прогнозирование аналогичных временных рядов». В Дж. Скотт Армстронг (ред.). Принципы прогнозирования: руководство для исследователей и практиков. Kluwer Academic Publishers. С. 195–213. ISBN  0-7923-7930-6.
  7. ^ Kaefer, Paul E .; Ишола, Бабатунде; Браун, Рональд Х .; Корлисс, Джордж Ф. (2015). Использование суррогатных данных для снижения рисков прогнозирования природного газа в необычные дни (PDF). Международный институт прогнозистов: 35-й Международный симпозиум по прогнозированию. forecasters.org/isf.
  8. ^ а б Шрайбер, Томас; Шмитц, Андреас (1999). «Суррогатный временной ряд». Physica D. 142 (3–4): 346–382. Bibcode:2000PhyD..142..346S. CiteSeerX  10.1.1.46.3999. Дои:10.1016 / s0167-2789 (00) 00043-9.

дальнейшее чтение