Проекционное преследование - Projection pursuit

Преследование проекции (PP) это тип статистического метода, который включает поиск наиболее "интересных" возможных прогнозы в многомерных данных. Часто прогнозы, которые больше отклоняются от нормальное распределение считаются более интересными. При нахождении каждой проекции данные сокращаются путем удаления компонента вдоль этой проекции, и процесс повторяется для поиска новых проекций; это аспект «преследования», который мотивировал технику, известную как подходящее преследование.[1][2]

Идея преследования проекции состоит в том, чтобы определить местонахождение проекции или проекций из многомерное пространство в низкоразмерное пространство, которое раскрывает больше всего деталей о структуре набора данных. Как только интересный набор проекций был найден, существующие структуры (кластеры, поверхности и т. Д.) Могут быть извлечены и проанализированы отдельно.

Проекционное преследование широко использовалось для слепое разделение источников, поэтому это очень важно в независимый компонентный анализ. Слежение за проекцией ищет одну проекцию за раз, так что извлеченный сигнал является как можно более негауссовым.[3]

История

Техника проекционного преследования была первоначально предложена и опробована Крускалом.[4] Связанные идеи встречаются в Switzer (1970) «Числовая классификация», стр. 31-43 в «Компьютерные приложения в науках о Земле: геостатистика, и Switzer and Wright (1971)», «Численная классификация эоценовых нуммулитид», «Математическая геология», стр. 297–311. успешное внедрение связано с Джером Х. Фридман и Джон Тьюки (1974), который назвал погоню за проекцией.

Первоначальная цель поиска проекций заключалась в том, чтобы машины выбрать "интересные" низкоразмерные проекции многомерного облака точек путем численного максимизации определенной целевой функции или индекса проекции. [5].

Несколько лет спустя Фридман и Штютцле расширили идею преследования проекций и добавили регрессия преследования проекции (PPR), классификация проекционного преследования (PPC) и оценка плотности проекционного преследования (PPDE).

Особенность

Самая захватывающая особенность поиска проекций в том, что это один из очень немногих многомерных методов, способных обойти «проклятие размерности», вызванное тем фактом, что многомерное пространство в основном пусто. Кроме того, прогнозирование может игнорировать нерелевантные (т.е. шумные и малоинформативные) переменные. Это явное преимущество перед методами, основанными на расстояниях между точками, такими как минимальные остовные деревья, многомерное масштабирование и большинство методов кластеризации.

Многие методы классического многомерного анализа оказываются частными случаями проекционного преследования. Примеры Анализ главных компонентов и дискриминантный анализ, а методы квартимакса и облимакса в факторный анализ.

Одним из серьезных недостатков методов проекционного преследования является высокая потребность в компьютерном времени.

Смотрите также

использованная литература

  1. ^ Дж. Х. Фридман и Дж. У. Тьюки (сентябрь 1974 г.). «Алгоритм прогнозирования для исследовательского анализа данных» (PDF). Транзакции IEEE на компьютерах. С-23 (9): 881–890. Дои:10.1109 / T-C.1974.224051. ISSN  0018-9340.
  2. ^ М. К. Джонс и Р. Сибсон (1987). «Что такое проекционное преследование?». Журнал Королевского статистического общества, серия A. 150 (1): 1–37. Дои:10.2307/2981662. JSTOR  2981662.
  3. ^ Джеймс В. Стоун (2004 г.); «Независимый компонентный анализ: введение в учебное пособие», MIT Press, Кембридж, Массачусетс, Лондон, Англия; ISBN  0-262-69315-1
  4. ^ Kruskal, JB. 1969; «К практическому методу, который помогает раскрыть структуру набора наблюдений путем нахождения линейного преобразования, которое оптимизирует новый« индекс конденсации »», страницы 427–440 из: Milton, RC, & Nelder, JA (eds), Statistical вычисление; Нью-Йорк, Academic Press
  5. ^ П. Дж. Хубер (июнь 1985 г.). «Погоня за проекцией» (PDF). Анналы статистики. 13 (2): 435–475. Дои:10.1214 / aos / 1176349519.