Многосторонний анализ данных - Википедия - Multiway data analysis

Многосторонний анализ данных это метод анализа больших наборов данных путем представления данных в виде многомерный массив. Правильный выбор размеров массива и методов анализа может выявить закономерности в базовых данных, не обнаруженные другими методами.[1]

История

Изучение многостороннего анализа данных было впервые формализовано в результате конференции, проведенной в 1988 году. Результатом этой конференции стал первый текст, специально адресованный этой области, Коппи и Боласко. Многосторонний анализ данных.[2] В то время области применения многостороннего анализа включали статистика, эконометрика и психометрия. В последние годы приложения расширились и стали включать хемометрия, сельское хозяйство, анализ социальных сетей и пищевая промышленность.[3]

Состав многостороннего анализа данных

Многосторонние данные

Аналитики данных Multiway используют термин путь для ссылки на размер данных при сохранении слова Режим для методов или моделей, используемых для анализа данных.[2]:xviii

В этом смысле мы можем определить различные способы данных для анализа:

  • Односторонние данные это вектор, с одним значением данных для каждого дискретного или непрерывного значения одного измерения.
  • Двусторонние данные это матрица, с одним значением данных для каждого дискретного или непрерывного значения двух отдельных измерений; а электронная таблица может использоваться для визуализации таких данных в случае дискретных размеров.
  • Трехсторонние данные можно рассматривать как стек матриц (или, аналогично, как книгу из нескольких электронные таблицы ), добавляя третье измерение. Такие данные могут представлять температуру в разных местах (двусторонние данные), взятые за разное время (третье измерение, приводящее к трехсторонним данным).
  • Четырехсторонние данные, используя ту же аналогию с электронными таблицами, можно представить как файловую папку, полную отдельных книг.
  • Пятисторонние данные и шестисторонние данные могут быть представлены аналогичным образом более высокими уровнями агрегирования данных.

В общем, несколько измерений, представленных в наборе данных, могут быть измерены в разное время или в разных местах с использованием разных методологий и могут содержать несоответствия, такие как отсутствующие данные или расхождения в представлении данных.

Многоходовая модель

Многостороннее приложение

Многосторонний анализ данных может использоваться в различных многосторонних приложениях для решения проблемы поиска скрытой полилинейной структуры в многосторонних наборах данных. Ниже приведены примеры приложений в различных областях:[4]

Многосторонняя обработка

Многосторонняя обработка - это выполнение спроектированной и определенной многоходовой модели (моделей), преобразующей многосторонние данные до желаемого уровня путем удовлетворения конкретных потребностей конкретного многостороннего приложения. Типичный пример данных, созданных с помощью потенциометрического электронного языка, иллюстрирует соответствующую многостороннюю обработку.[5]

Смотрите также

Рекомендации

  1. ^ Coppi, R .; Боласко, С., ред. (1989). Многосторонний анализ данных. Амстердам: Северная Голландия. ISBN  9780444874108.
  2. ^ а б Крооненберг, Питер М. (2008). Прикладной многосторонний анализ данных. Серия Уайли по вероятности и статистике. 702. Джон Вили и сыновья. п. XV. ISBN  9780470237991.
  3. ^ Бро, Расмус (20 ноября 1998 г.). Многосторонний анализ в пищевой промышленности: модели, алгоритмы и приложения (PDF) (Кандидатская диссертация). Амстердамский университет.
  4. ^ Акар, Эврим; Йенер, Бюлент. Неконтролируемый многосторонний анализ данных: обзор литературы (PDF) (Тезис). Политехнический институт Ренсселера.
  5. ^ Cartas, Рауль; Мимендия, Айтор; Легин, Андрей; дель Валле, Манель (2011). «Многосторонняя обработка данных, генерируемых с помощью потенциометрического электронного языка в системе SIA». Электроанализ. Дои:10.1002 / elan.201000642.