Многосторонний анализ данных - Википедия - Multiway data analysis
Многосторонний анализ данных это метод анализа больших наборов данных путем представления данных в виде многомерный массив. Правильный выбор размеров массива и методов анализа может выявить закономерности в базовых данных, не обнаруженные другими методами.[1]
История
Изучение многостороннего анализа данных было впервые формализовано в результате конференции, проведенной в 1988 году. Результатом этой конференции стал первый текст, специально адресованный этой области, Коппи и Боласко. Многосторонний анализ данных.[2] В то время области применения многостороннего анализа включали статистика, эконометрика и психометрия. В последние годы приложения расширились и стали включать хемометрия, сельское хозяйство, анализ социальных сетей и пищевая промышленность.[3]
Состав многостороннего анализа данных
Многосторонние данные
Аналитики данных Multiway используют термин путь для ссылки на размер данных при сохранении слова Режим для методов или моделей, используемых для анализа данных.[2]:xviii
В этом смысле мы можем определить различные способы данных для анализа:
- Односторонние данные это вектор, с одним значением данных для каждого дискретного или непрерывного значения одного измерения.
- Двусторонние данные это матрица, с одним значением данных для каждого дискретного или непрерывного значения двух отдельных измерений; а электронная таблица может использоваться для визуализации таких данных в случае дискретных размеров.
- Трехсторонние данные можно рассматривать как стек матриц (или, аналогично, как книгу из нескольких электронные таблицы ), добавляя третье измерение. Такие данные могут представлять температуру в разных местах (двусторонние данные), взятые за разное время (третье измерение, приводящее к трехсторонним данным).
- Четырехсторонние данные, используя ту же аналогию с электронными таблицами, можно представить как файловую папку, полную отдельных книг.
- Пятисторонние данные и шестисторонние данные могут быть представлены аналогичным образом более высокими уровнями агрегирования данных.
В общем, несколько измерений, представленных в наборе данных, могут быть измерены в разное время или в разных местах с использованием разных методологий и могут содержать несоответствия, такие как отсутствующие данные или расхождения в представлении данных.
Многоходовая модель
Многостороннее приложение
Многосторонний анализ данных может использоваться в различных многосторонних приложениях для решения проблемы поиска скрытой полилинейной структуры в многосторонних наборах данных. Ниже приведены примеры приложений в различных областях:[4]
- Компьютерное зрение
- Электроаналитическая химия
- Неврология
- Анализ процесса
- Анализ социальных сетей / веб-майнинг
Многосторонняя обработка
Многосторонняя обработка - это выполнение спроектированной и определенной многоходовой модели (моделей), преобразующей многосторонние данные до желаемого уровня путем удовлетворения конкретных потребностей конкретного многостороннего приложения. Типичный пример данных, созданных с помощью потенциометрического электронного языка, иллюстрирует соответствующую многостороннюю обработку.[5]
Смотрите также
Рекомендации
- ^ Coppi, R .; Боласко, С., ред. (1989). Многосторонний анализ данных. Амстердам: Северная Голландия. ISBN 9780444874108.
- ^ а б Крооненберг, Питер М. (2008). Прикладной многосторонний анализ данных. Серия Уайли по вероятности и статистике. 702. Джон Вили и сыновья. п. XV. ISBN 9780470237991.
- ^ Бро, Расмус (20 ноября 1998 г.). Многосторонний анализ в пищевой промышленности: модели, алгоритмы и приложения (PDF) (Кандидатская диссертация). Амстердамский университет.
- ^ Акар, Эврим; Йенер, Бюлент. Неконтролируемый многосторонний анализ данных: обзор литературы (PDF) (Тезис). Политехнический институт Ренсселера.
- ^ Cartas, Рауль; Мимендия, Айтор; Легин, Андрей; дель Валле, Манель (2011). «Многосторонняя обработка данных, генерируемых с помощью потенциометрического электронного языка в системе SIA». Электроанализ. Дои:10.1002 / elan.201000642.