Топологический анализ данных - Topological data analysis

В Прикладная математика, топологический анализ данных (TDA) - это подход к анализу наборов данных с использованием методов из топология. Извлечение информации из многомерных, неполных и зашумленных наборов данных, как правило, является сложной задачей. TDA обеспечивает общую основу для анализа таких данных, не зависящую от конкретных метрика выбран и предоставляет уменьшение размерности и устойчивость к шуму. Помимо этого, он наследует функториальность, фундаментальная концепция современной математики, из-за ее топологической природы, которая позволяет ей адаптироваться к новым математическим инструментам.

Первоначальная мотивация - изучить форму данных. TDA объединила алгебраическая топология и другие инструменты из чистой математики, позволяющие математически строго изучать «форму». Главный инструмент стойкая гомология, адаптация гомология к облако точек данные. Стойкая гомология применяется ко многим типам данных во многих областях. Более того, его математическая основа имеет также теоретическое значение. Уникальные особенности TDA делают его многообещающим мостом между топологией и геометрией.

Основная теория

Интуиция

Предпосылка, лежащая в основе TDA, заключается в том, что форма имеет значение. Реальные данные в больших размерностях почти всегда разрежены и, как правило, имеют соответствующие особенности малых размеров. Одна из задач TDA - дать точную характеристику этого факта. Наглядным примером является простая система хищник-жертва, управляемая Уравнения Лотки – Вольтерра.[1] Нетрудно заметить, что траектория системы образует замкнутый круг в пространстве состояний. TDA предоставляет инструменты для обнаружения и количественной оценки такого повторяющегося движения.[2]

Многие алгоритмы анализа данных, в том числе используемые в TDA, требуют выбора различных параметров. Без предварительного знания предметной области трудно выбрать правильный набор параметров для набора данных. Основная идея стойкая гомология в том, что мы можем использовать информацию, полученную из всех значений параметра. Конечно, одно только это понимание сделать легко; сложная часть - это кодирование этого огромного количества информации в понятную и легкую для представления форму. В случае TDA существует математическая интерпретация, когда информация представляет собой группу гомологии. В целом предполагается, что функции, которые сохраняются для широкого диапазона параметров, являются «истинными» функциями. Признаки, сохраняющиеся только для узкого диапазона параметров, считаются шумом, хотя теоретическое обоснование этого неясно.[3]

Ранняя история

Предшественники полной концепции стойкой гомологии со временем появлялись постепенно.[4] В 1990 году Патрицио Фрозини ввел функцию размера, которая эквивалентна 0-й постоянной гомологии.[5] Спустя почти десять лет Ванесса Робинс изучал образы гомоморфизмов, индуцированных включением.[6] Наконец, вскоре после этого Edelsbrunner et al. представил концепцию устойчивой гомологии вместе с эффективным алгоритмом и его визуализацией в виде диаграммы устойчивости.[7] Карлссон и др. переформулировал первоначальное определение и дал эквивалентный метод визуализации, называемый штрих-кодами стойкости,[8] интерпретация настойчивости на языке коммутативной алгебры.[9]

В алгебраической топологии стойкие гомологии появились благодаря работам Баранникова по теории Морса. Множество критических значений гладкой функции Морса было канонически разбито на пары «рождение-смерть», отфильтрованные комплексы были классифицированы, а визуализация их инвариантов, эквивалентная диаграмме персистентности и штрих-кодам персистентности, была дана в 1994 году канонической формой Баранникова.[10]

Концепции

Ниже представлены некоторые широко используемые концепции. Обратите внимание, что некоторые определения могут отличаться от автора к автору.

А облако точек часто определяется как конечный набор точек в некотором евклидовом пространстве, но может рассматриваться как любое конечное метрическое пространство.

В Чешский комплекс облака точек - это нерв из крышка из шаров фиксированного радиуса вокруг каждой точки в облаке.

А модуль постоянства проиндексировано это векторное пространство для каждого , и линейная карта в любое время , так что для всех и в любое время [11] Эквивалентное определение - это функтор из рассматривается как частично упорядоченное множество к категории векторных пространств.

В стойкая группа гомологии облака точек - это модуль постоянства, определенный как , куда комплекс Чеха радиуса облака точек и группа гомологий.

А штрих-код стойкости это мультимножество интервалов в , а диаграмма устойчивости это мультимножество точек в ().

В Расстояние Вассерштейна между двумя диаграммами устойчивости и определяется как

куда и колеблется в пределах отклонений между и . См. Рисунок 3.1 у Мунка. [12] для иллюстрации.

В расстояние до узкого места между и является

Это частный случай расстояния Вассерштейна, позволяющий .

Базовая недвижимость

Структурная теорема

Первая классификационная теорема для стойких гомологий появилась в 1994 г.[10] через канонические формы Баранникова. Классификационная теорема, интерпретирующая настойчивость на языке коммутативной алгебры, появилась в 2005 году:[9] для конечно порожденного модуля персистентности с полем коэффициенты,

Интуитивно свободные части соответствуют генераторам гомологии, которые появляются на уровне фильтрации и никогда не исчезнут, а торсионные части соответствуют тем, которые появляются на уровне фильтрации и последний для ступени фильтрации (или, что то же самое, исчезают на уровне фильтрации ).[10]

Устойчивая гомология визуализируется с помощью штрих-кода или диаграммы устойчивости. Штрих-код уходит корнями в абстрактную математику. А именно, категория конечных фильтрованных комплексов над полем полупроста. Любой фильтрованный комплекс изоморфен своей канонической форме, прямой сумме одномерных и двумерных простых фильтрованных комплексов.

Стабильность

Стабильность желательна, поскольку она обеспечивает устойчивость к шуму. Если - любое пространство, гомеоморфное симплициальному комплексу, и постоянно приручены[13] функции, то векторные пространства персистентности и конечно представлены, и , куда относится к узкому месту[14] и является отображением, переводящим непрерывную ручную функцию в диаграмму устойчивости ее -я гомология.

Рабочий процесс

Основной рабочий процесс в TDA:[15]

облако точеквложенные комплексымодуль постоянстваштрих-код или диаграмма
  1. Если облако точек, заменить с вложенной семьей симплициальные комплексы (например, комплекс Чех или Виеторис-Рипс). Этот процесс превращает облако точек в фильтрацию симплициальных комплексов. Взятие гомологии каждого комплекса в этой фильтрации дает модуль устойчивости
  2. Примените структурную теорему, чтобы получить параметризованную версию Бетти число, диаграмма настойчивости, или эквивалентно, штрих-код.

Графически говоря,

Обычное использование настойчивости в TDA [16]

Вычисление

Первый алгоритм по всем полям для устойчивых гомологий в алгебраической топологии был описан Баранниковым.[10] путем приведения к каноническому виду верхнетреугольными матрицами. Первый алгоритм стойкой гомологии над был предоставлен Edelsbrunner et al.[7] Зомородян и Карлссон представили первый практический алгоритм для вычисления устойчивых гомологий по всем полям.[9] Книга Эдельсбруннера и Харера дает общее руководство по вычислительной топологии.[17]

Одна из проблем, возникающих при вычислениях, - это выбор комплекса. В Чешский комплекс и Комплекс Виеторис – Рипс наиболее естественны на первый взгляд; однако их размер быстро растет с увеличением количества точек данных. Комплекс Виеториса – Рипса предпочтительнее комплекса Чеха, поскольку его определение проще, а комплекс Чеха требует дополнительных усилий для определения в общем конечном метрическом пространстве. Были изучены эффективные способы снизить вычислительные затраты на гомологии. Например, α-комплекс и комплекс-свидетель используются для уменьшения размера и размера комплексов.[18]

Недавно, Дискретная теория Морса показала многообещающую вычислительную гомологию, потому что может уменьшить данный симплициальный комплекс до гораздо меньшего клеточного комплекса, который гомотопен исходному.[19] Это сокращение фактически может быть выполнено, поскольку комплекс построен с использованием теория матроидов, что приводит к дальнейшему увеличению производительности.[20] Другой недавний алгоритм экономит время, игнорируя классы гомологии с низкой персистентностью.[21]

Доступны различные программные пакеты, такие как javaPlex, Дионис, Персей, PHAT, ДИФА, ГУДИ, Ripser, и TDAstats. Сравнение этих инструментов выполнено Otter et al.[22] Джотто-тда представляет собой пакет Python, предназначенный для интеграции TDA в рабочий процесс машинного обучения с помощью scikit-learn API. Пакет R TDA способен вычислять недавно изобретенные концепции, такие как ландшафт и оценщик расстояния ядра.[23] В Набор инструментов топологии специализирован для непрерывных данных, определенных на коллекторах низкой размерности (1, 2 или 3), как обычно научная визуализация. Другой пакет R, TDAstats, реализует быструю библиотеку C ++ Ripser для вычисления постоянной гомологии.[24] Он также использует повсеместный ggplot2 пакет для создания воспроизводимых, настраиваемых, качественных для публикации визуализаций устойчивой гомологии, в частности топологических штрих-кодов и диаграмм устойчивости. В приведенном ниже примере кода показан пример того, как Язык программирования R может использоваться для вычисления постоянной гомологии.

# установить пакет из CRAN и загрузить наборы данныхinstall.packages(«TDAstats»)библиотека(«TDAstats»)данные("unif2d")данные("circle2d")# вычислить постоянную гомологию для обоих наборов данныхunif.phom <- Calcul_homology(unif2d)Circ.phom <- Calcul_homology(circle2d)# построить равномерно распределенное облако точек как диаграмму устойчивостиplot_persist(unif.phom)# построить круговое облако точек как топологический штрих-код# мы видим одну постоянную полосу, как и ожидалось для круга (один 1 цикл / цикл)plot_barcode(Circ.phom)
Диаграмма устойчивости, созданная с помощью образца кода (unif.2d dataset) для набора из 100 точек, равномерно распределенных в двумерном единичном квадрате. Ни один из 0-циклов или 1-циклов не считается истинным сигналом (ни один из них не существует в пределах облака точек единичного квадрата). Хотя некоторые функции, кажется, сохраняются, отметки на оси показывают, что наиболее стойкая функция сохраняется менее чем на 0,20 единиц, что относительно мало для облака точек на единичном квадрате.
Топологический штрих-код, созданный с помощью образца кода (набор данных circ.2d) для набора из 100 точек, равномерно распределенных по окружности круга. Одиночный длинный одномерный элемент в верхней части штрих-кода представляет собой единственный 1-цикл, представленный в круге.

Визуализация

Данные большого размера невозможно визуализировать напрямую. Было изобретено много методов для извлечения низкоразмерной структуры из набора данных, таких как Анализ главных компонентов и многомерное масштабирование.[25] Однако важно отметить, что сама проблема некорректна, поскольку в одном и том же наборе данных можно найти множество различных топологических характеристик. Таким образом, изучение визуализации пространств высокой размерности имеет центральное значение для TDA, хотя оно не обязательно предполагает использование устойчивой гомологии. Однако в последнее время были предприняты попытки использовать постоянную гомологию при визуализации данных.[26]

Карлссон и др. предложили общий метод, называемый КАРТА.[27] Он наследует идею Серра о том, что покрытие сохраняет гомотопию.[28] Обобщенная формулировка MAPPER выглядит следующим образом:

Позволять и топологические пространства и пусть - непрерывное отображение. Позволять - конечное открытое покрытие . Результат MAPPER - это нерв откатной крышки. , где каждый прообраз разбивается на связанные компоненты.[26] Это очень общая концепция, из которой граф Риба [29] и деревья слияния - особые случаи.

Это не совсем исходное определение.[27] Карлссон и др. выберите быть или же , и накрыть его открытыми множествами, пересекающимися не более чем двумя.[3] Это ограничение означает, что вывод имеет форму сложная сеть. Поскольку топология конечного облака точек тривиальна, методы кластеризации (например, одинарная связь ) используются для создания аналога связанных множеств в прообразе когда MAPPER применяется к фактическим данным.

С математической точки зрения MAPPER - это вариант График Риба. Если не более чем одномерный, то для каждого ,

[30] Дополнительная гибкость также имеет недостатки. Одной из проблем является нестабильность, так как некоторое изменение выбора покрытия может привести к значительному изменению результата работы алгоритма.[31] Была проделана работа по преодолению этой проблемы.[26]

Три успешных применения MAPPER можно найти в Carlsson et al.[32] Комментарий Дж. Карри к приложениям в этой статье заключается в том, что «общая черта, представляющая интерес для приложений, - это наличие бликов или усиков».[33]

Доступна бесплатная реализация MAPPER. онлайн написано Даниэлем Мюлнером и Аравиндакшаном Бабу. MAPPER также составляет основу Аясди Платформа AI.

Многомерная настойчивость

Для TDA важна многомерная настойчивость. Эта концепция возникает как в теории, так и на практике. Первое исследование многомерной персистентности было на ранней стадии разработки TDA,[34] и является одним из учредительных документов TDA.[9] Первое приложение, появившееся в литературе, - это метод сравнения форм, аналогичный изобретению TDA.[35]

Определение п-мерный модуль устойчивости в является[33]

  • векторное пространство присваивается каждой точке в
  • карта назначается, если (
  • карты удовлетворяют для всех

Возможно, стоит отметить, что существуют разногласия по поводу определения многомерной устойчивости.[33]

Одним из преимуществ одномерного постоянства является его представление в виде диаграммы или штрих-кода. Однако дискретных полных инвариантов многомерных модулей персистентности не существует.[36] Основная причина этого в том, что структура коллекции неразложимых элементов чрезвычайно усложняется из-за Теорема Габриэля в теории колчанных представлений,[37] хотя конечно n-мерный модуль сохранения может быть однозначно разложен в прямую сумму неразложимых согласно теореме Крулля-Шмидта.[38]

Тем не менее, многие результаты были получены. Карлссон и Зомородян представили ранговый инвариант , определяемый как , в котором является конечно порожденным n-градуированным модулем. В одном измерении это эквивалент штрих-кода. В литературе ранговый инвариант часто называют постоянными числами Бетти (PBN).[17] Во многих теоретических работах авторы использовали более ограниченное определение, аналог устойчивости подуровневого множества. В частности, постоянство чисел Бетти функции даются функцией , принимая каждый к , куда и .

Некоторые основные свойства включают монотонность и диагональный скачок.[39] Постоянные числа Бетти будут конечными, если - компактное и локально стягиваемое подпространство в .[40]

Используя метод слоения, k-dim PBN могут быть разложены на семейство одномерных PBN с помощью вывода размерности.[41] Этот метод также привел к доказательству устойчивости многомерных сетей PBN.[42] Разрывы PBN возникают только в точках где либо является точкой разрыва или же является точкой разрыва в предположении, что и компактное триангулируемое топологическое пространство.[43]

Постоянное пространство, обобщение устойчивой диаграммы, определяется как мультимножество всех точек с кратностью больше 0 и диагональю.[44] Он обеспечивает стабильное и полное представление о PBN. Текущая работа Carlsson et al. пытается дать геометрическую интерпретацию устойчивой гомологии, которая может дать представление о том, как объединить теорию машинного обучения с топологическим анализом данных.[45]

Первый практический алгоритм вычисления многомерной персистентности был изобретен очень рано.[46] После этого было предложено множество других алгоритмов, основанных на таких концепциях, как дискретная теория Морса.[47] и оценка по конечной выборке.[48]

Другие настойчивости

Стандартная парадигма в TDA часто упоминается как подуровневая настойчивость. Помимо многомерной персистентности, было сделано много работ, чтобы расширить этот частный случай.

Зигзагообразная настойчивость

Ненулевые отображения в модуле сохранения ограничены отношением предварительного порядка в категории. Однако математики пришли к выводу, что единодушие не имеет значения для многих результатов. «Философский момент состоит в том, что теория декомпозиции представлений графа в некоторой степени не зависит от ориентации ребер графа».[49] Настойчивость зигзага важна с теоретической стороны. Все примеры, приведенные в обзорной статье Карлссона, чтобы проиллюстрировать важность функциональности, имеют некоторые общие черты.[3]

Расширенная настойчивость и настойчивость при установке уровней

Некоторые попытки - это потерять более строгое ограничение функции.[50] Пожалуйста, обратитесь к Категории и связки и Влияние на математику разделы для получения дополнительной информации.

Естественно распространить гомологию персистентности на другие базовые понятия алгебраической топологии, такие как когомологии и относительные гомологии / когомологии.[51] Интересным приложением является вычисление круговых координат для набора данных через первую постоянную группу когомологий.[52]

Круговая настойчивость

Гомология нормальной персистентности изучает функции с действительными значениями. Кругозначное отображение может быть полезным, «теория устойчивости для кругозначных отображений обещает сыграть роль для некоторых векторных полей, как и стандартная теория устойчивости для скалярных полей», как прокомментировали D. Burghelea et al.[53] Основное отличие состоит в том, что клетки Джордана (очень похожие по формату на Иорданские блоки в линейной алгебре) нетривиальны в кругозначных функциях, которые были бы равны нулю в вещественнозначном случае, а сочетание со штрих-кодами дает инварианты ручного отображения при умеренных условиях.[53]

Они используют два метода: теория Морса-Новикова.[54] и теория представлений графов.[55] Более свежие результаты можно найти у D. Burghelea et al.[56] Например, требование приручения можно заменить более слабым условием - непрерывным.

Стойкость при кручении

Доказательство структурной теоремы полагается на то, что базовая область является полем, поэтому было сделано не так много попыток гомологии персистентности с кручением. Фрозини определил псевдометрию на этом конкретном модуле и доказал ее устойчивость.[57] Одна из его новинок заключается в том, что определение метрики не зависит от какой-либо теории классификации.[58]

Категории и связки

Одно преимущество теория категорий это его способность поднимать конкретные результаты на более высокий уровень, показывая отношения между, казалось бы, несвязанными объектами. Бубеник и др.[59] предлагает краткое введение в теорию категорий, подходящую для TDA.

Теория категорий - это язык современной алгебры, который широко используется при изучении алгебраической геометрии и топологии. Было отмечено, что «ключевое наблюдение [9] состоит в том, что диаграмма устойчивости, созданная [7] зависит только от алгебраической структуры, которую несет эта диаграмма ».[60] Использование теории категорий в TDA оказалось плодотворным.[59][60]

Следуя обозначениям, сделанным в Bubenik et al.,[60] то категория индексации есть ли предварительно заказанный набор (не обязательно или же ), целевая категория это любая категория (вместо обычно используемой ), и функторы называются обобщенные модули сохраняемости в , над .

Одним из преимуществ использования теории категорий в TDA является более четкое понимание концепций и открытие новых отношений между доказательствами. Для иллюстрации возьмем два примера. Понимание соответствия между перемежением и сопоставлением имеет огромное значение, поскольку сопоставление было методом, используемым вначале (измененным из теории Морса). Краткое изложение работ можно найти в Vin de Silva et al.[61] Многие теоремы гораздо легче доказать в более интуитивной обстановке.[58] Другой пример - взаимосвязь между построением разных комплексов из облаков точек. Давно замечено родство комплексов Чеха и Виеториса-Рипса. Конкретно, .[62] Существенную взаимосвязь между комплексами Чеха и Рипса можно гораздо яснее увидеть на категориальном языке.[61]

Язык теории категорий также помогает формулировать результаты в терминах, понятных для более широкого математического сообщества. Расстояние до узкого места широко используется в TDA из-за результатов устойчивости по отношению к расстоянию до узкого места.[11][14] Фактически, расстояние чередования - это конечный объект в ч.у. категории стабильных метрик на многомерных модулях персистентности в основное поле.[58][63]

Шкивы, центральная концепция в современном алгебраическая геометрия, неразрывно связаны с теорией категорий. Грубо говоря, снопы являются математическим инструментом для понимания того, как локальная информация определяет глобальную информацию. Джастин Карри рассматривает постоянство набора уровней как исследование волокна непрерывных функций. Объекты, которые он изучает, очень похожи на объекты MAPPER, но с теорией пучков в качестве теоретической основы.[33] Хотя никакого прорыва в теории TDA до сих пор не использовалась теория пучков, это многообещающе, поскольку в алгебраической геометрии есть много красивых теорем, относящихся к теории пучков. Например, естественный теоретический вопрос заключается в том, приводят ли разные методы фильтрации к одному и тому же результату.[64]

Стабильность

Стабильность имеет решающее значение для анализа данных, поскольку реальные данные содержат шумы. Используя теорию категорий, Бубеник и др. различали теоремы о мягкой и жесткой устойчивости и доказали, что мягкие случаи формальны.[60] В частности, общий рабочий процесс TDA

данныемодуль топологического сохранениямодуль алгебраической персистентностидискретный инвариант

Теорема мягкой устойчивости утверждает, что является Липшицева непрерывная, а теорема о жесткой устойчивости утверждает, что липшицево.

Расстояние узкого места широко используется в TDA. Теорема изометрии утверждает, что расстояние между перемежением равно расстоянию до узкого места.[58] Бубеник и др. абстрагировали определение до определения между функторами когда снабжен сублинейной проекцией или надлинейным семейством, в котором все еще остается псевдометрическим.[60] Учитывая великолепные символы расстояния между перемежением,[65] здесь мы вводим общее определение расстояния перемежения (вместо первого введенного):[11] Позволять (функция из к который монотонен и удовлетворяет для всех ). А -перемежение между F и G состоит из естественных преобразований и , так что и .

Два основных результата:[60]

  • Позволять быть предварительно упорядоченным набором с сублинейной проекцией или надлинейным семейством. Позволять быть функтором между произвольными категориями . Тогда для любых двух функторов , у нас есть .
  • Позволять быть ч.у. метрического пространства , быть топологическим пространством. И разреши (не обязательно непрерывные) быть функциями, и чтобы быть соответствующей диаграммой устойчивости. потом .

Эти два результата суммируют многие результаты по стабильности различных моделей персистентности.

Для получения информации о теореме устойчивости многомерной стойкости обратитесь к подразделу о стойкости.

Структурная теорема

Структурная теорема имеет центральное значение для TDA; как прокомментировал Г. Карлссон, «то, что делает гомологии полезными в качестве дискриминатора между топологическими пространствами, - это тот факт, что существует теорема классификации для конечно порожденных абелевых групп».[3] (см. основная теорема о конечно порожденных абелевых группах ).

Основным аргументом, использованным при доказательстве исходной структурной теоремы, является стандартный структурная теорема для конечно порожденных модулей над областью главных идеалов.[9] Однако этот аргумент не работает, если набор индексации .[3]

В общем, не каждый модуль сохраняемости можно разложить на интервалы.[66] Было сделано много попыток ослабить ограничения исходной структурной теоремы.[требуется разъяснение ] Случай поточечных конечномерных модулей персистентности, индексированных локально конечным подмножеством решается на основе работы Уэбба.[67] Наиболее заметный результат был получен Кроули-Бови, который решил случай . Теорема Кроули-Бови утверждает, что любой поточечно конечномерный модуль персистентности является прямой суммой интервальных модулей.[68]

Чтобы понять определение его теоремы, необходимо ввести некоторые понятия. An интервал в определяется как подмножество имея свойство, что если и если есть такой, что , тогда также. An интервальный модуль присваивает каждому элементу векторное пространство и присваивает нулевое векторное пространство элементам в . Все карты являются нулевым отображением, если только и , в таком случае это тождественная карта.[33] Модули интервалов неразложимы.[69]

Хотя результат Кроули-Бови является очень сильной теоремой, он все же не распространяется на случай q-tame.[66] Модуль сохраняемости q-tame если ранг конечно для всех . Есть примеры q-ручных модулей персистентности, которые не могут быть поточечно конечными.[70] Однако оказывается, что аналогичная структурная теорема все еще остается в силе, если удаляются признаки, существующие только для одного значения индекса.[69] Это справедливо, потому что бесконечномерные части при каждом значении индекса не сохраняются из-за условия конечного ранга.[71] Формально наблюдаемая категория определяется как , в котором обозначает полную подкатегорию чьими объектами являются эфемерные модули ( в любое время ).[69]

Обратите внимание, что расширенные результаты, перечисленные здесь, не применимы к зигзагообразному постоянству, поскольку аналог модуля зигзагообразного постоянства над не сразу очевидно.

Статистика

Реальные данные всегда конечны, и поэтому их изучение требует от нас учета стохастичности. Статистический анализ дает нам возможность отделить истинные характеристики данных от артефактов, вызванных случайным шумом. Стойкая гомология не имеет внутреннего механизма, позволяющего различать признаки с низкой вероятностью и признаки с высокой вероятностью.

Один из способов применения статистики для анализа топологических данных - изучение статистических свойств топологических характеристик облаков точек. Изучение случайных симплициальных комплексов дает некоторое представление о статистической топологии. K. Turner et al.[72] предлагает резюме работы в этом ключе.

Второй способ - изучить распределения вероятностей в постоянном пространстве. Пространство настойчивости является , куда это пространство всех штрих-кодов, содержащих ровно интервалы и эквивалентности если .[73] Это пространство довольно сложное; например, он не является полным по метрике «узкое место». Первая попытка его изучения сделана Ю. Милейко и соавт.[74] Пространство диаграмм устойчивости в их статье определяется как

куда это диагональная линия в . Приятное свойство в том, что полна и отделима в метрике Вассерштейна . Ожидание, дисперсия и условная вероятность могут быть определены в Fréchet sense. Это позволяет перенести в TDA многие статистические инструменты. Работает на проверка значимости нулевой гипотезы,[75] доверительные интервалы,[76] и надежные оценки[77] заметные шаги.

Третий способ - рассматривать когомологии вероятностного пространства или статистических систем напрямую, называемые информационными структурами и в основном состоящие из тройки (), пространство выборки, случайные величины и вероятностные законы [78] [79]. Случайные переменные рассматриваются как части n атомных вероятностей (рассматриваемых как вероятностный (n-1) -симплекс, ) на решетке разбиений (). Случайные величины или модули измеримых функций образуют коцепные комплексы, в то время как кограница рассматривается как общая гомологическая алгебра, впервые обнаруженная Хохшильдом с левым действием, реализующим действие обусловливания. Первое условие коцикла соответствует цепному правилу энтропии, позволяя однозначно получить с точностью до мультипликативной константы энтропию Шеннона как первый класс когомологий. Рассмотрение деформированного левого действия обобщает фреймворк на энтропии Тсаллиса. Информационные когомологии - это пример окольцованных топосов. Многомерный k-Взаимная информация появляются в выражениях кограниц, и их обращение в нуль, связанное с условием коцикла, дает эквивалентные условия статистической независимости [80]. Минимумы взаимной информации, также называемые синергизмом, порождают интересные конфигурации независимости, аналогичные гомотопическим связям. Из-за его комбинаторной сложности на данных был исследован только симплициальный подслучай когомологий и информационной структуры. В применении к данным эти когомологические инструменты количественно определяют статистические зависимости и независимость, включая Цепи Маркова и условная независимость, в многомерном случае [81]. Примечательно, что взаимная информация обобщает коэффициент корреляции и ковариация нелинейным статистическим зависимостям. Эти подходы были разработаны независимо и лишь косвенно связаны с методами персистентности, но могут быть примерно поняты в симплициальном случае с использованием теоремы Ху Куо Тина, которая устанавливает взаимно однозначное соответствие между функциями взаимной информации и конечной измеримой функцией множества с оператором пересечения. , чтобы построить Чешский комплекс скелет. Информационная когомология предлагает некоторую прямую интерпретацию и применение с точки зрения нейробиологии (теория нейронной сборки и качественное познание). [82]), статистической физики и глубокой нейронной сети, для которых структура и алгоритм обучения задаются комплексом случайных величин и правилом информационной цепочки [83].

Пейзажи персистентности, представленные Петером Бубеником, представляют собой другой способ представления штрих-кодов, более поддающийся статистическому анализу.[84] В настойчивый пейзаж постоянного модуля определяется как функция , , куда обозначает расширенная реальная линия и . Пространство ландшафтов персистентности очень хорошее: оно наследует все хорошие свойства представления штрих-кода (стабильность, простота представления и т. Д.), Но статистические величины могут быть легко определены, и некоторые проблемы в работе Ю. Милейко и др., Такие как как неединственность ожиданий,[74] можно преодолеть. Доступны эффективные алгоритмы вычислений с постоянными ландшафтами.[85] Другой подход заключается в использовании измененной персистентности, которая представляет собой постоянство образа, ядра и коядра.[86]

Приложения

Классификация приложений

Существует несколько способов классификации приложений TDA. Пожалуй, самый естественный способ - по полю. Очень неполный список успешных приложений включает [87] скелетизация данных,[88] исследование формы,[89] реконструкция графа,[90][91][92] [93][94]анализ изображений,[95][96] материал[97] анализ прогрессирования заболевания,[98][99] сенсорная сеть,[62] анализ сигналов,[100] космическая паутина[101] сложная сеть,[102][103][104][105] фрактальная геометрия[106] вирусная эволюция,[107] распространение инфекций в сетях,[108] классификация бактерий с помощью молекулярной спектроскопии,[109] гиперспектральная визуализация в физико-химии [110] и дистанционное зондирование.[111]

Другой способ - выделить техники Дж. Карлссона,[73]

один из них - изучение гомологических инвариантов данных, отдельных наборов данных, а другой - использование гомологических инвариантов при изучении баз данных, где сами точки данных имеют геометрическую структуру.

Характеристики ТДА в приложениях

В последних приложениях TDA есть несколько примечательных интересных особенностей:

  1. Объединение инструментов из нескольких разделов математики. Помимо очевидной потребности в алгебре и топологии, уравнения в частных производных,[112] алгебраическая геометрия,[36] теория представлений,[49] статистика, комбинаторика и риманова геометрия[71] все нашли применение в TDA.
  2. Количественный анализ. Топология считается очень мягкой, поскольку многие понятия инвариантны относительно гомотопии. Тем не менее, постоянная топология способна регистрировать рождение (появление) и смерть (исчезновение) топологических объектов, поэтому в нее встроена дополнительная геометрическая информация. Теоретически одно доказательство - это частично положительный результат об уникальности восстановления кривых;[113] два из них касаются количественного анализа стабильности фуллерена и количественного анализа самоподобие, раздельно.[106][114]
  3. Роль непродолжительной настойчивости. Было обнаружено, что кратковременная настойчивость также полезна, несмотря на распространенное мнение, что причиной явления является шум.[115] Это интересно для математической теории.

Одним из основных направлений анализа данных сегодня является машинное обучение. Некоторые примеры машинного обучения в TDA можно найти в Adcock et al.[116] А конференция посвящен связи между TDA и машинным обучением. Чтобы применить инструменты машинного обучения, информация, полученная из TDA, должна быть представлена ​​в векторной форме. Постоянная и многообещающая попытка - это описанный выше ландшафт настойчивости. Другая попытка использует концепцию постоянства изображений.[117] Однако одной из проблем этого метода является потеря устойчивости, поскольку теорема о жесткой устойчивости зависит от представления штрих-кода.

Влияние на математику

Анализ топологических данных и постоянная гомология оказали влияние на Теория Морса. Теория Морса сыграла очень важную роль в теории TDA, в том числе в области вычислений. Некоторые работы по стойким гомологиям расширили результаты о функциях Морса для приручения функций или даже для непрерывных функций. Забытый результат Р. Деёвеля задолго до изобретения стойких гомологий распространяет теорию Морса на все непрерывные функции.[118]

Один из недавних результатов состоит в том, что категория Графики Риба эквивалентно определенному классу пучка.[119] Это мотивировано теоретической работой в TDA, поскольку граф Риба связан с теорией Морса, а MAPPER является производным от нее. Доказательство этой теоремы опирается на расстояние перемежения.

Стойкая гомология тесно связана с спектральные последовательности.[120] [121] В частности, алгоритм, приводящий фильтрованный комплекс к его каноническому виду[10] позволяет намного быстрее вычислять спектральные последовательности, чем стандартная процедура вычисления группирует постранично. Постоянство зигзага может иметь теоретическое значение для спектральных последовательностей.

Смотрите также

Рекомендации

  1. ^ Эпштейн, Чарльз; Карлссон, Гуннар; Эдельсбруннер, Герберт (2011-12-01). «Топологический анализ данных». Обратные задачи. 27 (12): 120201. arXiv:1609.08227. Bibcode:2011InvPr..27a0101E. Дои:10.1088/0266-5611/27/12/120201.
  2. ^ "diva-portal.org/smash/record.jsf?pid=diva2%253A575329&dswid=4297". www.diva-portal.org. Архивировано из оригинал 19 ноября 2015 г.. Получено 2015-11-05.
  3. ^ а б c d е Карлссон, Гуннар (01.01.2009). «Топология и данные». Бюллетень Американского математического общества. 46 (2): 255–308. Дои:10.1090 / S0273-0979-09-01249-X. ISSN  0273-0979.
  4. ^ Эдельсбруннер Х. Устойчивая гомология: теория и практика [J]. 2014 г.
  5. ^ Фрозини, Патрицио (01.12.1990). «Расстояние для классов подобия подмногообразий евклидова пространства». Бюллетень Австралийского математического общества. 42 (3): 407–415. Дои:10.1017 / S0004972700028574. ISSN  1755-1633.
  6. ^ Робинс V. К вычислению гомологий по конечным приближениям [C] // Труды по топологии. 1999, 24 (1): 503-532.
  7. ^ а б c Эдельсбруннер; Летчер; Зомородян (01.11.2002). «Топологическая устойчивость и упрощение». Дискретная и вычислительная геометрия. 28 (4): 511–533. Дои:10.1007 / s00454-002-2885-2. ISSN  0179-5376.
  8. ^ Карлссон, Гуннар; Зомородян, Афра; Коллинз, Энн; Гибас, Леонидас Дж. (2005-12-01). «Штрих-коды стойкости для фигур». Международный журнал моделирования форм. 11 (2): 149–187. CiteSeerX  10.1.1.5.2718. Дои:10.1142 / S0218654305000761. ISSN  0218-6543.
  9. ^ а б c d е ж Зомородян, Афра; Карлссон, Гуннар (19 ноября 2004 г.). «Вычисление стойких гомологий». Дискретная и вычислительная геометрия. 33 (2): 249–274. Дои:10.1007 / s00454-004-1146-у. ISSN  0179-5376.
  10. ^ а б c d е Баранников, Сергей (1994). «Обрамленный комплекс Морса и его инварианты». Успехи советской математики. 21: 93–115.
  11. ^ а б c Шазаль, Фредерик; Коэн-Штайнер, Дэвид; Глисс, Марк; Guibas, Leonidas J .; Удот, Стив Ю. (1 января 2009 г.). Близость модулей персистентности и их диаграммы.. Материалы двадцать пятого ежегодного симпозиума по вычислительной геометрии. SCG '09. Нью-Йорк, Нью-Йорк, США: ACM. С. 237–246. CiteSeerX  10.1.1.473.2112. Дои:10.1145/1542362.1542407. ISBN  978-1-60558-501-7. S2CID  840484.
  12. ^ Мунк Э. Применения устойчивых гомологий к системам, меняющимся во времени [D]. Университет Дьюка, 2013.
  13. ^ Шихман, Владимир (2011). Топологические аспекты негладкой оптимизации.. Springer Science & Business Media. С. 169–170. ISBN  9781461418979. Получено 22 ноября 2017.
  14. ^ а б Коэн-Штайнер, Дэвид; Эдельсбруннер, Герберт; Харер, Джон (12 декабря 2006 г.). «Диаграммы устойчивости». Дискретная и вычислительная геометрия. 37 (1): 103–120. Дои:10.1007 / s00454-006-1276-5. ISSN  0179-5376.
  15. ^ Грист, Роберт (01.01.2008). «Штрих-коды: постоянная топология данных». Бюллетень Американского математического общества. 45 (1): 61–75. Дои:10.1090 / S0273-0979-07-01191-3. ISSN  0273-0979.
  16. ^ Шазаль, Фредерик; Глисс, Марк; Лабрюер, Катрин; Мишель, Бертран (27 мая 2013 г.). «Оптимальные скорости сходимости для диаграмм устойчивости в топологическом анализе данных». arXiv:1305.6239 [math.ST ].
  17. ^ а б Эдельсбруннер, Герберт; Харер, Джон (01.01.2010). Вычислительная топология: введение. American Mathematical Soc. ISBN  9780821849255.
  18. ^ Де Сильва, Вин; Карлссон, Гуннар (01.01.2004). Топологическое оценивание с использованием комплексов свидетелей. Материалы первой конференции Eurographics по точечной графике. СПБГ'04. Aire-la-Ville, Швейцария, Швейцария: Еврографическая ассоциация. С. 157–166. Дои:10.2312 / SPBG / SPBG04 / 157-166. ISBN  978-3-905673-09-8.
  19. ^ Мишайков, Константин; Нанда, Видит (27 июля 2013 г.). "Теория Морса для фильтрации и эффективного вычисления стойких гомологий". Дискретная и вычислительная геометрия. 50 (2): 330–353. Дои:10.1007 / s00454-013-9529-6. ISSN  0179-5376.
  20. ^ Хенсельман, Грегори; Грист, Роберт (1 июня 2016 г.). «Матроидные фильтрации и вычислительные стойкие гомологии». arXiv:1606.00199. Bibcode:2016arXiv160600199H. Цитировать журнал требует | журнал = (помощь)
  21. ^ Чен, Чао; Кербер, Майкл (01.05.2013). «Чувствительный к выходу алгоритм для постоянной гомологии». Вычислительная геометрия. 27-й ежегодный симпозиум по вычислительной геометрии (SoCG 2011). 46 (4): 435–447. Дои:10.1016 / j.comgeo.2012.02.010.
  22. ^ Выдра, Нина; Портер, Мейсон А .; Тилльманн, Ульрике; Гриндрод, Питер; Харрингтон, Хизер А. (2015-06-29). «Дорожная карта для вычисления устойчивой гомологии». EPJ Data Science. 6 (1): 17. arXiv:1506.08903. Bibcode:2015arXiv150608903O. Дои:10.1140 / epjds / s13688-017-0109-5. ЧВК  6979512. PMID  32025466.
  23. ^ Фаси, Бриттани Тереза; Ким, Джису; Леччи, Фабрицио; Мария, Клеман (07.11.2014). «Введение в пакет R TDA». arXiv:1411.1830 [cs.MS ].
  24. ^ Вадхва, Рауль; Уильямсон, Дрю; Дхаван, Эндрю; Скотт, Джейкоб (2018). «TDAstats: конвейер R для вычисления устойчивой гомологии при анализе топологических данных». Журнал открытого программного обеспечения. 3 (28): 860. Bibcode:2018JOSS .... 3..860R. Дои:10.21105 / joss.00860.
  25. ^ Лю С., Мальовец Д., Ван Б. и др. Визуализация многомерных данных: достижения за последнее десятилетие [J].
  26. ^ а б c Дей, Тамал К.; Мемоли, Факундо; Ван, Юсу (2015-04-14). «Mutiscale Mapper: основа для топологического обобщения данных и карт». arXiv:1504.03763 [cs.CG ].
  27. ^ а б «Превышен предел загрузки». CiteSeerX  10.1.1.161.8956. Цитировать журнал требует | журнал = (помощь)
  28. ^ Ботт, Рауль; Ту, Лоринг У. (2013-04-17). Дифференциальные формы в алгебраической топологии. Springer Science & Business Media. ISBN  978-1-4757-3951-0.
  29. ^ Паскуччи, Валерио; Скорцелли, Джорджио; Бремер, Пер-Тимо; Маскаренхас, Аджит (2007). «Надежное онлайн-вычисление графиков Риба: простота и скорость». Транзакции ACM на графике. 33: 58.1–58.9. Дои:10.1145/1275808.1276449.
  30. ^ Карри, Джастин (2013-03-13). «Пучки, пучки и аппликации». arXiv:1303.3255 [math.AT ].
  31. ^ Лю, Сюй; Се, Чжэн; Йи, Донъюнь (01.01.2012). «Быстрый алгоритм построения топологической структуры в больших данных». Гомологии, гомотопии и приложения. 14 (1): 221–238. Дои:10.4310 / hha.2012.v14.n1.a11. ISSN  1532-0073.
  32. ^ Lum, P. Y .; Singh, G .; Lehman, A .; Ишканов, Т .; Vejdemo-Johansson, M .; Alagappan, M .; Carlsson, J .; Карлссон, Г. (07.02.2013). «Извлечение информации из формы сложных данных с использованием топологии». Научные отчеты. 3: 1236. Bibcode:2013НатСР ... 3Э1236Л. Дои:10.1038 / srep01236. ЧВК  3566620. PMID  23393618.
  33. ^ а б c d е Карри, Джастин (2014-11-03). «Топологический анализ данных и косуки». arXiv:1411.0613 [math.AT ].
  34. ^ Фрозини П., Мулаццани М. Гомотопические группы размера для вычисления расстояний естественного размера [J]. Бюллетень Бельгийского математического общества Саймон Стевин, 1999, 6 (3): 455-464.
  35. ^ Biasotti, S .; Cerri, A .; Frosini, P .; Георгий, Д .; Ланди, К. (17 мая 2008 г.). «Функции многомерного размера для сравнения форм». Журнал математической визуализации и зрения. 32 (2): 161–179. Дои:10.1007 / s10851-008-0096-z. ISSN  0924-9907. S2CID  13372132.
  36. ^ а б Карлссон, Гуннар; Зомородян, Афра (24.04.2009). «Теория многомерной персистентности». Дискретная и вычислительная геометрия. 42 (1): 71–93. Дои:10.1007 / s00454-009-9176-0. ISSN  0179-5376.
  37. ^ Дерксен Х., Вейман Дж. Представления колчана [J]. Уведомления AMS, 2005, 52 (2): 200-206.
  38. ^ Атья М. Ф. О теореме Крулля-Шмидта в приложении к пучкам [J]. Bulletin de la Société Mathématique de France, 1956, 84: 307-317.
  39. ^ Черри А., Ди Фабио Б., Ферри М. и др. Многомерные стойкие гомологии стабильны [J]. arXiv:0908.0064, 2009.
  40. ^ Кальяри, Франческа; Ланди, Клаудия (2011-04-01). «Конечность ранговых инвариантов многомерных стойких групп гомологий». Письма по прикладной математике. 24 (4): 516–518. arXiv:1001.0358. Дои:10.1016 / j.aml.2010.11.004. S2CID  14337220.
  41. ^ Кальяри, Франческа; Ди Фабио, Барбара; Ферри, Массимо (01.01.2010). «Одномерная редукция многомерных стойких гомологий». Труды Американского математического общества. 138 (8): 3003–3017. arXiv:математика / 0702713. Дои:10.1090 / S0002-9939-10-10312-8. ISSN  0002-9939. S2CID  18284958.
  42. ^ Черри, Андреа; Фабио, Барбара Ди; Ферри, Массимо; Фрозини, Патрицио; Ланди, Клаудия (1 августа 2013 г.). «Числа Бетти в многомерных стойких гомологиях являются стабильными функциями». Математические методы в прикладных науках. 36 (12): 1543–1557. Bibcode:2013MMAS ... 36.1543C. Дои:10.1002 / mma.2704. ISSN  1099-1476.
  43. ^ Черри, Андреа; Фрозини, Патрицио (2015-03-15). «Необходимые условия разрывов многомерных персистентных чисел Бетти». Математические методы в прикладных науках. 38 (4): 617–629. Bibcode:2015MMAS ... 38..617C. Дои:10.1002 / mma.3093. ISSN  1099-1476.
  44. ^ Черри, Андреа; Ланди, Клаудия (2013-03-20). Гонсалес-Диас, Росио; Хименес, Мария-Хосе; Медрано, Белен (ред.). Пространство персистентности в многомерных персистентных гомологиях. Конспект лекций по информатике. Springer Berlin Heidelberg. С. 180–191. Дои:10.1007/978-3-642-37067-0_16. ISBN  978-3-642-37066-3.
  45. ^ Скрызалин, Яцек; Карлссон, Гуннар (14 ноября 2014 г.). «Числовые инварианты из многомерной персистентности». arXiv:1411.4022 [cs.CG ].
  46. ^ Карлссон, Гуннар; Сингх, Гурджит; Зомородян, Афра (16.12.2009). Дун, Инфэй; Ду, Дин-Чжу; Ибарра, Оскар (ред.). Вычисление многомерной персистентности. Конспект лекций по информатике. Springer Berlin Heidelberg. С. 730–739. CiteSeerX  10.1.1.313.7004. Дои:10.1007/978-3-642-10631-6_74. ISBN  978-3-642-10630-9. S2CID  15529723.
  47. ^ Аллили, Маджид; Качиньский, Томаш; Ланди, Клаудия (30 октября 2013 г.). «Редукционные комплексы в теории многомерных устойчивых гомологий». arXiv:1310.8089 [cs.CG ].
  48. ^ Cavazza N, Ferri M, Landi C. Оценка многомерных устойчивых гомологий с помощью конечной выборки [J]. 2010 г.
  49. ^ а б Карлссон, Гуннар; Сильва, Вин де (2010-04-21). «Зигзагообразное упорство». Основы вычислительной математики. 10 (4): 367–405. Дои:10.1007 / s10208-010-9066-0. ISSN  1615-3375.
  50. ^ Коэн-Штайнер, Дэвид; Эдельсбруннер, Герберт; Харер, Джон (2008-04-04). «Расширение настойчивости с использованием двойственности Пуанкаре и Лефшеца». Основы вычислительной математики. 9 (1): 79–103. Дои:10.1007 / s10208-008-9027-z. ISSN  1615-3375. S2CID  33297537.
  51. ^ де Сильва, Вин; Морозов Дмитрий; Вейдемо-Йоханссон, Микаэль (2011). «Двойственности в стойких (ко) гомологиях». Обратные задачи. 27 (12): 124003. arXiv:1107.5665. Bibcode:2011InvPr..27l4003D. Дои:10.1088/0266-5611/27/12/124003. S2CID  5706682.
  52. ^ Сильва, Вин де; Морозов Дмитрий; Вейдемо-Йоханссон, Микаэль (30 марта 2011 г.). «Постоянные когомологии и круговые координаты». Дискретная и вычислительная геометрия. 45 (4): 737–759. arXiv:0905.4887. Дои:10.1007 / s00454-011-9344-х. ISSN  0179-5376. S2CID  31480083.
  53. ^ а б Burghelea, Дан; Дей, Тамал К. (2013-04-09). «Топологическая устойчивость для карт с круговыми значениями». Дискретная и вычислительная геометрия. 50 (1): 69–98. arXiv:1104.5646. Дои:10.1007 / s00454-013-9497-х. ISSN  0179-5376. S2CID  17407953.
  54. ^ Новиков С. П. Квазипериодические структуры в топологии [C] // Топологические методы в современной математике, Труды симпозиума в честь шестидесятилетия Джона Милнора, проходившего в Государственном университете Нью-Йорка, Стоуни-Брук, Нью-Йорк. 1991: 223-233.
  55. ^ Гросс, Джонатан Л .; Йеллен, Джей (2004-06-02). Справочник по теории графов. CRC Press. ISBN  978-0-203-49020-4.
  56. ^ Burghelea, Дан; Халлер, Стефан (4 июня 2015 г.). «Топология угловых отображений, штрих-кодов и жордановых блоков». arXiv:1303.4328 [math.AT ].
  57. ^ Фрозини, Патрицио (23.06.2012). «Устойчивое сравнение многомерных персистентных групп гомологий с кручением». Acta Applicandae Mathematicae. 124 (1): 43–54. arXiv:1012.4169. Дои:10.1007 / s10440-012-9769-0. ISSN  0167-8019. S2CID  4809929.
  58. ^ а б c d Лесник, Майкл (2015-03-24). "Теория расстояния перемежения на модулях многомерного постоянства". Основы вычислительной математики. 15 (3): 613–650. arXiv:1106.5305. Дои:10.1007 / s10208-015-9255-у. ISSN  1615-3375. S2CID  17184609.
  59. ^ а б Бубеник, Петр; Скотт, Джонатан А. (28 января 2014 г.). «Категоризация стойких гомологий». Дискретная и вычислительная геометрия. 51 (3): 600–627. arXiv:1205.3669. Дои:10.1007 / s00454-014-9573-х. ISSN  0179-5376. S2CID  11056619.
  60. ^ а б c d е ж Бубеник, Петр; Сильва, Вин де; Скотт, Джонатан (09.10.2014). «Метрики для модулей обобщенного постоянства». Основы вычислительной математики. 15 (6): 1501–1531. CiteSeerX  10.1.1.748.3101. Дои:10.1007 / s10208-014-9229-5. ISSN  1615-3375. S2CID  16351674.
  61. ^ а б де Сильва, Вин; Нанда, Видит (01.01.2013). Геометрия в пространстве модулей постоянства. Материалы двадцать девятого ежегодного симпозиума по вычислительной геометрии. SoCG '13. Нью-Йорк, Нью-Йорк, США: ACM. С. 397–404. Дои:10.1145/2462356.2462402. ISBN  978-1-4503-2031-3. S2CID  16326608.
  62. ^ а б Де Сильва В., Грист Р. Покрытие сенсорных сетей посредством постоянной гомологии [J]. Алгебраическая и геометрическая топология, 2007, 7 (1): 339-358.
  63. ^ д’Амико, Микеле; Фрозини, Патрицио; Ланди, Клаудия (2008-10-14). «Естественное псевдодистанция и оптимальное соответствие между функциями уменьшенного размера». Acta Applicandae Mathematicae. 109 (2): 527–554. arXiv:0804.3500. Bibcode:2008arXiv0804.3500D. Дои:10.1007 / s10440-008-9332-1. ISSN  0167-8019. S2CID  1704971.
  64. ^ Di Fabio, B .; Фрозини, П. (1 августа 2013 г.). «Фильтрации, индуцированные непрерывными функциями». Топология и ее приложения. 160 (12): 1413–1422. arXiv:1304.1268. Bibcode:2013arXiv1304.1268D. Дои:10.1016 / j.topol.2013.05.013. S2CID  13971804.
  65. ^ Лесник, Майкл (2012-06-06). "Многомерные перемежения и приложения к топологическому выводу". arXiv:1206.1365 [math.AT ].
  66. ^ а б Чазаль, Фредерик; де Сильва, Вин; Глисс, Марк; Удот, Стив (16.07.2012). «Структура и устойчивость модулей персистентности». arXiv:1207.3674 [math.AT ].
  67. ^ Уэбб, Кэри (1 января 1985). «Декомпозиция градуированных модулей». Труды Американского математического общества. 94 (4): 565–571. Дои:10.1090 / S0002-9939-1985-0792261-6. ISSN  0002-9939.
  68. ^ Кроули-Боеви, Уильям (2015). «Разложение поточечно конечномерных модулей персистентности». Журнал алгебры и ее приложений. 14 (5): 1550066. arXiv:1210.0819. Дои:10.1142 / s0219498815500668. S2CID  119635797.
  69. ^ а б c Чазаль, Фредерик; Кроули-Боеви, Уильям; де Сильва, Вин (2014-05-22). «Наблюдаемая структура модулей персистентности». arXiv:1405.5644 [math.RT ].
  70. ^ Дроз, Жан-Мари (2012-10-15). «Подмножество евклидова пространства с большими гомологиями Вьеториса-Рипса». arXiv:1210.4097 [math.GT ].
  71. ^ а б Вайнбергер С. Что такое ... стойкая гомология? [J]. Уведомления AMS, 2011, 58 (1): 36-39.
  72. ^ Тернер, Кэтрин; Милейко, Юрий; Мукерджи, Саян; Харер, Джон (12.07.2014). "Средство Фреше для распределений диаграмм постоянства". Дискретная и вычислительная геометрия. 52 (1): 44–70. arXiv:1206.2790. Дои:10.1007 / s00454-014-9604-7. ISSN  0179-5376. S2CID  14293062.
  73. ^ а б Карлссон, Гуннар (01.05.2014). «Распознавание топологических образов для данных облака точек». Acta Numerica. 23: 289–368. Дои:10.1017 / S0962492914000051. ISSN  1474-0508.
  74. ^ а б Милейко, Юрий; Мукерджи, Саян; Харер, Джон (2011-11-10). «Вероятностные меры на пространстве диаграмм устойчивости». Обратные задачи. 27 (12): 124007. Bibcode:2011InvPr..27l4007M. Дои:10.1088/0266-5611/27/12/124007. ISSN  0266-5611. S2CID  250676.
  75. ^ Робинсон, Эндрю; Тернер, Кэтрин (2013-10-28). «Проверка гипотез для анализа топологических данных». arXiv:1310.7467 [stat.AP ].
  76. ^ Фаси, Бриттани Тереза; Леччи, Фабрицио; Ринальдо, Алессандро; Вассерман, Ларри; Балакришнан, Шивараман; Сингх, Арти (01.12.2014). «Наборы уверенности для диаграмм стойкости». Анналы статистики. 42 (6): 2301–2339. Дои:10.1214 / 14-AOS1252. ISSN  0090-5364.
  77. ^ Блумберг, Эндрю Дж .; Гал, Итамар; Mandell, Michael A .; Пансия, Мэтью (15.05.2014). «Робастная статистика, проверка гипотез и доверительные интервалы для устойчивых гомологий на пространствах метрических мер». Основы вычислительной математики. 14 (4): 745–789. arXiv:1206.4581. Дои:10.1007 / s10208-014-9201-4. ISSN  1615-3375. S2CID  17150103.
  78. ^ Бодо, Пьер; Беннекен, Даниэль (2015). «Гомологическая природа энтропии». Энтропия. 17 (5): 3253–3318. Bibcode:2015 Энтрп..17.3253Б. Дои:10.3390 / e17053253.
  79. ^ Виньо, Хуан-Пабло (2019). «Топология статистических систем: когомологический подход к теории информации» (PDF). Рукопись доктора философии: 0–226.
  80. ^ Бодо, Пьер; Тапиа, Моника; Беннекен, Даниэль; Гоайяр, Жан-Марк (2019). «Анализ топологической информации». Энтропия. 21 (9): 881. Bibcode:2019Entrp..21..881B. Дои:10.3390 / e21090881.
  81. ^ Тапиа, Моника; др. и др. (2018). «Идентичность нейротрансмиттера и электрофизиологический фенотип генетически связаны в дофаминергических нейронах среднего мозга». Научные отчеты. 8 (1): 13637. Bibcode:2018НатСР ... 813637Т. Дои:10.1038 / s41598-018-31765-z. ЧВК  6134142. PMID  30206240.
  82. ^ Бодо, Пьер (2019). «Элементы качественного познания: перспектива информационной топологии». Обзоры физики жизни. 31: 263–275. arXiv:1807.04520. Bibcode:2019ФЛРв..31..263Б. Дои:10.1016 / j.plrev.2019.10.003. PMID  31679788.
  83. ^ Бодо, Пьер (2019). "Машина Пуанкаре-Шеннона: статистическая физика и аспекты машинного обучения информационных когомологий". Энтропия. 21 (9): 881. Bibcode:2019Entrp..21..881B. Дои:10.3390 / e21090881.
  84. ^ Бубеник, Питер (26.07.2012). «Статистический анализ топологических данных с использованием постоянных ландшафтов». arXiv:1207.6437 [math.AT ].
  85. ^ Бубеник, Петр; Длотко, Павел (31 декабря 2014). «Набор инструментов для топологической статистики». Журнал символических вычислений. 78: 91–114. arXiv:1501.00179. Bibcode:2015arXiv150100179B. Дои:10.1016 / j.jsc.2016.03.009. S2CID  9789489.
  86. ^ Коэн-Штайнер, Дэвид; Эдельсбруннер, Герберт; Харер, Джон; Морозов, Дмитрий (2009). Материалы двадцатого ежегодного симпозиума ACM-SIAM по дискретным алгоритмам. С. 1011–1020. CiteSeerX  10.1.1.179.3236. Дои:10.1137/1.9781611973068.110. ISBN  978-0-89871-680-1.
  87. ^ Курлин, В. (2015). «Одномерный гомологически стойкий каркас неструктурированного облака точек в любом метрическом пространстве» (PDF). Форум компьютерной графики (CGF). 34 (5): 253–262. Дои:10.1111 / cgf.12713. S2CID  10610111.
  88. ^ Курлин, В. (2014). «Быстрый и надежный алгоритм для подсчета топологически стойких дыр в зашумленных облаках». Конференция IEEE 2014 года по компьютерному зрению и распознаванию образов (PDF). Конференция IEEE по компьютерному зрению и распознаванию образов. С. 1458–1463. arXiv:1312.1492. Дои:10.1109 / CVPR.2014.189. ISBN  978-1-4799-5118-5. S2CID  10118087.
  89. ^ Курлин, В. (2015). «Гомологически стойкий скелет - это быстрый и надежный дескриптор точек интереса в 2D-изображениях». Компьютерный анализ изображений и паттернов (PDF). Конспект лекций по информатике (Труды CAIP: компьютерный анализ изображений и шаблонов). Конспект лекций по информатике. 9256. С. 606–617. Дои:10.1007/978-3-319-23192-1_51. ISBN  978-3-319-23191-4.
  90. ^ Cerri, A .; Ferri, M .; Георгий, Д. (01.09.2006). «Получение изображений товарных знаков с помощью функций размера». Графические модели. Специальный выпуск конференции Vision, Video and Graphics 2005. 68 (5–6): 451–471. Дои:10.1016 / j.gmod.2006.07.001.
  91. ^ Шазаль, Фредерик; Коэн-Штайнер, Дэвид; Guibas, Leonidas J .; Мемоли, Факундо; Удот, Стив Ю. (1 июля 2009 г.). «Стабильные сигнатуры Громова-Хаусдорфа для форм с использованием персистентности». Форум компьютерной графики. 28 (5): 1393–1403. CiteSeerX  10.1.1.161.9103. Дои:10.1111 / j.1467-8659.2009.01516.x. ISSN  1467-8659. S2CID  8173320.
  92. ^ Biasotti, S .; Георгий, Д .; Spagnuolo, M .; Фальцидиено, Б. (01.09.2008). «Размерные функции для сравнения 3D-моделей». Распознавание образов. 41 (9): 2855–2873. Дои:10.1016 / j.patcog.2008.02.003.
  93. ^ Li, C .; Овсяников, М .; Чазал, Ф. (2014). «Структурное распознавание на основе настойчивости» (PDF). Конференция IEEE по компьютерному зрению и распознаванию образов.
  94. ^ Тапиа, Моника; др. и др. (2018). «Идентичность нейротрансмиттера и электрофизиологический фенотип генетически связаны в дофаминергических нейронах среднего мозга». Научные отчеты. 8 (1): 13637. Bibcode:2018НатСР ... 813637Т. Дои:10.1038 / s41598-018-31765-z. ЧВК  6134142. PMID  30206240.
  95. ^ Bendich, P .; Edelsbrunner, H .; Кербер, М. (01.11.2010). «Вычислительная надежность и стойкость изображений». IEEE Transactions по визуализации и компьютерной графике. 16 (6): 1251–1260. CiteSeerX  10.1.1.185.523. Дои:10.1109 / TVCG.2010.139. ISSN  1077-2626. PMID  20975165. S2CID  8589124.
  96. ^ Карлссон, Гуннар; Ишханов, Тигран; Сильва, Вин де; Зомородян, Афра (30.06.2007). «О локальном поведении пространств природных образов». Международный журнал компьютерного зрения. 76 (1): 1–12. CiteSeerX  10.1.1.463.7101. Дои:10.1007 / s11263-007-0056-х. ISSN  0920-5691. S2CID  207252002.
  97. ^ Накамура, Такенобу; Хираока, Ясуаки; Хирата, Акихико; Escolar, Emerson G .; Нисиура, Ясумаса (26 февраля 2015 г.). «Устойчивая гомология и многочастичная атомная структура для среднего порядка в стекле». Нанотехнологии. 26 (30): 304001. arXiv:1502.07445. Bibcode:2015Нанот..26Д4001Н. Дои:10.1088/0957-4484/26/30/304001. PMID  26150288. S2CID  7298655.
  98. ^ Николау, Моника; Левин, Арнольд Дж .; Карлссон, Гуннар (26 апреля 2011 г.). «Анализ данных на основе топологии определяет подгруппу рака груди с уникальным мутационным профилем и отличной выживаемостью». Труды Национальной академии наук. 108 (17): 7265–7270. Bibcode:2011PNAS..108.7265N. Дои:10.1073 / pnas.1102826108. ISSN  0027-8424. ЧВК  3084136. PMID  21482760.
  99. ^ Шмидт, Стефан; Post, Teun M .; Boroujerdi, Massoud A .; Кестерен, Шарлотта Ван; Ploeger, Bart A .; Паскуа, Оскар Э. Делла; Данхоф, Мейндерт (01.01.2011). Kimko, Holly H.C .; Пек, Карл С. (ред.). Анализ прогрессирования заболевания: к моделям, основанным на механизмах. Успехи AAPS в серии фармацевтических наук. Springer Нью-Йорк. С. 433–455. Дои:10.1007/978-1-4419-7415-0_19. ISBN  978-1-4419-7414-3.
  100. ^ Perea, Jose A .; Харер, Джон (29 мая 2014 г.). «Раздвижные окна и постоянство: применение топологических методов для анализа сигналов». Основы вычислительной математики. 15 (3): 799–838. CiteSeerX  10.1.1.357.6648. Дои:10.1007 / s10208-014-9206-z. ISSN  1615-3375. S2CID  592832.
  101. ^ ван де Вейгаерт, Риен; Вегтер, Герт; Эдельсбруннер, Герберт; Джонс, Бернард Дж. Т .; Пранав, Пратюш; Парк, Чангбом; Hellwing, Wojciech A .; Элдеринг, Боб; Круитхоф, Нико (01.01.2011). Гаврилова, Марина Л .; Тан, К. Кеннет; Мостафави, Мир Абольфазл (ред.). Труды по вычислительной науке XIV. Берлин, Гейдельберг: Springer-Verlag. С. 60–101. ISBN  978-3-642-25248-8.
  102. ^ Хорак, Даниела; Малетич, Слободан; Райкович, Милан (01.03.2009). «Стойкая гомология сложных сетей - IOPscience». Журнал статистической механики: теория и эксперимент. 2009 (3): P03034. arXiv:0811.2203. Bibcode:2009JSMTE..03..034H. Дои:10.1088 / 1742-5468 / 2009/03 / p03034. S2CID  15592802.
  103. ^ Carstens, C.J .; Хорадам, К. Дж. (2013-06-04). «Устойчивая гомология сетей сотрудничества». Математические проблемы в инженерии. 2013: 1–7. Дои:10.1155/2013/815035.
  104. ^ Ли, Хекён; Кан, Хеджин; Chung, M.K .; Ким, Бунг-Ньюн; Ли, Дон Су (2012-12-01). "Постоянная гомология сети мозга с точки зрения дендрограммы". IEEE Transactions по медицинской визуализации. 31 (12): 2267–2277. CiteSeerX  10.1.1.259.2692. Дои:10.1109 / TMI.2012.2219590. ISSN  0278-0062. PMID  23008247. S2CID  858022.
  105. ^ Петри, G .; Эксперт, П .; Turkheimer, F .; Carhart-Harris, R .; Nutt, D .; Hellyer, P.J .; Ваккарино, Ф. (06.12.2014). «Гомологические каркасы функциональных сетей мозга». Журнал интерфейса Королевского общества. 11 (101): 20140873. Дои:10.1098 / rsif.2014.0873. ISSN  1742-5689. ЧВК  4223908. PMID  25401177.
  106. ^ а б Макферсон, Роберт; Швайнхарт, Бенджамин (01.07.2012). «Измерение формы с топологией». Журнал математической физики. 53 (7): 073516. arXiv:1011.2258. Bibcode:2012JMP .... 53g3516M. Дои:10.1063/1.4737391. ISSN  0022-2488. S2CID  17423075.
  107. ^ Чан, Джозеф Минхоу; Карлссон, Гуннар; Рабадан, Рауль (2013-11-12). «Топология вирусной эволюции». Труды Национальной академии наук. 110 (46): 18566–18571. Bibcode:2013PNAS..11018566C. Дои:10.1073 / pnas.1313480110. ISSN  0027-8424. ЧВК  3831954. PMID  24170857.
  108. ^ Taylor, D .; др., др. (2015-08-21). «Анализ топологических данных карт заражения для изучения процессов распространения в сетях». Nature Communications. 6 (6): 7723. arXiv:1408.1168. Bibcode:2015НатКо ... 6E7723T. Дои:10.1038 / ncomms8723. ISSN  2041-1723. ЧВК  4566922. PMID  26194875.
  109. ^ Оффрой, М. (2016). «Анализ топологических данных: многообещающий инструмент исследования больших данных в биологии, аналитической химии и физической химии». Analytica Chimica Acta. 910: 1–11. Дои:10.1016 / j.aca.2015.12.037. PMID  26873463.
  110. ^ Дюпоншель, Л. (2018). «Изучение наборов данных гиперспектральных изображений с помощью анализа топологических данных». Analytica Chimica Acta. 1000: 123–131. Дои:10.1016 / j.aca.2017.11.029. PMID  29289301.
  111. ^ Дюпоншель, Л. (2018). «Когда дистанционное зондирование встречается с анализом топологических данных». Журнал спектральной визуализации. 7: a1. Дои:10.1255 / jsi.2018.a1.
  112. ^ Ван, Бао; Вэй, Го-Вэй (07.12.2014). «Объективно-ориентированные стойкие гомологии». arXiv:1412.2368 [q-bio.BM ].
  113. ^ Фрозини, Патрицио; Ланди, Клаудия (2011). «Единственность моделей в стойких гомологиях: случай кривых». Обратные задачи. 27 (12): 124005. arXiv:1012.5783. Bibcode:2011InvPr..27l4005F. Дои:10.1088/0266-5611/27/12/124005. S2CID  16636182.
  114. ^ Ся, Келин; Фэн, Синь; Тонг, Иин; Вэй, Го Вэй (2015-03-05). «Устойчивая гомология для количественного предсказания стабильности фуллерена». Журнал вычислительной химии. 36 (6): 408–422. Дои:10.1002 / jcc.23816. ISSN  1096-987X. ЧВК  4324100. PMID  25523342.
  115. ^ Ся, Келин; Вэй, Го-Вэй (01.08.2014). «Постоянный гомологический анализ структуры, гибкости и фолдинга белка». Международный журнал численных методов в биомедицинской инженерии. 30 (8): 814–844. arXiv:1412.2779. Bibcode:2014arXiv1412.2779X. Дои:10.1002 / cnm.2655. ISSN  2040-7947. ЧВК  4131872. PMID  24902720.
  116. ^ Адкок, Аарон; Карлссон, Эрик; Карлссон, Гуннар (31 мая 2016 г.). «Кольцо алгебраических функций на штрих-кодах персистентности» (PDF). Гомологии, гомотопии и приложения. 18 (1): 381–402. Дои:10.4310 / hha.2016.v18.n1.a21. S2CID  2964961.
  117. ^ Чепуштанова, Софья; Эмерсон, Теган; Хэнсон, Эрик; Кирби, Майкл; Мотта, Фрэнсис; Невилл, Рэйчел; Петерсон, Крис; Шипман, Патрик; Зигельмайер, Лори (22.07.2015). «Постоянные образы: альтернативное постоянное представление гомологии». arXiv:1507.06217 [cs.CG ].
  118. ^ Деёвель, Рене (1955-01-01). "Topologie D'Une Fonctionnelle". Анналы математики. Вторая серия. 61 (1): 13–72. Дои:10.2307/1969619. JSTOR  1969619.
  119. ^ де Сильва, Вин; Мунк, Элизабет; Патель, Амит (13 апреля 2016 г.). «Категоризованные графы Риба». Дискретная и вычислительная геометрия. 55 (4): 854–906. arXiv:1501.04147. Дои:10.1007 / s00454-016-9763-9. S2CID  7111141.
  120. ^ Гудман, Джейкоб Э. (01.01.2008). Обзоры по дискретной и вычислительной геометрии: двадцать лет спустя: совместная летняя исследовательская конференция AMS-IMS-SIAM, 18-22 июня 2006 г., Snowbird, Юта. American Mathematical Soc. ISBN  9780821842393.
  121. ^ Эдельсбруннер, Герберт; Харер, Джон (2008). Стойкая гомология - обзор. Современная математика. 453. AMS. С. 15–18. CiteSeerX  10.1.1.87.7764. Дои:10.1090 / conm / 453/08802. ISBN  9780821842393. Раздел 5

дальнейшее чтение

Краткое введение

Монография

Видео-лекция

Учебник по топологии

Другие ресурсы TDA