Топологический анализ данных - Topological data analysis
В Прикладная математика, топологический анализ данных (TDA) - это подход к анализу наборов данных с использованием методов из топология. Извлечение информации из многомерных, неполных и зашумленных наборов данных, как правило, является сложной задачей. TDA обеспечивает общую основу для анализа таких данных, не зависящую от конкретных метрика выбран и предоставляет уменьшение размерности и устойчивость к шуму. Помимо этого, он наследует функториальность, фундаментальная концепция современной математики, из-за ее топологической природы, которая позволяет ей адаптироваться к новым математическим инструментам.
Первоначальная мотивация - изучить форму данных. TDA объединила алгебраическая топология и другие инструменты из чистой математики, позволяющие математически строго изучать «форму». Главный инструмент стойкая гомология, адаптация гомология к облако точек данные. Стойкая гомология применяется ко многим типам данных во многих областях. Более того, его математическая основа имеет также теоретическое значение. Уникальные особенности TDA делают его многообещающим мостом между топологией и геометрией.
Основная теория
Интуиция
Эта статья тон или стиль могут не отражать энциклопедический тон используется в Википедии.Январь 2019) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
Предпосылка, лежащая в основе TDA, заключается в том, что форма имеет значение. Реальные данные в больших размерностях почти всегда разрежены и, как правило, имеют соответствующие особенности малых размеров. Одна из задач TDA - дать точную характеристику этого факта. Наглядным примером является простая система хищник-жертва, управляемая Уравнения Лотки – Вольтерра.[1] Нетрудно заметить, что траектория системы образует замкнутый круг в пространстве состояний. TDA предоставляет инструменты для обнаружения и количественной оценки такого повторяющегося движения.[2]
Многие алгоритмы анализа данных, в том числе используемые в TDA, требуют выбора различных параметров. Без предварительного знания предметной области трудно выбрать правильный набор параметров для набора данных. Основная идея стойкая гомология в том, что мы можем использовать информацию, полученную из всех значений параметра. Конечно, одно только это понимание сделать легко; сложная часть - это кодирование этого огромного количества информации в понятную и легкую для представления форму. В случае TDA существует математическая интерпретация, когда информация представляет собой группу гомологии. В целом предполагается, что функции, которые сохраняются для широкого диапазона параметров, являются «истинными» функциями. Признаки, сохраняющиеся только для узкого диапазона параметров, считаются шумом, хотя теоретическое обоснование этого неясно.[3]
Ранняя история
Предшественники полной концепции стойкой гомологии со временем появлялись постепенно.[4] В 1990 году Патрицио Фрозини ввел функцию размера, которая эквивалентна 0-й постоянной гомологии.[5] Спустя почти десять лет Ванесса Робинс изучал образы гомоморфизмов, индуцированных включением.[6] Наконец, вскоре после этого Edelsbrunner et al. представил концепцию устойчивой гомологии вместе с эффективным алгоритмом и его визуализацией в виде диаграммы устойчивости.[7] Карлссон и др. переформулировал первоначальное определение и дал эквивалентный метод визуализации, называемый штрих-кодами стойкости,[8] интерпретация настойчивости на языке коммутативной алгебры.[9]
В алгебраической топологии стойкие гомологии появились благодаря работам Баранникова по теории Морса. Множество критических значений гладкой функции Морса было канонически разбито на пары «рождение-смерть», отфильтрованные комплексы были классифицированы, а визуализация их инвариантов, эквивалентная диаграмме персистентности и штрих-кодам персистентности, была дана в 1994 году канонической формой Баранникова.[10]
Концепции
Ниже представлены некоторые широко используемые концепции. Обратите внимание, что некоторые определения могут отличаться от автора к автору.
А облако точек часто определяется как конечный набор точек в некотором евклидовом пространстве, но может рассматриваться как любое конечное метрическое пространство.
В Чешский комплекс облака точек - это нерв из крышка из шаров фиксированного радиуса вокруг каждой точки в облаке.
А модуль постоянства проиндексировано это векторное пространство для каждого , и линейная карта в любое время , так что для всех и в любое время [11] Эквивалентное определение - это функтор из рассматривается как частично упорядоченное множество к категории векторных пространств.
В стойкая группа гомологии облака точек - это модуль постоянства, определенный как , куда комплекс Чеха радиуса облака точек и группа гомологий.
А штрих-код стойкости это мультимножество интервалов в , а диаграмма устойчивости это мультимножество точек в ().
В Расстояние Вассерштейна между двумя диаграммами устойчивости и определяется как
В расстояние до узкого места между и является
Базовая недвижимость
Структурная теорема
Первая классификационная теорема для стойких гомологий появилась в 1994 г.[10] через канонические формы Баранникова. Классификационная теорема, интерпретирующая настойчивость на языке коммутативной алгебры, появилась в 2005 году:[9] для конечно порожденного модуля персистентности с полем коэффициенты,
Устойчивая гомология визуализируется с помощью штрих-кода или диаграммы устойчивости. Штрих-код уходит корнями в абстрактную математику. А именно, категория конечных фильтрованных комплексов над полем полупроста. Любой фильтрованный комплекс изоморфен своей канонической форме, прямой сумме одномерных и двумерных простых фильтрованных комплексов.
Стабильность
Стабильность желательна, поскольку она обеспечивает устойчивость к шуму. Если - любое пространство, гомеоморфное симплициальному комплексу, и постоянно приручены[13] функции, то векторные пространства персистентности и конечно представлены, и , куда относится к узкому месту[14] и является отображением, переводящим непрерывную ручную функцию в диаграмму устойчивости ее -я гомология.
Рабочий процесс
Основной рабочий процесс в TDA:[15]
облако точек | вложенные комплексы | модуль постоянства | штрих-код или диаграмма |
- Если облако точек, заменить с вложенной семьей симплициальные комплексы (например, комплекс Чех или Виеторис-Рипс). Этот процесс превращает облако точек в фильтрацию симплициальных комплексов. Взятие гомологии каждого комплекса в этой фильтрации дает модуль устойчивости
- Примените структурную теорему, чтобы получить параметризованную версию Бетти число, диаграмма настойчивости, или эквивалентно, штрих-код.
Графически говоря,
Вычисление
Первый алгоритм по всем полям для устойчивых гомологий в алгебраической топологии был описан Баранниковым.[10] путем приведения к каноническому виду верхнетреугольными матрицами. Первый алгоритм стойкой гомологии над был предоставлен Edelsbrunner et al.[7] Зомородян и Карлссон представили первый практический алгоритм для вычисления устойчивых гомологий по всем полям.[9] Книга Эдельсбруннера и Харера дает общее руководство по вычислительной топологии.[17]
Одна из проблем, возникающих при вычислениях, - это выбор комплекса. В Чешский комплекс и Комплекс Виеторис – Рипс наиболее естественны на первый взгляд; однако их размер быстро растет с увеличением количества точек данных. Комплекс Виеториса – Рипса предпочтительнее комплекса Чеха, поскольку его определение проще, а комплекс Чеха требует дополнительных усилий для определения в общем конечном метрическом пространстве. Были изучены эффективные способы снизить вычислительные затраты на гомологии. Например, α-комплекс и комплекс-свидетель используются для уменьшения размера и размера комплексов.[18]
Недавно, Дискретная теория Морса показала многообещающую вычислительную гомологию, потому что может уменьшить данный симплициальный комплекс до гораздо меньшего клеточного комплекса, который гомотопен исходному.[19] Это сокращение фактически может быть выполнено, поскольку комплекс построен с использованием теория матроидов, что приводит к дальнейшему увеличению производительности.[20] Другой недавний алгоритм экономит время, игнорируя классы гомологии с низкой персистентностью.[21]
Доступны различные программные пакеты, такие как javaPlex, Дионис, Персей, PHAT, ДИФА, ГУДИ, Ripser, и TDAstats. Сравнение этих инструментов выполнено Otter et al.[22] Джотто-тда представляет собой пакет Python, предназначенный для интеграции TDA в рабочий процесс машинного обучения с помощью scikit-learn API. Пакет R TDA способен вычислять недавно изобретенные концепции, такие как ландшафт и оценщик расстояния ядра.[23] В Набор инструментов топологии специализирован для непрерывных данных, определенных на коллекторах низкой размерности (1, 2 или 3), как обычно научная визуализация. Другой пакет R, TDAstats, реализует быструю библиотеку C ++ Ripser для вычисления постоянной гомологии.[24] Он также использует повсеместный ggplot2 пакет для создания воспроизводимых, настраиваемых, качественных для публикации визуализаций устойчивой гомологии, в частности топологических штрих-кодов и диаграмм устойчивости. В приведенном ниже примере кода показан пример того, как Язык программирования R может использоваться для вычисления постоянной гомологии.
# установить пакет из CRAN и загрузить наборы данныхinstall.packages(«TDAstats»)библиотека(«TDAstats»)данные("unif2d")данные("circle2d")# вычислить постоянную гомологию для обоих наборов данныхunif.phom <- Calcul_homology(unif2d)Circ.phom <- Calcul_homology(circle2d)# построить равномерно распределенное облако точек как диаграмму устойчивостиplot_persist(unif.phom)# построить круговое облако точек как топологический штрих-код# мы видим одну постоянную полосу, как и ожидалось для круга (один 1 цикл / цикл)plot_barcode(Circ.phom)
Визуализация
Данные большого размера невозможно визуализировать напрямую. Было изобретено много методов для извлечения низкоразмерной структуры из набора данных, таких как Анализ главных компонентов и многомерное масштабирование.[25] Однако важно отметить, что сама проблема некорректна, поскольку в одном и том же наборе данных можно найти множество различных топологических характеристик. Таким образом, изучение визуализации пространств высокой размерности имеет центральное значение для TDA, хотя оно не обязательно предполагает использование устойчивой гомологии. Однако в последнее время были предприняты попытки использовать постоянную гомологию при визуализации данных.[26]
Карлссон и др. предложили общий метод, называемый КАРТА.[27] Он наследует идею Серра о том, что покрытие сохраняет гомотопию.[28] Обобщенная формулировка MAPPER выглядит следующим образом:
Позволять и топологические пространства и пусть - непрерывное отображение. Позволять - конечное открытое покрытие . Результат MAPPER - это нерв откатной крышки. , где каждый прообраз разбивается на связанные компоненты.[26] Это очень общая концепция, из которой граф Риба [29] и деревья слияния - особые случаи.
Это не совсем исходное определение.[27] Карлссон и др. выберите быть или же , и накрыть его открытыми множествами, пересекающимися не более чем двумя.[3] Это ограничение означает, что вывод имеет форму сложная сеть. Поскольку топология конечного облака точек тривиальна, методы кластеризации (например, одинарная связь ) используются для создания аналога связанных множеств в прообразе когда MAPPER применяется к фактическим данным.
С математической точки зрения MAPPER - это вариант График Риба. Если не более чем одномерный, то для каждого ,
Три успешных применения MAPPER можно найти в Carlsson et al.[32] Комментарий Дж. Карри к приложениям в этой статье заключается в том, что «общая черта, представляющая интерес для приложений, - это наличие бликов или усиков».[33]
Доступна бесплатная реализация MAPPER. онлайн написано Даниэлем Мюлнером и Аравиндакшаном Бабу. MAPPER также составляет основу Аясди Платформа AI.
Многомерная настойчивость
Для TDA важна многомерная настойчивость. Эта концепция возникает как в теории, так и на практике. Первое исследование многомерной персистентности было на ранней стадии разработки TDA,[34] и является одним из учредительных документов TDA.[9] Первое приложение, появившееся в литературе, - это метод сравнения форм, аналогичный изобретению TDA.[35]
Определение п-мерный модуль устойчивости в является[33]
- векторное пространство присваивается каждой точке в
- карта назначается, если (
- карты удовлетворяют для всех
Возможно, стоит отметить, что существуют разногласия по поводу определения многомерной устойчивости.[33]
Одним из преимуществ одномерного постоянства является его представление в виде диаграммы или штрих-кода. Однако дискретных полных инвариантов многомерных модулей персистентности не существует.[36] Основная причина этого в том, что структура коллекции неразложимых элементов чрезвычайно усложняется из-за Теорема Габриэля в теории колчанных представлений,[37] хотя конечно n-мерный модуль сохранения может быть однозначно разложен в прямую сумму неразложимых согласно теореме Крулля-Шмидта.[38]
Тем не менее, многие результаты были получены. Карлссон и Зомородян представили ранговый инвариант , определяемый как , в котором является конечно порожденным n-градуированным модулем. В одном измерении это эквивалент штрих-кода. В литературе ранговый инвариант часто называют постоянными числами Бетти (PBN).[17] Во многих теоретических работах авторы использовали более ограниченное определение, аналог устойчивости подуровневого множества. В частности, постоянство чисел Бетти функции даются функцией , принимая каждый к , куда и .
Некоторые основные свойства включают монотонность и диагональный скачок.[39] Постоянные числа Бетти будут конечными, если - компактное и локально стягиваемое подпространство в .[40]
Используя метод слоения, k-dim PBN могут быть разложены на семейство одномерных PBN с помощью вывода размерности.[41] Этот метод также привел к доказательству устойчивости многомерных сетей PBN.[42] Разрывы PBN возникают только в точках где либо является точкой разрыва или же является точкой разрыва в предположении, что и компактное триангулируемое топологическое пространство.[43]
Постоянное пространство, обобщение устойчивой диаграммы, определяется как мультимножество всех точек с кратностью больше 0 и диагональю.[44] Он обеспечивает стабильное и полное представление о PBN. Текущая работа Carlsson et al. пытается дать геометрическую интерпретацию устойчивой гомологии, которая может дать представление о том, как объединить теорию машинного обучения с топологическим анализом данных.[45]
Первый практический алгоритм вычисления многомерной персистентности был изобретен очень рано.[46] После этого было предложено множество других алгоритмов, основанных на таких концепциях, как дискретная теория Морса.[47] и оценка по конечной выборке.[48]
Другие настойчивости
Стандартная парадигма в TDA часто упоминается как подуровневая настойчивость. Помимо многомерной персистентности, было сделано много работ, чтобы расширить этот частный случай.
Зигзагообразная настойчивость
Ненулевые отображения в модуле сохранения ограничены отношением предварительного порядка в категории. Однако математики пришли к выводу, что единодушие не имеет значения для многих результатов. «Философский момент состоит в том, что теория декомпозиции представлений графа в некоторой степени не зависит от ориентации ребер графа».[49] Настойчивость зигзага важна с теоретической стороны. Все примеры, приведенные в обзорной статье Карлссона, чтобы проиллюстрировать важность функциональности, имеют некоторые общие черты.[3]
Расширенная настойчивость и настойчивость при установке уровней
Некоторые попытки - это потерять более строгое ограничение функции.[50] Пожалуйста, обратитесь к Категории и связки и Влияние на математику разделы для получения дополнительной информации.
Естественно распространить гомологию персистентности на другие базовые понятия алгебраической топологии, такие как когомологии и относительные гомологии / когомологии.[51] Интересным приложением является вычисление круговых координат для набора данных через первую постоянную группу когомологий.[52]
Круговая настойчивость
Гомология нормальной персистентности изучает функции с действительными значениями. Кругозначное отображение может быть полезным, «теория устойчивости для кругозначных отображений обещает сыграть роль для некоторых векторных полей, как и стандартная теория устойчивости для скалярных полей», как прокомментировали D. Burghelea et al.[53] Основное отличие состоит в том, что клетки Джордана (очень похожие по формату на Иорданские блоки в линейной алгебре) нетривиальны в кругозначных функциях, которые были бы равны нулю в вещественнозначном случае, а сочетание со штрих-кодами дает инварианты ручного отображения при умеренных условиях.[53]
Они используют два метода: теория Морса-Новикова.[54] и теория представлений графов.[55] Более свежие результаты можно найти у D. Burghelea et al.[56] Например, требование приручения можно заменить более слабым условием - непрерывным.
Стойкость при кручении
Доказательство структурной теоремы полагается на то, что базовая область является полем, поэтому было сделано не так много попыток гомологии персистентности с кручением. Фрозини определил псевдометрию на этом конкретном модуле и доказал ее устойчивость.[57] Одна из его новинок заключается в том, что определение метрики не зависит от какой-либо теории классификации.[58]
Категории и связки
Одно преимущество теория категорий это его способность поднимать конкретные результаты на более высокий уровень, показывая отношения между, казалось бы, несвязанными объектами. Бубеник и др.[59] предлагает краткое введение в теорию категорий, подходящую для TDA.
Теория категорий - это язык современной алгебры, который широко используется при изучении алгебраической геометрии и топологии. Было отмечено, что «ключевое наблюдение [9] состоит в том, что диаграмма устойчивости, созданная [7] зависит только от алгебраической структуры, которую несет эта диаграмма ».[60] Использование теории категорий в TDA оказалось плодотворным.[59][60]
Следуя обозначениям, сделанным в Bubenik et al.,[60] то категория индексации есть ли предварительно заказанный набор (не обязательно или же ), целевая категория это любая категория (вместо обычно используемой ), и функторы называются обобщенные модули сохраняемости в , над .
Одним из преимуществ использования теории категорий в TDA является более четкое понимание концепций и открытие новых отношений между доказательствами. Для иллюстрации возьмем два примера. Понимание соответствия между перемежением и сопоставлением имеет огромное значение, поскольку сопоставление было методом, используемым вначале (измененным из теории Морса). Краткое изложение работ можно найти в Vin de Silva et al.[61] Многие теоремы гораздо легче доказать в более интуитивной обстановке.[58] Другой пример - взаимосвязь между построением разных комплексов из облаков точек. Давно замечено родство комплексов Чеха и Виеториса-Рипса. Конкретно, .[62] Существенную взаимосвязь между комплексами Чеха и Рипса можно гораздо яснее увидеть на категориальном языке.[61]
Язык теории категорий также помогает формулировать результаты в терминах, понятных для более широкого математического сообщества. Расстояние до узкого места широко используется в TDA из-за результатов устойчивости по отношению к расстоянию до узкого места.[11][14] Фактически, расстояние чередования - это конечный объект в ч.у. категории стабильных метрик на многомерных модулях персистентности в основное поле.[58][63]
Шкивы, центральная концепция в современном алгебраическая геометрия, неразрывно связаны с теорией категорий. Грубо говоря, снопы являются математическим инструментом для понимания того, как локальная информация определяет глобальную информацию. Джастин Карри рассматривает постоянство набора уровней как исследование волокна непрерывных функций. Объекты, которые он изучает, очень похожи на объекты MAPPER, но с теорией пучков в качестве теоретической основы.[33] Хотя никакого прорыва в теории TDA до сих пор не использовалась теория пучков, это многообещающе, поскольку в алгебраической геометрии есть много красивых теорем, относящихся к теории пучков. Например, естественный теоретический вопрос заключается в том, приводят ли разные методы фильтрации к одному и тому же результату.[64]
Стабильность
Стабильность имеет решающее значение для анализа данных, поскольку реальные данные содержат шумы. Используя теорию категорий, Бубеник и др. различали теоремы о мягкой и жесткой устойчивости и доказали, что мягкие случаи формальны.[60] В частности, общий рабочий процесс TDA
данные | модуль топологического сохранения | модуль алгебраической персистентности | дискретный инвариант |
Теорема мягкой устойчивости утверждает, что является Липшицева непрерывная, а теорема о жесткой устойчивости утверждает, что липшицево.
Расстояние узкого места широко используется в TDA. Теорема изометрии утверждает, что расстояние между перемежением равно расстоянию до узкого места.[58] Бубеник и др. абстрагировали определение до определения между функторами когда снабжен сублинейной проекцией или надлинейным семейством, в котором все еще остается псевдометрическим.[60] Учитывая великолепные символы расстояния между перемежением,[65] здесь мы вводим общее определение расстояния перемежения (вместо первого введенного):[11] Позволять (функция из к который монотонен и удовлетворяет для всех ). А -перемежение между F и G состоит из естественных преобразований и , так что и .
Два основных результата:[60]
- Позволять быть предварительно упорядоченным набором с сублинейной проекцией или надлинейным семейством. Позволять быть функтором между произвольными категориями . Тогда для любых двух функторов , у нас есть .
- Позволять быть ч.у. метрического пространства , быть топологическим пространством. И разреши (не обязательно непрерывные) быть функциями, и чтобы быть соответствующей диаграммой устойчивости. потом .
Эти два результата суммируют многие результаты по стабильности различных моделей персистентности.
Для получения информации о теореме устойчивости многомерной стойкости обратитесь к подразделу о стойкости.
Структурная теорема
Структурная теорема имеет центральное значение для TDA; как прокомментировал Г. Карлссон, «то, что делает гомологии полезными в качестве дискриминатора между топологическими пространствами, - это тот факт, что существует теорема классификации для конечно порожденных абелевых групп».[3] (см. основная теорема о конечно порожденных абелевых группах ).
Основным аргументом, использованным при доказательстве исходной структурной теоремы, является стандартный структурная теорема для конечно порожденных модулей над областью главных идеалов.[9] Однако этот аргумент не работает, если набор индексации .[3]
В общем, не каждый модуль сохраняемости можно разложить на интервалы.[66] Было сделано много попыток ослабить ограничения исходной структурной теоремы.[требуется разъяснение ] Случай поточечных конечномерных модулей персистентности, индексированных локально конечным подмножеством решается на основе работы Уэбба.[67] Наиболее заметный результат был получен Кроули-Бови, который решил случай . Теорема Кроули-Бови утверждает, что любой поточечно конечномерный модуль персистентности является прямой суммой интервальных модулей.[68]
Чтобы понять определение его теоремы, необходимо ввести некоторые понятия. An интервал в определяется как подмножество имея свойство, что если и если есть такой, что , тогда также. An интервальный модуль присваивает каждому элементу векторное пространство и присваивает нулевое векторное пространство элементам в . Все карты являются нулевым отображением, если только и , в таком случае это тождественная карта.[33] Модули интервалов неразложимы.[69]
Хотя результат Кроули-Бови является очень сильной теоремой, он все же не распространяется на случай q-tame.[66] Модуль сохраняемости q-tame если ранг конечно для всех . Есть примеры q-ручных модулей персистентности, которые не могут быть поточечно конечными.[70] Однако оказывается, что аналогичная структурная теорема все еще остается в силе, если удаляются признаки, существующие только для одного значения индекса.[69] Это справедливо, потому что бесконечномерные части при каждом значении индекса не сохраняются из-за условия конечного ранга.[71] Формально наблюдаемая категория определяется как , в котором обозначает полную подкатегорию чьими объектами являются эфемерные модули ( в любое время ).[69]
Обратите внимание, что расширенные результаты, перечисленные здесь, не применимы к зигзагообразному постоянству, поскольку аналог модуля зигзагообразного постоянства над не сразу очевидно.
Статистика
Реальные данные всегда конечны, и поэтому их изучение требует от нас учета стохастичности. Статистический анализ дает нам возможность отделить истинные характеристики данных от артефактов, вызванных случайным шумом. Стойкая гомология не имеет внутреннего механизма, позволяющего различать признаки с низкой вероятностью и признаки с высокой вероятностью.
Один из способов применения статистики для анализа топологических данных - изучение статистических свойств топологических характеристик облаков точек. Изучение случайных симплициальных комплексов дает некоторое представление о статистической топологии. K. Turner et al.[72] предлагает резюме работы в этом ключе.
Второй способ - изучить распределения вероятностей в постоянном пространстве. Пространство настойчивости является , куда это пространство всех штрих-кодов, содержащих ровно интервалы и эквивалентности если .[73] Это пространство довольно сложное; например, он не является полным по метрике «узкое место». Первая попытка его изучения сделана Ю. Милейко и соавт.[74] Пространство диаграмм устойчивости в их статье определяется как
Третий способ - рассматривать когомологии вероятностного пространства или статистических систем напрямую, называемые информационными структурами и в основном состоящие из тройки (), пространство выборки, случайные величины и вероятностные законы [78] [79]. Случайные переменные рассматриваются как части n атомных вероятностей (рассматриваемых как вероятностный (n-1) -симплекс, ) на решетке разбиений (). Случайные величины или модули измеримых функций образуют коцепные комплексы, в то время как кограница рассматривается как общая гомологическая алгебра, впервые обнаруженная Хохшильдом с левым действием, реализующим действие обусловливания. Первое условие коцикла соответствует цепному правилу энтропии, позволяя однозначно получить с точностью до мультипликативной константы энтропию Шеннона как первый класс когомологий. Рассмотрение деформированного левого действия обобщает фреймворк на энтропии Тсаллиса. Информационные когомологии - это пример окольцованных топосов. Многомерный k-Взаимная информация появляются в выражениях кограниц, и их обращение в нуль, связанное с условием коцикла, дает эквивалентные условия статистической независимости [80]. Минимумы взаимной информации, также называемые синергизмом, порождают интересные конфигурации независимости, аналогичные гомотопическим связям. Из-за его комбинаторной сложности на данных был исследован только симплициальный подслучай когомологий и информационной структуры. В применении к данным эти когомологические инструменты количественно определяют статистические зависимости и независимость, включая Цепи Маркова и условная независимость, в многомерном случае [81]. Примечательно, что взаимная информация обобщает коэффициент корреляции и ковариация нелинейным статистическим зависимостям. Эти подходы были разработаны независимо и лишь косвенно связаны с методами персистентности, но могут быть примерно поняты в симплициальном случае с использованием теоремы Ху Куо Тина, которая устанавливает взаимно однозначное соответствие между функциями взаимной информации и конечной измеримой функцией множества с оператором пересечения. , чтобы построить Чешский комплекс скелет. Информационная когомология предлагает некоторую прямую интерпретацию и применение с точки зрения нейробиологии (теория нейронной сборки и качественное познание). [82]), статистической физики и глубокой нейронной сети, для которых структура и алгоритм обучения задаются комплексом случайных величин и правилом информационной цепочки [83].
Пейзажи персистентности, представленные Петером Бубеником, представляют собой другой способ представления штрих-кодов, более поддающийся статистическому анализу.[84] В настойчивый пейзаж постоянного модуля определяется как функция , , куда обозначает расширенная реальная линия и . Пространство ландшафтов персистентности очень хорошее: оно наследует все хорошие свойства представления штрих-кода (стабильность, простота представления и т. Д.), Но статистические величины могут быть легко определены, и некоторые проблемы в работе Ю. Милейко и др., Такие как как неединственность ожиданий,[74] можно преодолеть. Доступны эффективные алгоритмы вычислений с постоянными ландшафтами.[85] Другой подход заключается в использовании измененной персистентности, которая представляет собой постоянство образа, ядра и коядра.[86]
Приложения
Классификация приложений
Существует несколько способов классификации приложений TDA. Пожалуй, самый естественный способ - по полю. Очень неполный список успешных приложений включает [87] скелетизация данных,[88] исследование формы,[89] реконструкция графа,[90][91][92] [93][94]анализ изображений,[95][96] материал[97] анализ прогрессирования заболевания,[98][99] сенсорная сеть,[62] анализ сигналов,[100] космическая паутина[101] сложная сеть,[102][103][104][105] фрактальная геометрия[106] вирусная эволюция,[107] распространение инфекций в сетях,[108] классификация бактерий с помощью молекулярной спектроскопии,[109] гиперспектральная визуализация в физико-химии [110] и дистанционное зондирование.[111]
Другой способ - выделить техники Дж. Карлссона,[73]
один из них - изучение гомологических инвариантов данных, отдельных наборов данных, а другой - использование гомологических инвариантов при изучении баз данных, где сами точки данных имеют геометрическую структуру.
Характеристики ТДА в приложениях
В последних приложениях TDA есть несколько примечательных интересных особенностей:
- Объединение инструментов из нескольких разделов математики. Помимо очевидной потребности в алгебре и топологии, уравнения в частных производных,[112] алгебраическая геометрия,[36] теория представлений,[49] статистика, комбинаторика и риманова геометрия[71] все нашли применение в TDA.
- Количественный анализ. Топология считается очень мягкой, поскольку многие понятия инвариантны относительно гомотопии. Тем не менее, постоянная топология способна регистрировать рождение (появление) и смерть (исчезновение) топологических объектов, поэтому в нее встроена дополнительная геометрическая информация. Теоретически одно доказательство - это частично положительный результат об уникальности восстановления кривых;[113] два из них касаются количественного анализа стабильности фуллерена и количественного анализа самоподобие, раздельно.[106][114]
- Роль непродолжительной настойчивости. Было обнаружено, что кратковременная настойчивость также полезна, несмотря на распространенное мнение, что причиной явления является шум.[115] Это интересно для математической теории.
Одним из основных направлений анализа данных сегодня является машинное обучение. Некоторые примеры машинного обучения в TDA можно найти в Adcock et al.[116] А конференция посвящен связи между TDA и машинным обучением. Чтобы применить инструменты машинного обучения, информация, полученная из TDA, должна быть представлена в векторной форме. Постоянная и многообещающая попытка - это описанный выше ландшафт настойчивости. Другая попытка использует концепцию постоянства изображений.[117] Однако одной из проблем этого метода является потеря устойчивости, поскольку теорема о жесткой устойчивости зависит от представления штрих-кода.
Влияние на математику
Анализ топологических данных и постоянная гомология оказали влияние на Теория Морса. Теория Морса сыграла очень важную роль в теории TDA, в том числе в области вычислений. Некоторые работы по стойким гомологиям расширили результаты о функциях Морса для приручения функций или даже для непрерывных функций. Забытый результат Р. Деёвеля задолго до изобретения стойких гомологий распространяет теорию Морса на все непрерывные функции.[118]
Один из недавних результатов состоит в том, что категория Графики Риба эквивалентно определенному классу пучка.[119] Это мотивировано теоретической работой в TDA, поскольку граф Риба связан с теорией Морса, а MAPPER является производным от нее. Доказательство этой теоремы опирается на расстояние перемежения.
Стойкая гомология тесно связана с спектральные последовательности.[120] [121] В частности, алгоритм, приводящий фильтрованный комплекс к его каноническому виду[10] позволяет намного быстрее вычислять спектральные последовательности, чем стандартная процедура вычисления группирует постранично. Постоянство зигзага может иметь теоретическое значение для спектральных последовательностей.
Смотрите также
- Снижение размерности
- Сбор данных
- Компьютерное зрение
- Вычислительная топология
- Дискретная теория Морса
- Анализ формы (цифровая геометрия)
- Теория размеров
- Алгебраическая топология
Рекомендации
- ^ Эпштейн, Чарльз; Карлссон, Гуннар; Эдельсбруннер, Герберт (2011-12-01). «Топологический анализ данных». Обратные задачи. 27 (12): 120201. arXiv:1609.08227. Bibcode:2011InvPr..27a0101E. Дои:10.1088/0266-5611/27/12/120201.
- ^ "diva-portal.org/smash/record.jsf?pid=diva2%253A575329&dswid=4297". www.diva-portal.org. Архивировано из оригинал 19 ноября 2015 г.. Получено 2015-11-05.
- ^ а б c d е Карлссон, Гуннар (01.01.2009). «Топология и данные». Бюллетень Американского математического общества. 46 (2): 255–308. Дои:10.1090 / S0273-0979-09-01249-X. ISSN 0273-0979.
- ^ Эдельсбруннер Х. Устойчивая гомология: теория и практика [J]. 2014 г.
- ^ Фрозини, Патрицио (01.12.1990). «Расстояние для классов подобия подмногообразий евклидова пространства». Бюллетень Австралийского математического общества. 42 (3): 407–415. Дои:10.1017 / S0004972700028574. ISSN 1755-1633.
- ^ Робинс V. К вычислению гомологий по конечным приближениям [C] // Труды по топологии. 1999, 24 (1): 503-532.
- ^ а б c Эдельсбруннер; Летчер; Зомородян (01.11.2002). «Топологическая устойчивость и упрощение». Дискретная и вычислительная геометрия. 28 (4): 511–533. Дои:10.1007 / s00454-002-2885-2. ISSN 0179-5376.
- ^ Карлссон, Гуннар; Зомородян, Афра; Коллинз, Энн; Гибас, Леонидас Дж. (2005-12-01). «Штрих-коды стойкости для фигур». Международный журнал моделирования форм. 11 (2): 149–187. CiteSeerX 10.1.1.5.2718. Дои:10.1142 / S0218654305000761. ISSN 0218-6543.
- ^ а б c d е ж Зомородян, Афра; Карлссон, Гуннар (19 ноября 2004 г.). «Вычисление стойких гомологий». Дискретная и вычислительная геометрия. 33 (2): 249–274. Дои:10.1007 / s00454-004-1146-у. ISSN 0179-5376.
- ^ а б c d е Баранников, Сергей (1994). «Обрамленный комплекс Морса и его инварианты». Успехи советской математики. 21: 93–115.
- ^ а б c Шазаль, Фредерик; Коэн-Штайнер, Дэвид; Глисс, Марк; Guibas, Leonidas J .; Удот, Стив Ю. (1 января 2009 г.). Близость модулей персистентности и их диаграммы.. Материалы двадцать пятого ежегодного симпозиума по вычислительной геометрии. SCG '09. Нью-Йорк, Нью-Йорк, США: ACM. С. 237–246. CiteSeerX 10.1.1.473.2112. Дои:10.1145/1542362.1542407. ISBN 978-1-60558-501-7. S2CID 840484.
- ^ Мунк Э. Применения устойчивых гомологий к системам, меняющимся во времени [D]. Университет Дьюка, 2013.
- ^ Шихман, Владимир (2011). Топологические аспекты негладкой оптимизации.. Springer Science & Business Media. С. 169–170. ISBN 9781461418979. Получено 22 ноября 2017.
- ^ а б Коэн-Штайнер, Дэвид; Эдельсбруннер, Герберт; Харер, Джон (12 декабря 2006 г.). «Диаграммы устойчивости». Дискретная и вычислительная геометрия. 37 (1): 103–120. Дои:10.1007 / s00454-006-1276-5. ISSN 0179-5376.
- ^ Грист, Роберт (01.01.2008). «Штрих-коды: постоянная топология данных». Бюллетень Американского математического общества. 45 (1): 61–75. Дои:10.1090 / S0273-0979-07-01191-3. ISSN 0273-0979.
- ^ Шазаль, Фредерик; Глисс, Марк; Лабрюер, Катрин; Мишель, Бертран (27 мая 2013 г.). «Оптимальные скорости сходимости для диаграмм устойчивости в топологическом анализе данных». arXiv:1305.6239 [math.ST ].
- ^ а б Эдельсбруннер, Герберт; Харер, Джон (01.01.2010). Вычислительная топология: введение. American Mathematical Soc. ISBN 9780821849255.
- ^ Де Сильва, Вин; Карлссон, Гуннар (01.01.2004). Топологическое оценивание с использованием комплексов свидетелей. Материалы первой конференции Eurographics по точечной графике. СПБГ'04. Aire-la-Ville, Швейцария, Швейцария: Еврографическая ассоциация. С. 157–166. Дои:10.2312 / SPBG / SPBG04 / 157-166. ISBN 978-3-905673-09-8.
- ^ Мишайков, Константин; Нанда, Видит (27 июля 2013 г.). "Теория Морса для фильтрации и эффективного вычисления стойких гомологий". Дискретная и вычислительная геометрия. 50 (2): 330–353. Дои:10.1007 / s00454-013-9529-6. ISSN 0179-5376.
- ^ Хенсельман, Грегори; Грист, Роберт (1 июня 2016 г.). «Матроидные фильтрации и вычислительные стойкие гомологии». arXiv:1606.00199. Bibcode:2016arXiv160600199H. Цитировать журнал требует
| журнал =
(помощь) - ^ Чен, Чао; Кербер, Майкл (01.05.2013). «Чувствительный к выходу алгоритм для постоянной гомологии». Вычислительная геометрия. 27-й ежегодный симпозиум по вычислительной геометрии (SoCG 2011). 46 (4): 435–447. Дои:10.1016 / j.comgeo.2012.02.010.
- ^ Выдра, Нина; Портер, Мейсон А .; Тилльманн, Ульрике; Гриндрод, Питер; Харрингтон, Хизер А. (2015-06-29). «Дорожная карта для вычисления устойчивой гомологии». EPJ Data Science. 6 (1): 17. arXiv:1506.08903. Bibcode:2015arXiv150608903O. Дои:10.1140 / epjds / s13688-017-0109-5. ЧВК 6979512. PMID 32025466.
- ^ Фаси, Бриттани Тереза; Ким, Джису; Леччи, Фабрицио; Мария, Клеман (07.11.2014). «Введение в пакет R TDA». arXiv:1411.1830 [cs.MS ].
- ^ Вадхва, Рауль; Уильямсон, Дрю; Дхаван, Эндрю; Скотт, Джейкоб (2018). «TDAstats: конвейер R для вычисления устойчивой гомологии при анализе топологических данных». Журнал открытого программного обеспечения. 3 (28): 860. Bibcode:2018JOSS .... 3..860R. Дои:10.21105 / joss.00860.
- ^ Лю С., Мальовец Д., Ван Б. и др. Визуализация многомерных данных: достижения за последнее десятилетие [J].
- ^ а б c Дей, Тамал К.; Мемоли, Факундо; Ван, Юсу (2015-04-14). «Mutiscale Mapper: основа для топологического обобщения данных и карт». arXiv:1504.03763 [cs.CG ].
- ^ а б «Превышен предел загрузки». CiteSeerX 10.1.1.161.8956. Цитировать журнал требует
| журнал =
(помощь) - ^ Ботт, Рауль; Ту, Лоринг У. (2013-04-17). Дифференциальные формы в алгебраической топологии. Springer Science & Business Media. ISBN 978-1-4757-3951-0.
- ^ Паскуччи, Валерио; Скорцелли, Джорджио; Бремер, Пер-Тимо; Маскаренхас, Аджит (2007). «Надежное онлайн-вычисление графиков Риба: простота и скорость». Транзакции ACM на графике. 33: 58.1–58.9. Дои:10.1145/1275808.1276449.
- ^ Карри, Джастин (2013-03-13). «Пучки, пучки и аппликации». arXiv:1303.3255 [math.AT ].
- ^ Лю, Сюй; Се, Чжэн; Йи, Донъюнь (01.01.2012). «Быстрый алгоритм построения топологической структуры в больших данных». Гомологии, гомотопии и приложения. 14 (1): 221–238. Дои:10.4310 / hha.2012.v14.n1.a11. ISSN 1532-0073.
- ^ Lum, P. Y .; Singh, G .; Lehman, A .; Ишканов, Т .; Vejdemo-Johansson, M .; Alagappan, M .; Carlsson, J .; Карлссон, Г. (07.02.2013). «Извлечение информации из формы сложных данных с использованием топологии». Научные отчеты. 3: 1236. Bibcode:2013НатСР ... 3Э1236Л. Дои:10.1038 / srep01236. ЧВК 3566620. PMID 23393618.
- ^ а б c d е Карри, Джастин (2014-11-03). «Топологический анализ данных и косуки». arXiv:1411.0613 [math.AT ].
- ^ Фрозини П., Мулаццани М. Гомотопические группы размера для вычисления расстояний естественного размера [J]. Бюллетень Бельгийского математического общества Саймон Стевин, 1999, 6 (3): 455-464.
- ^ Biasotti, S .; Cerri, A .; Frosini, P .; Георгий, Д .; Ланди, К. (17 мая 2008 г.). «Функции многомерного размера для сравнения форм». Журнал математической визуализации и зрения. 32 (2): 161–179. Дои:10.1007 / s10851-008-0096-z. ISSN 0924-9907. S2CID 13372132.
- ^ а б Карлссон, Гуннар; Зомородян, Афра (24.04.2009). «Теория многомерной персистентности». Дискретная и вычислительная геометрия. 42 (1): 71–93. Дои:10.1007 / s00454-009-9176-0. ISSN 0179-5376.
- ^ Дерксен Х., Вейман Дж. Представления колчана [J]. Уведомления AMS, 2005, 52 (2): 200-206.
- ^ Атья М. Ф. О теореме Крулля-Шмидта в приложении к пучкам [J]. Bulletin de la Société Mathématique de France, 1956, 84: 307-317.
- ^ Черри А., Ди Фабио Б., Ферри М. и др. Многомерные стойкие гомологии стабильны [J]. arXiv:0908.0064, 2009.
- ^ Кальяри, Франческа; Ланди, Клаудия (2011-04-01). «Конечность ранговых инвариантов многомерных стойких групп гомологий». Письма по прикладной математике. 24 (4): 516–518. arXiv:1001.0358. Дои:10.1016 / j.aml.2010.11.004. S2CID 14337220.
- ^ Кальяри, Франческа; Ди Фабио, Барбара; Ферри, Массимо (01.01.2010). «Одномерная редукция многомерных стойких гомологий». Труды Американского математического общества. 138 (8): 3003–3017. arXiv:математика / 0702713. Дои:10.1090 / S0002-9939-10-10312-8. ISSN 0002-9939. S2CID 18284958.
- ^ Черри, Андреа; Фабио, Барбара Ди; Ферри, Массимо; Фрозини, Патрицио; Ланди, Клаудия (1 августа 2013 г.). «Числа Бетти в многомерных стойких гомологиях являются стабильными функциями». Математические методы в прикладных науках. 36 (12): 1543–1557. Bibcode:2013MMAS ... 36.1543C. Дои:10.1002 / mma.2704. ISSN 1099-1476.
- ^ Черри, Андреа; Фрозини, Патрицио (2015-03-15). «Необходимые условия разрывов многомерных персистентных чисел Бетти». Математические методы в прикладных науках. 38 (4): 617–629. Bibcode:2015MMAS ... 38..617C. Дои:10.1002 / mma.3093. ISSN 1099-1476.
- ^ Черри, Андреа; Ланди, Клаудия (2013-03-20). Гонсалес-Диас, Росио; Хименес, Мария-Хосе; Медрано, Белен (ред.). Пространство персистентности в многомерных персистентных гомологиях. Конспект лекций по информатике. Springer Berlin Heidelberg. С. 180–191. Дои:10.1007/978-3-642-37067-0_16. ISBN 978-3-642-37066-3.
- ^ Скрызалин, Яцек; Карлссон, Гуннар (14 ноября 2014 г.). «Числовые инварианты из многомерной персистентности». arXiv:1411.4022 [cs.CG ].
- ^ Карлссон, Гуннар; Сингх, Гурджит; Зомородян, Афра (16.12.2009). Дун, Инфэй; Ду, Дин-Чжу; Ибарра, Оскар (ред.). Вычисление многомерной персистентности. Конспект лекций по информатике. Springer Berlin Heidelberg. С. 730–739. CiteSeerX 10.1.1.313.7004. Дои:10.1007/978-3-642-10631-6_74. ISBN 978-3-642-10630-9. S2CID 15529723.
- ^ Аллили, Маджид; Качиньский, Томаш; Ланди, Клаудия (30 октября 2013 г.). «Редукционные комплексы в теории многомерных устойчивых гомологий». arXiv:1310.8089 [cs.CG ].
- ^ Cavazza N, Ferri M, Landi C. Оценка многомерных устойчивых гомологий с помощью конечной выборки [J]. 2010 г.
- ^ а б Карлссон, Гуннар; Сильва, Вин де (2010-04-21). «Зигзагообразное упорство». Основы вычислительной математики. 10 (4): 367–405. Дои:10.1007 / s10208-010-9066-0. ISSN 1615-3375.
- ^ Коэн-Штайнер, Дэвид; Эдельсбруннер, Герберт; Харер, Джон (2008-04-04). «Расширение настойчивости с использованием двойственности Пуанкаре и Лефшеца». Основы вычислительной математики. 9 (1): 79–103. Дои:10.1007 / s10208-008-9027-z. ISSN 1615-3375. S2CID 33297537.
- ^ де Сильва, Вин; Морозов Дмитрий; Вейдемо-Йоханссон, Микаэль (2011). «Двойственности в стойких (ко) гомологиях». Обратные задачи. 27 (12): 124003. arXiv:1107.5665. Bibcode:2011InvPr..27l4003D. Дои:10.1088/0266-5611/27/12/124003. S2CID 5706682.
- ^ Сильва, Вин де; Морозов Дмитрий; Вейдемо-Йоханссон, Микаэль (30 марта 2011 г.). «Постоянные когомологии и круговые координаты». Дискретная и вычислительная геометрия. 45 (4): 737–759. arXiv:0905.4887. Дои:10.1007 / s00454-011-9344-х. ISSN 0179-5376. S2CID 31480083.
- ^ а б Burghelea, Дан; Дей, Тамал К. (2013-04-09). «Топологическая устойчивость для карт с круговыми значениями». Дискретная и вычислительная геометрия. 50 (1): 69–98. arXiv:1104.5646. Дои:10.1007 / s00454-013-9497-х. ISSN 0179-5376. S2CID 17407953.
- ^ Новиков С. П. Квазипериодические структуры в топологии [C] // Топологические методы в современной математике, Труды симпозиума в честь шестидесятилетия Джона Милнора, проходившего в Государственном университете Нью-Йорка, Стоуни-Брук, Нью-Йорк. 1991: 223-233.
- ^ Гросс, Джонатан Л .; Йеллен, Джей (2004-06-02). Справочник по теории графов. CRC Press. ISBN 978-0-203-49020-4.
- ^ Burghelea, Дан; Халлер, Стефан (4 июня 2015 г.). «Топология угловых отображений, штрих-кодов и жордановых блоков». arXiv:1303.4328 [math.AT ].
- ^ Фрозини, Патрицио (23.06.2012). «Устойчивое сравнение многомерных персистентных групп гомологий с кручением». Acta Applicandae Mathematicae. 124 (1): 43–54. arXiv:1012.4169. Дои:10.1007 / s10440-012-9769-0. ISSN 0167-8019. S2CID 4809929.
- ^ а б c d Лесник, Майкл (2015-03-24). "Теория расстояния перемежения на модулях многомерного постоянства". Основы вычислительной математики. 15 (3): 613–650. arXiv:1106.5305. Дои:10.1007 / s10208-015-9255-у. ISSN 1615-3375. S2CID 17184609.
- ^ а б Бубеник, Петр; Скотт, Джонатан А. (28 января 2014 г.). «Категоризация стойких гомологий». Дискретная и вычислительная геометрия. 51 (3): 600–627. arXiv:1205.3669. Дои:10.1007 / s00454-014-9573-х. ISSN 0179-5376. S2CID 11056619.
- ^ а б c d е ж Бубеник, Петр; Сильва, Вин де; Скотт, Джонатан (09.10.2014). «Метрики для модулей обобщенного постоянства». Основы вычислительной математики. 15 (6): 1501–1531. CiteSeerX 10.1.1.748.3101. Дои:10.1007 / s10208-014-9229-5. ISSN 1615-3375. S2CID 16351674.
- ^ а б де Сильва, Вин; Нанда, Видит (01.01.2013). Геометрия в пространстве модулей постоянства. Материалы двадцать девятого ежегодного симпозиума по вычислительной геометрии. SoCG '13. Нью-Йорк, Нью-Йорк, США: ACM. С. 397–404. Дои:10.1145/2462356.2462402. ISBN 978-1-4503-2031-3. S2CID 16326608.
- ^ а б Де Сильва В., Грист Р. Покрытие сенсорных сетей посредством постоянной гомологии [J]. Алгебраическая и геометрическая топология, 2007, 7 (1): 339-358.
- ^ д’Амико, Микеле; Фрозини, Патрицио; Ланди, Клаудия (2008-10-14). «Естественное псевдодистанция и оптимальное соответствие между функциями уменьшенного размера». Acta Applicandae Mathematicae. 109 (2): 527–554. arXiv:0804.3500. Bibcode:2008arXiv0804.3500D. Дои:10.1007 / s10440-008-9332-1. ISSN 0167-8019. S2CID 1704971.
- ^ Di Fabio, B .; Фрозини, П. (1 августа 2013 г.). «Фильтрации, индуцированные непрерывными функциями». Топология и ее приложения. 160 (12): 1413–1422. arXiv:1304.1268. Bibcode:2013arXiv1304.1268D. Дои:10.1016 / j.topol.2013.05.013. S2CID 13971804.
- ^ Лесник, Майкл (2012-06-06). "Многомерные перемежения и приложения к топологическому выводу". arXiv:1206.1365 [math.AT ].
- ^ а б Чазаль, Фредерик; де Сильва, Вин; Глисс, Марк; Удот, Стив (16.07.2012). «Структура и устойчивость модулей персистентности». arXiv:1207.3674 [math.AT ].
- ^ Уэбб, Кэри (1 января 1985). «Декомпозиция градуированных модулей». Труды Американского математического общества. 94 (4): 565–571. Дои:10.1090 / S0002-9939-1985-0792261-6. ISSN 0002-9939.
- ^ Кроули-Боеви, Уильям (2015). «Разложение поточечно конечномерных модулей персистентности». Журнал алгебры и ее приложений. 14 (5): 1550066. arXiv:1210.0819. Дои:10.1142 / s0219498815500668. S2CID 119635797.
- ^ а б c Чазаль, Фредерик; Кроули-Боеви, Уильям; де Сильва, Вин (2014-05-22). «Наблюдаемая структура модулей персистентности». arXiv:1405.5644 [math.RT ].
- ^ Дроз, Жан-Мари (2012-10-15). «Подмножество евклидова пространства с большими гомологиями Вьеториса-Рипса». arXiv:1210.4097 [math.GT ].
- ^ а б Вайнбергер С. Что такое ... стойкая гомология? [J]. Уведомления AMS, 2011, 58 (1): 36-39.
- ^ Тернер, Кэтрин; Милейко, Юрий; Мукерджи, Саян; Харер, Джон (12.07.2014). "Средство Фреше для распределений диаграмм постоянства". Дискретная и вычислительная геометрия. 52 (1): 44–70. arXiv:1206.2790. Дои:10.1007 / s00454-014-9604-7. ISSN 0179-5376. S2CID 14293062.
- ^ а б Карлссон, Гуннар (01.05.2014). «Распознавание топологических образов для данных облака точек». Acta Numerica. 23: 289–368. Дои:10.1017 / S0962492914000051. ISSN 1474-0508.
- ^ а б Милейко, Юрий; Мукерджи, Саян; Харер, Джон (2011-11-10). «Вероятностные меры на пространстве диаграмм устойчивости». Обратные задачи. 27 (12): 124007. Bibcode:2011InvPr..27l4007M. Дои:10.1088/0266-5611/27/12/124007. ISSN 0266-5611. S2CID 250676.
- ^ Робинсон, Эндрю; Тернер, Кэтрин (2013-10-28). «Проверка гипотез для анализа топологических данных». arXiv:1310.7467 [stat.AP ].
- ^ Фаси, Бриттани Тереза; Леччи, Фабрицио; Ринальдо, Алессандро; Вассерман, Ларри; Балакришнан, Шивараман; Сингх, Арти (01.12.2014). «Наборы уверенности для диаграмм стойкости». Анналы статистики. 42 (6): 2301–2339. Дои:10.1214 / 14-AOS1252. ISSN 0090-5364.
- ^ Блумберг, Эндрю Дж .; Гал, Итамар; Mandell, Michael A .; Пансия, Мэтью (15.05.2014). «Робастная статистика, проверка гипотез и доверительные интервалы для устойчивых гомологий на пространствах метрических мер». Основы вычислительной математики. 14 (4): 745–789. arXiv:1206.4581. Дои:10.1007 / s10208-014-9201-4. ISSN 1615-3375. S2CID 17150103.
- ^ Бодо, Пьер; Беннекен, Даниэль (2015). «Гомологическая природа энтропии». Энтропия. 17 (5): 3253–3318. Bibcode:2015 Энтрп..17.3253Б. Дои:10.3390 / e17053253.
- ^ Виньо, Хуан-Пабло (2019). «Топология статистических систем: когомологический подход к теории информации» (PDF). Рукопись доктора философии: 0–226.
- ^ Бодо, Пьер; Тапиа, Моника; Беннекен, Даниэль; Гоайяр, Жан-Марк (2019). «Анализ топологической информации». Энтропия. 21 (9): 881. Bibcode:2019Entrp..21..881B. Дои:10.3390 / e21090881.
- ^ Тапиа, Моника; др. и др. (2018). «Идентичность нейротрансмиттера и электрофизиологический фенотип генетически связаны в дофаминергических нейронах среднего мозга». Научные отчеты. 8 (1): 13637. Bibcode:2018НатСР ... 813637Т. Дои:10.1038 / s41598-018-31765-z. ЧВК 6134142. PMID 30206240.
- ^ Бодо, Пьер (2019). «Элементы качественного познания: перспектива информационной топологии». Обзоры физики жизни. 31: 263–275. arXiv:1807.04520. Bibcode:2019ФЛРв..31..263Б. Дои:10.1016 / j.plrev.2019.10.003. PMID 31679788.
- ^ Бодо, Пьер (2019). "Машина Пуанкаре-Шеннона: статистическая физика и аспекты машинного обучения информационных когомологий". Энтропия. 21 (9): 881. Bibcode:2019Entrp..21..881B. Дои:10.3390 / e21090881.
- ^ Бубеник, Питер (26.07.2012). «Статистический анализ топологических данных с использованием постоянных ландшафтов». arXiv:1207.6437 [math.AT ].
- ^ Бубеник, Петр; Длотко, Павел (31 декабря 2014). «Набор инструментов для топологической статистики». Журнал символических вычислений. 78: 91–114. arXiv:1501.00179. Bibcode:2015arXiv150100179B. Дои:10.1016 / j.jsc.2016.03.009. S2CID 9789489.
- ^ Коэн-Штайнер, Дэвид; Эдельсбруннер, Герберт; Харер, Джон; Морозов, Дмитрий (2009). Материалы двадцатого ежегодного симпозиума ACM-SIAM по дискретным алгоритмам. С. 1011–1020. CiteSeerX 10.1.1.179.3236. Дои:10.1137/1.9781611973068.110. ISBN 978-0-89871-680-1.
- ^ Курлин, В. (2015). «Одномерный гомологически стойкий каркас неструктурированного облака точек в любом метрическом пространстве» (PDF). Форум компьютерной графики (CGF). 34 (5): 253–262. Дои:10.1111 / cgf.12713. S2CID 10610111.
- ^ Курлин, В. (2014). «Быстрый и надежный алгоритм для подсчета топологически стойких дыр в зашумленных облаках». Конференция IEEE 2014 года по компьютерному зрению и распознаванию образов (PDF). Конференция IEEE по компьютерному зрению и распознаванию образов. С. 1458–1463. arXiv:1312.1492. Дои:10.1109 / CVPR.2014.189. ISBN 978-1-4799-5118-5. S2CID 10118087.
- ^ Курлин, В. (2015). «Гомологически стойкий скелет - это быстрый и надежный дескриптор точек интереса в 2D-изображениях». Компьютерный анализ изображений и паттернов (PDF). Конспект лекций по информатике (Труды CAIP: компьютерный анализ изображений и шаблонов). Конспект лекций по информатике. 9256. С. 606–617. Дои:10.1007/978-3-319-23192-1_51. ISBN 978-3-319-23191-4.
- ^ Cerri, A .; Ferri, M .; Георгий, Д. (01.09.2006). «Получение изображений товарных знаков с помощью функций размера». Графические модели. Специальный выпуск конференции Vision, Video and Graphics 2005. 68 (5–6): 451–471. Дои:10.1016 / j.gmod.2006.07.001.
- ^ Шазаль, Фредерик; Коэн-Штайнер, Дэвид; Guibas, Leonidas J .; Мемоли, Факундо; Удот, Стив Ю. (1 июля 2009 г.). «Стабильные сигнатуры Громова-Хаусдорфа для форм с использованием персистентности». Форум компьютерной графики. 28 (5): 1393–1403. CiteSeerX 10.1.1.161.9103. Дои:10.1111 / j.1467-8659.2009.01516.x. ISSN 1467-8659. S2CID 8173320.
- ^ Biasotti, S .; Георгий, Д .; Spagnuolo, M .; Фальцидиено, Б. (01.09.2008). «Размерные функции для сравнения 3D-моделей». Распознавание образов. 41 (9): 2855–2873. Дои:10.1016 / j.patcog.2008.02.003.
- ^ Li, C .; Овсяников, М .; Чазал, Ф. (2014). «Структурное распознавание на основе настойчивости» (PDF). Конференция IEEE по компьютерному зрению и распознаванию образов.
- ^ Тапиа, Моника; др. и др. (2018). «Идентичность нейротрансмиттера и электрофизиологический фенотип генетически связаны в дофаминергических нейронах среднего мозга». Научные отчеты. 8 (1): 13637. Bibcode:2018НатСР ... 813637Т. Дои:10.1038 / s41598-018-31765-z. ЧВК 6134142. PMID 30206240.
- ^ Bendich, P .; Edelsbrunner, H .; Кербер, М. (01.11.2010). «Вычислительная надежность и стойкость изображений». IEEE Transactions по визуализации и компьютерной графике. 16 (6): 1251–1260. CiteSeerX 10.1.1.185.523. Дои:10.1109 / TVCG.2010.139. ISSN 1077-2626. PMID 20975165. S2CID 8589124.
- ^ Карлссон, Гуннар; Ишханов, Тигран; Сильва, Вин де; Зомородян, Афра (30.06.2007). «О локальном поведении пространств природных образов». Международный журнал компьютерного зрения. 76 (1): 1–12. CiteSeerX 10.1.1.463.7101. Дои:10.1007 / s11263-007-0056-х. ISSN 0920-5691. S2CID 207252002.
- ^ Накамура, Такенобу; Хираока, Ясуаки; Хирата, Акихико; Escolar, Emerson G .; Нисиура, Ясумаса (26 февраля 2015 г.). «Устойчивая гомология и многочастичная атомная структура для среднего порядка в стекле». Нанотехнологии. 26 (30): 304001. arXiv:1502.07445. Bibcode:2015Нанот..26Д4001Н. Дои:10.1088/0957-4484/26/30/304001. PMID 26150288. S2CID 7298655.
- ^ Николау, Моника; Левин, Арнольд Дж .; Карлссон, Гуннар (26 апреля 2011 г.). «Анализ данных на основе топологии определяет подгруппу рака груди с уникальным мутационным профилем и отличной выживаемостью». Труды Национальной академии наук. 108 (17): 7265–7270. Bibcode:2011PNAS..108.7265N. Дои:10.1073 / pnas.1102826108. ISSN 0027-8424. ЧВК 3084136. PMID 21482760.
- ^ Шмидт, Стефан; Post, Teun M .; Boroujerdi, Massoud A .; Кестерен, Шарлотта Ван; Ploeger, Bart A .; Паскуа, Оскар Э. Делла; Данхоф, Мейндерт (01.01.2011). Kimko, Holly H.C .; Пек, Карл С. (ред.). Анализ прогрессирования заболевания: к моделям, основанным на механизмах. Успехи AAPS в серии фармацевтических наук. Springer Нью-Йорк. С. 433–455. Дои:10.1007/978-1-4419-7415-0_19. ISBN 978-1-4419-7414-3.
- ^ Perea, Jose A .; Харер, Джон (29 мая 2014 г.). «Раздвижные окна и постоянство: применение топологических методов для анализа сигналов». Основы вычислительной математики. 15 (3): 799–838. CiteSeerX 10.1.1.357.6648. Дои:10.1007 / s10208-014-9206-z. ISSN 1615-3375. S2CID 592832.
- ^ ван де Вейгаерт, Риен; Вегтер, Герт; Эдельсбруннер, Герберт; Джонс, Бернард Дж. Т .; Пранав, Пратюш; Парк, Чангбом; Hellwing, Wojciech A .; Элдеринг, Боб; Круитхоф, Нико (01.01.2011). Гаврилова, Марина Л .; Тан, К. Кеннет; Мостафави, Мир Абольфазл (ред.). Труды по вычислительной науке XIV. Берлин, Гейдельберг: Springer-Verlag. С. 60–101. ISBN 978-3-642-25248-8.
- ^ Хорак, Даниела; Малетич, Слободан; Райкович, Милан (01.03.2009). «Стойкая гомология сложных сетей - IOPscience». Журнал статистической механики: теория и эксперимент. 2009 (3): P03034. arXiv:0811.2203. Bibcode:2009JSMTE..03..034H. Дои:10.1088 / 1742-5468 / 2009/03 / p03034. S2CID 15592802.
- ^ Carstens, C.J .; Хорадам, К. Дж. (2013-06-04). «Устойчивая гомология сетей сотрудничества». Математические проблемы в инженерии. 2013: 1–7. Дои:10.1155/2013/815035.
- ^ Ли, Хекён; Кан, Хеджин; Chung, M.K .; Ким, Бунг-Ньюн; Ли, Дон Су (2012-12-01). "Постоянная гомология сети мозга с точки зрения дендрограммы". IEEE Transactions по медицинской визуализации. 31 (12): 2267–2277. CiteSeerX 10.1.1.259.2692. Дои:10.1109 / TMI.2012.2219590. ISSN 0278-0062. PMID 23008247. S2CID 858022.
- ^ Петри, G .; Эксперт, П .; Turkheimer, F .; Carhart-Harris, R .; Nutt, D .; Hellyer, P.J .; Ваккарино, Ф. (06.12.2014). «Гомологические каркасы функциональных сетей мозга». Журнал интерфейса Королевского общества. 11 (101): 20140873. Дои:10.1098 / rsif.2014.0873. ISSN 1742-5689. ЧВК 4223908. PMID 25401177.
- ^ а б Макферсон, Роберт; Швайнхарт, Бенджамин (01.07.2012). «Измерение формы с топологией». Журнал математической физики. 53 (7): 073516. arXiv:1011.2258. Bibcode:2012JMP .... 53g3516M. Дои:10.1063/1.4737391. ISSN 0022-2488. S2CID 17423075.
- ^ Чан, Джозеф Минхоу; Карлссон, Гуннар; Рабадан, Рауль (2013-11-12). «Топология вирусной эволюции». Труды Национальной академии наук. 110 (46): 18566–18571. Bibcode:2013PNAS..11018566C. Дои:10.1073 / pnas.1313480110. ISSN 0027-8424. ЧВК 3831954. PMID 24170857.
- ^ Taylor, D .; др., др. (2015-08-21). «Анализ топологических данных карт заражения для изучения процессов распространения в сетях». Nature Communications. 6 (6): 7723. arXiv:1408.1168. Bibcode:2015НатКо ... 6E7723T. Дои:10.1038 / ncomms8723. ISSN 2041-1723. ЧВК 4566922. PMID 26194875.
- ^ Оффрой, М. (2016). «Анализ топологических данных: многообещающий инструмент исследования больших данных в биологии, аналитической химии и физической химии». Analytica Chimica Acta. 910: 1–11. Дои:10.1016 / j.aca.2015.12.037. PMID 26873463.
- ^ Дюпоншель, Л. (2018). «Изучение наборов данных гиперспектральных изображений с помощью анализа топологических данных». Analytica Chimica Acta. 1000: 123–131. Дои:10.1016 / j.aca.2017.11.029. PMID 29289301.
- ^ Дюпоншель, Л. (2018). «Когда дистанционное зондирование встречается с анализом топологических данных». Журнал спектральной визуализации. 7: a1. Дои:10.1255 / jsi.2018.a1.
- ^ Ван, Бао; Вэй, Го-Вэй (07.12.2014). «Объективно-ориентированные стойкие гомологии». arXiv:1412.2368 [q-bio.BM ].
- ^ Фрозини, Патрицио; Ланди, Клаудия (2011). «Единственность моделей в стойких гомологиях: случай кривых». Обратные задачи. 27 (12): 124005. arXiv:1012.5783. Bibcode:2011InvPr..27l4005F. Дои:10.1088/0266-5611/27/12/124005. S2CID 16636182.
- ^ Ся, Келин; Фэн, Синь; Тонг, Иин; Вэй, Го Вэй (2015-03-05). «Устойчивая гомология для количественного предсказания стабильности фуллерена». Журнал вычислительной химии. 36 (6): 408–422. Дои:10.1002 / jcc.23816. ISSN 1096-987X. ЧВК 4324100. PMID 25523342.
- ^ Ся, Келин; Вэй, Го-Вэй (01.08.2014). «Постоянный гомологический анализ структуры, гибкости и фолдинга белка». Международный журнал численных методов в биомедицинской инженерии. 30 (8): 814–844. arXiv:1412.2779. Bibcode:2014arXiv1412.2779X. Дои:10.1002 / cnm.2655. ISSN 2040-7947. ЧВК 4131872. PMID 24902720.
- ^ Адкок, Аарон; Карлссон, Эрик; Карлссон, Гуннар (31 мая 2016 г.). «Кольцо алгебраических функций на штрих-кодах персистентности» (PDF). Гомологии, гомотопии и приложения. 18 (1): 381–402. Дои:10.4310 / hha.2016.v18.n1.a21. S2CID 2964961.
- ^ Чепуштанова, Софья; Эмерсон, Теган; Хэнсон, Эрик; Кирби, Майкл; Мотта, Фрэнсис; Невилл, Рэйчел; Петерсон, Крис; Шипман, Патрик; Зигельмайер, Лори (22.07.2015). «Постоянные образы: альтернативное постоянное представление гомологии». arXiv:1507.06217 [cs.CG ].
- ^ Деёвель, Рене (1955-01-01). "Topologie D'Une Fonctionnelle". Анналы математики. Вторая серия. 61 (1): 13–72. Дои:10.2307/1969619. JSTOR 1969619.
- ^ де Сильва, Вин; Мунк, Элизабет; Патель, Амит (13 апреля 2016 г.). «Категоризованные графы Риба». Дискретная и вычислительная геометрия. 55 (4): 854–906. arXiv:1501.04147. Дои:10.1007 / s00454-016-9763-9. S2CID 7111141.
- ^ Гудман, Джейкоб Э. (01.01.2008). Обзоры по дискретной и вычислительной геометрии: двадцать лет спустя: совместная летняя исследовательская конференция AMS-IMS-SIAM, 18-22 июня 2006 г., Snowbird, Юта. American Mathematical Soc. ISBN 9780821842393.
- ^ Эдельсбруннер, Герберт; Харер, Джон (2008). Стойкая гомология - обзор. Современная математика. 453. AMS. С. 15–18. CiteSeerX 10.1.1.87.7764. Дои:10.1090 / conm / 453/08802. ISBN 9780821842393.
Раздел 5
дальнейшее чтение
Краткое введение
- Изучение формы данных с помощью топологии, Майкл Лесник
- Исходный материал для анализа топологических данных Микаэль Вейдемо-Йоханссон
Монография
Видео-лекция
- Введение в стойкие гомологии и Топология для анализа данных, Мэтью Райт
- Форма данных, Гуннар Карлссон
Учебник по топологии
- Алгебраическая топология, Аллен Хэтчер
- Вычислительная топология: введение, Герберт Эдельсбруннер и Джон Л. Харер
- Элементарная прикладная топология, Роберт Грист
Другие ресурсы TDA
- Прикладная топология, Стэнфорд
- Сеть исследований прикладной алгебраической топологии , Институтом математики и ее приложений
- Топологическое обучение ядра: дискретная теория Морса используется для соединения машинного обучения ядра с анализом топологических данных. https://www.researchgate.net/publication/327427685_Topological_Kernel_Learning