Начальная дистанция Фреше - Fréchet inception distance

В Начальное расстояние по Фреше (FID) это метрика используется для оценки качества изображений, созданных генератором порождающая состязательная сеть (ГАН).[1] В отличие от более ранних начальная оценка (IS), который оценивает только распределение сгенерированных изображений, FID сравнивает распределение сгенерированных изображений с распределением реальных изображений, которые использовались для обучения генератора.[1][2]

Метрика FID - это Расстояние Фреше между двумя многомерные гауссовские распределения: , распределение функций Inception v3 изображений, созданных GAN и , распространение функций Inception v3 из «мира» или реальных изображений, используемых для обучения GAN. В результате его можно вычислить из среднего и ковариация активаций, когда синтезированные и реальные изображения поступают в сеть Inception как:[1][2][3]

Вместо прямого сравнения изображений пиксель за пикселем (например, как это делает L2 норма ), FID сравнивает среднее значение и стандартное отклонение одного из более глубоких слоев в Inception v3, a Сверточная нейронная сеть. Эти слои расположены ближе к выходным узлам, которые соответствуют объектам реального мира, таким как определенная порода собак или самолет, и дальше от мелких слоев рядом с входным изображением. В результате они имеют тенденцию имитировать человеческое восприятие сходства изображений.[нужна цитата ].

Метрика FID - это текущая стандартная метрика для оценки качества GAN по состоянию на 2020 год. Она использовалась для измерения качества многих недавних GAN.[2] включая StyleGAN1 с высоким разрешением[4] и StyleGAN2[5] сети

История

Метрика FID была введена в 2017 году.[1] Он вдохновлен Расстояние Фреше введен в 1957 г. М. Фреше.[6]

Рекомендации

  1. ^ а б c d Heusel, Martin; Рамзауэр, Хуберт; Унтертинер, Томас; Несслер, Бернхард; Хохрайтер, Зепп (12 января 2018 г.). «GAN, обученные правилом обновления двух шкал времени, сходятся к локальному равновесию по Нэшу». arXiv:1706.08500 [cs.LG ].
  2. ^ а б c Джин, Нил (15 июля 2018 г.). «Начальная дистанция Фреше». Нил Джин. Получено 3 июля 2020.
  3. ^ Доусон, Д. С.; Ландау Б.В. (1 сентября 1982 г.). «Расстояние Фреше между многомерными нормальными распределениями». Журнал многомерного анализа. 12 (3): 450–455. Дои:10.1016 / 0047-259X (82) 90077-X. ISSN  0047-259X.
  4. ^ Каррас, Теро; Лайне, Самули; Айла, Тимо (2020). "Архитектура генератора на основе стиля для генеративных состязательных сетей". IEEE Transactions по анализу шаблонов и машинному анализу. PP: 1. arXiv:1812.04948. Дои:10.1109 / TPAMI.2020.2970919. PMID  32012000.
  5. ^ Каррас, Теро; Лайне, Самули; Айттала, Мийка; Хеллстен, Янне; Лехтинен, Яакко; Айла, Тимо (23 марта 2020 г.). «Анализ и улучшение качества изображения StyleGAN». arXiv:1912.04958 [cs.CV ].
  6. ^ Fréchet., М. (1957). "Sur la distance de deux lois de probabilité". C. R. Acad. Sci. Париж. 244: 689–692.