VisualRank - VisualRank
VisualRank это система для находка и ранжирование изображений путем анализа и сравнения их содержания, а не поиска по названиям изображений, веб-ссылкам или другому тексту. Google ученые обнародовали результаты своей работы VisualRank в статье, описывающей применение PageRank к поиску изображений Google на Международной конференции в Интернете в Пекин в 2008.[1]
Мы ставим задачу ранжирования изображений в задачу определения «авторитетных» узлов на предполагаемом графе визуального сходства и предлагаем VisualRank для анализа структур визуальных связей между изображениями. Изображения, признанные «авторитетными», выбираются как те, которые хорошо отвечают на запросы изображений.
Методы
Обе компьютерное зрение методы и хеширование с учетом местоположения (LSH) используются в VisualRank алгоритм. Рассмотрим поиск изображений, инициированный текстовым запросом. Существующий метод поиска, основанный на метаданных изображения и окружающем тексте, используется для получения кандидатов в исходные результаты (PageRank ), которые вместе с другими изображениями в индексе группируются в график в соответствии с их сходством (рассчитанным заранее). Центральность затем измеряется при кластеризации, которая возвращает наиболее канонические изображения по отношению к запросу. Идея заключается в том, что соглашение между пользователями Интернета об изображении и связанных с ним концепциях приведет к тому, что эти изображения будут считаться более похожими. VisualRank итеративно определяется , куда - матрица подобия изображений. В качестве матриц используются центральность собственного вектора будет применяемой мерой с многократным умножением и производство собственный вектор мы ищем. Очевидно, что измерение сходства изображений имеет решающее значение для производительности VisualRank, поскольку оно определяет базовую структуру графа.
Основная система VisualRank начинается с локальных векторов признаков, извлекаемых из изображений с использованием масштабно-инвариантное преобразование признаков (ПРОСЕЯТЬ). Дескрипторы локальных объектов используются вместо цветовых гистограмм, поскольку они позволяют учитывать сходство между изображениями с потенциальными преобразованиями поворота, масштаба и перспективы. Затем к этим векторам признаков применяется хеширование с учетом местоположения с помощью p-стабильная схема распределения. В дополнение к этому применяется усиление LSH с использованием конструкций И / ИЛИ. В рамках применяемой схемы Гауссово распределение используется под норма.
Рекомендации
- ^ Юши Цзин и Балуджа, С. (2008). «VisualRank: Применение PageRank для поиска крупномасштабных изображений». IEEE Transactions по анализу шаблонов и машинному анализу. 30 (11): 1877–1890. CiteSeerX 10.1.1.309.741. Дои:10.1109 / TPAMI.2008.121. ISSN 0162-8828. PMID 18787237..