TinEye - TinEye

TinEye
Tineye Logo.svg
Тип сайта
Изображение Поисковый движок
Доступно вмногоязычный
ВладелецIdée, Inc.
URLTineye.com
Коммерческийда
Постановка на учетНеобязательный
Запущен6 мая 2008 г.; 12 лет назад (2008-05-06)
Текущее состояниеАктивный

TinEye это обратный поиск изображений двигатель разработан и предлагается Idée, Inc., компанией, базирующейся в Торонто, Онтарио, Канада. Это первая система поиска изображений в Интернете, которая использует идентификация изображения технологии, а не ключевых слов, метаданных или водяные знаки.[1] TinEye позволяет пользователям выполнять поиск не по ключевым словам, а по изображениям. После отправки изображения TinEye создает «уникальную и компактную цифровую подпись или отпечаток пальца» изображения и сопоставляет его с другими проиндексированными изображениями.[2] Эта процедура может сопоставить даже сильно отредактированные версии отправленного изображения, но обычно не возвращает похожие изображения в результатах.[3]

История

Idée, Inc. была основана Лейлой Буйнан и Полом Блуром в 1999 году. Idée запустила сервис 6 мая 2008 года и перешла на открытую бета-версию в августе того же года.[4][5]Хотя исследовательские проекты по компьютерному зрению и идентификации изображений начались еще в 1980-х годах,[6] компания утверждает, что TinEye - первая поисковая машина изображений в Интернете, использующая технологию идентификации изображений. Сервис был создан с Авторские права владельцы и маркетологи брендов в качестве предполагаемой базы пользователей, чтобы искать несанкционированное использование и отслеживать, где соответственно появляются бренды.[7]

В июне 2014 года TinEye заявила, что для сравнения проиндексировала более пяти миллиардов изображений.[8] Однако это относительно небольшая часть от общего количества изображений, доступных на Всемирная паутина.[9]

По состоянию на сентябрь 2020 года результаты поиска TinEye утверждают, что для сравнения проиндексировано более 41,9 миллиарда изображений.

Технологии

Пользователь загружает изображение в поисковую систему (размер загрузки ограничен 20 МБ) или предоставляет URL для изображения или для страницы, содержащей изображение. Поисковая система найдет другое использование изображения в Интернет, включая измененные изображения, основанные на этом изображении, и сообщить дату и время их публикации. TinEye не распознавать очертания предметов или выполнить распознавание лиц, но распознает все изображение целиком и некоторые его измененные версии. Сюда входят уменьшенные, большие и обрезанные версии изображения. TinEye показал себя способным извлекать из своей базы данных разные изображения одного и того же объекта, например, известных достопримечательностей.[10]

TinEye может искать изображения в JPEG, Гифка, или же PNG формат. По состоянию на 2009 год, другие форматы, содержащие изображения в Интернете, например Adobe Flash, недоступны для поиска.[11]

Результаты, полученные с помощью TinEye, включают в себя общее количество совпадений в их базе данных, сгенерированных отправленным изображением, изображение предварительного просмотра и URL-адрес каждого совпадения, а также функцию, называемую Сравнить изображения. Сравнение изображений предоставляет окно, в котором пользователь может переключаться между исходным изображением и результатом поиска.[12] TinEye может сортировать результаты по наилучшему, худшему, самому большому или самому маленькому изображению.

Регистрация пользователя не является обязательной и позволяет хранить предыдущие запросы пользователя. Другие функции включают встраиваемый виджеты и букмарклеты. TinEye также выпустила свой коммерческий API.

Алгоритм

Хотя TinEye не раскрывает точные используемые алгоритмы, существуют методы, похожие на описание того, как это работает компания, которые достигают той же цели сопоставления изображений. Один из таких алгоритмов перцептивное хеширование который используется для создания хэш из образца изображения. Вот пример базового алгоритма среднего хеширования, который похож на перцепционный хеш, но проще, чем перцепционный хеш, написанный доктором Нилом Кравец:[13]

  1. Уменьшить размер На изображениях высокие частоты придают детали, а низкие частоты показывают структуру; мы хотим последнего. Самый быстрый способ убрать высокие частоты и детали - уменьшить изображение. В этом случае уменьшите его до 8x8, чтобы всего было 64 пикселя. Не беспокойтесь о соотношении сторон, просто сократите его до квадрата 8x8. Таким образом, хеш будет соответствовать любому варианту изображения, независимо от масштаба или соотношения сторон.
  2. Уменьшить цвет Вычислите среднее значение 64 цветов.
  3. Усредните цвета Чтобы получить самые низкие частоты в изображении, возьмите только меньшую часть уже уменьшенного изображения. Например, если DCT (Дискретное косинусное преобразование, преобразование, связанное с Фурье) составляет 32x32, просто оставьте верхний левый 8x8.
  4. От байтов к битам Каждый бит просто устанавливается в зависимости от того, находится ли значение цвета выше или ниже среднего.
  5. Создайте хеш Установите 64 бита в 64-битное целое число. Порядок не имеет значения, если вы последовательны. Ваш конечный результат будет выглядеть примерно так: 8f373714acfcf4d0

Результирующий хеш не изменится, если изображение масштабируется или изменяется соотношение сторон. Увеличение или уменьшение яркости или контрастности, или даже изменение цветов не сильно изменит значение хеш-функции.

Чтобы сравнить два изображения, создайте хэш из каждого изображения и подсчитайте количество различающихся битовых позиций. Это Расстояние Хэмминга. Нулевое расстояние указывает на то, что это, вероятно, очень похожее изображение или вариант того же изображения. Расстояние 5 означает, что некоторые вещи могут отличаться, но они, вероятно, все еще достаточно близки, чтобы быть похожими. Расстояние 10 или более является вероятным признаком того, что изображения разные.

использование

Способность TinEye искать в Интернете определенные изображения (и модификации этих изображений) делает его потенциальным инструментом для владельцев авторских прав на визуальные произведения, позволяющие обнаружить нарушения их авторских прав. Это также открывает возможности для людей, которые хотят использовать изображения под сиротские работы чтобы найти правообладателей на эти изображения. Сиротские работы можно определить как «произведения, охраняемые авторским правом, чьих владельцев сложно или невозможно идентифицировать и / или найти»,[14] использование TinEye потенциально может удалить статус работы сироты из онлайн-изображений, которые можно найти в его базе данных.

Смотрите также

Рекомендации

  1. ^ Что такое TinEye?
  2. ^ Как работает TinEye?
  3. ^ Может ли TinEye найти похожие изображения?
  4. ^ «Релизы». Tineye.com. Получено 21 февраля, 2013.
  5. ^ Клэберн, Томас (18 августа 2008 г.). «Поиск изображений TinEye обнаруживает нарушителей авторских прав». Информационная неделя. Получено 28 сентября, 2014.
  6. ^ Szeliski, Ричард (2010). Компьютерное зрение: алгоритмы и приложения. Издательство Springer. п. 832. ISBN  9781848829343.
  7. ^ Джордж-Кош, Дэвид (без даты). «TinEye Иди - следующий рубеж в поиске в Интернете» (PDF). Национальная почта. Получено 11 февраля, 2010.
  8. ^ "Проверено 1 июля 2014 г.". Tineye.com. Получено 1 июля, 2014.
  9. ^ «По состоянию на 10 сентября на Flickr размещено 5 миллиардов изображений - последнее обращение 6 апреля 2011 г.». Royal.pingdom.com. Получено 21 февраля, 2013.
  10. ^ Элиас, Жан-Клод. (11 декабря 2009 г.). Поиск по фото. Джордан Таймс. Получено 19.02.10 из базы данных Factiva.
  11. ^ Кречевский, Кертис. (1 мая 2009 г. «Проблемы поиска логотипов и изображений в Интернете». Право интеллектуальной собственности и бизнес. 7 (5). Получено 19.02.10 из базы данных Factiva.
  12. ^ «Станьте онлайн-детективом с TinEye». Groovypost.com. 18 января 2010 г.. Получено 25 июня, 2013.
  13. ^ «Инструменты, методы и касательные». Доктор Нил Кравец.
  14. ^ Йе, Б. (1 февраля 2010 г.). «Произведения-сироты» в авторском праве. Исследовательская служба Конгресса США. Получено 19.02.10 из базы данных Factiva.

внешняя ссылка