Индекс Тверски - Tversky index

В Индекс Тверски, названный в честь Амос Тверски,^[1] асимметричный мера сходства на наборы который сравнивает вариант с прототипом. Индекс Тверски можно рассматривать как обобщение Коэффициент Соренсена – Дайса и Коэффициент Танимото (он же Индекс Жаккара ).

Для наборов Икс и Y индекс Тверски - это число от 0 до 1, задаваемое

${ Displaystyle S (X, Y) = { frac {| X cap Y |} {| X cap Y | + alpha | X-Y | + beta | Y-X |}}}$ ,

Вот, ${ Displaystyle X-Y}$ обозначает относительное дополнение Y в X.

В дальнейшем, ${ Displaystyle альфа, бета geq 0}$ являются параметрами индекса Тверски. Настройка ${ Displaystyle альфа = бета = 1}$ производит коэффициент Танимото; установка ${ Displaystyle альфа = бета = 0,5}$ дает коэффициент Соренсена – Дайса.

Если мы рассмотрим Икс быть прототипом и Y быть вариантом, то ${ displaystyle alpha}$ соответствует весу прототипа и ${ displaystyle beta}$ соответствует весу варианта. Тверски меры с ${ Displaystyle альфа + бета = 1}$ представляют особый интерес.^[2]

Из-за присущей асимметрии индекс Тверски не соответствует критериям метрики сходства. Однако, если требуется симметрия, был предложен вариант исходной формулировки с использованием Максимум и мин функции^[3].

${ Displaystyle S (X, Y) = { гидроразрыва {| X cap Y |} {| X cap Y | + beta left ( alpha a + (1- alpha) b right)}}}$ ,

${ Displaystyle а = мин влево (| X-Y |, | Y-X | вправо)}$ ,

${ Displaystyle б = макс влево (| X-Y |, | Y-X | вправо)}$ ,

Эта формулировка также меняет порядок параметров ${ displaystyle alpha}$ и ${ displaystyle beta}$ . Таким образом, ${ displaystyle alpha}$ контролирует баланс между ${ displaystyle | X-Y |}$ и ${ displaystyle | Y-X |}$ в знаменателе. Так же, ${ displaystyle beta}$ контролирует эффект симметричной разности ${ Displaystyle | Х , треугольник , Y , |}$ против ${ displaystyle | X cap Y |}$ в знаменателе.

Заметки

^ Тверски, Амос (1977). «Особенности сходства» (PDF). Психологический обзор. 84 (4): 327–352. Дои:10.1037 / 0033-295x.84.4.327.
^ http://www.daylight.com/dayhtml/doc/theory/theory.finger.html
^ Хименес, С., Бесерра, К., Гелбух, А. SOFTCARDINALITY-CORE: улучшение перекрытия текста с помощью распределительных мер для семантического текстового сходства. Вторая совместная конференция по лексической и вычислительной семантике (* SEM), Том 1: Материалы основной конференции и общая задача: семантическое текстовое сходство, стр.194-201, 7–8 июня 2013 г., Атланта, Джорджия, США.

[1] Тверски, Амос (1977). «Особенности сходства» (PDF). Психологический обзор. 84 (4): 327–352. Дои:10.1037 / 0033-295x.84.4.327.

[2] ttp://www.daylight.com/dayhtml/doc/theory/theory.finger.html

[3] Хименес, С., Бесерра, К., Гелбух, А. SOFTCARDINALITY-CORE: улучшение перекрытия текста с помощью распределительных мер для семантического текстового сходства. Вторая совместная конференция по лексической и вычислительной семантике (* SEM), Том 1: Материалы основной конференции и общая задача: семантическое текстовое сходство, стр.194-201, 7–8 июня 2013 г., Атланта, Джорджия, США.

[1]

[2]

[3]