Паутина (кластеризация) - Cobweb (clustering)

COBWEB представляет собой инкрементную систему для иерархических концептуальная кластеризация. COBWEB был изобретен профессором Дуглас Х. Фишер, в настоящее время учится в Университете Вандербильта.[1][2]

COBWEB постепенно организует наблюдения в дерево классификации. Каждый узел в дереве классификации представляет класс (концепцию) и помечен вероятностным понятием, которое суммирует распределения значений атрибутов объектов, классифицированных в этом узле. Это дерево классификации можно использовать для прогнозирования отсутствующих атрибутов или класса нового объекта.[3]

COBWEB использует четыре основных операции при построении дерева классификации. Выбор операции зависит от категория полезность классификации, полученной путем ее применения. Операции следующие:

  • Слияние двух узлов
    Слияние двух узлов означает их замену узлом, дочерние элементы которого являются объединением наборов дочерних узлов исходных узлов и который суммирует распределения значений атрибутов всех объектов, классифицированных в соответствии с ними.
  • Разделение узла
    Узел разделяется путем замены его дочерними элементами.
  • Вставка нового узла
    Создается узел, соответствующий вставляемому в дерево объекту.
  • Передача объекта по иерархии
    Эффективный вызов алгоритма COBWEB для объекта и поддерева с корнем в узле.

Алгоритм COBWEB

  COBWEB(корень, записывать): Вход: узел COBWEB корень, экземпляр для вставки записывать  если корень не имеет детей тогда    дети := {копировать(корень)}    новая категория(записывать)  добавляет дочерний элемент со значениями характеристик записи. вставлять(записывать, корень)  обновить статистику root еще    вставлять(записывать, корень)    за ребенок в кореньДети делать      рассчитать категорию полезности для вставлять(записывать, ребенок),      набор лучший1, лучший2 дети ж. лучший кр. конец для    если новая категория(записывать) дает лучший CU, тогда новая категория(записывать)    еще если слияние(лучший1, лучший2) дает лучший CU, тогда слияние(лучший1, лучший2)      COBWEB(корень, записывать)    иначе если расколоть(лучший1) дает лучший CU, тогда расколоть(лучший1)      COBWEB(корень, записывать)    еще      COBWEB(лучший1, записывать)    конец, если  конец

внешняя ссылка

Рекомендации

  1. ^ Фишер, Дуглас (1987). «Приобретение знаний посредством инкрементальной концептуальной кластеризации». Машинное обучение. 2 (2): 139–172. Дои:10.1007 / BF00114265.
  2. ^ Фишер, Дуглас Х. (июль 1987 г.). «Улучшение вывода через концептуальную кластеризацию». Материалы конференций AAAI 1987 г.. Конференция AAAI. Сиэтл, Вашингтон. С. 461–465.
  3. ^ Уэйн Иба и Пэт Лэнгли. «Паутинные модели категоризации и формирования вероятностных концепций». В Эммануэле М. Потосе и Энди Дж. Уиллсе (ред.). Формальные подходы к категоризации. Кембридж: Издательство Кембриджского университета. С. 253–273. ISBN  9780521190480.