Поисковая система TREX - TREX search engine

ТРЕКС это поисковая система в SAP NetWeaver интегрированная технологическая платформа производства SAP SE с помощью столбчатое хранилище.[1] Механизм TREX - это автономный компонент, который может использоваться в различных системных средах, но используется в основном как неотъемлемая часть продуктов SAP, таких как корпоративный портал, хранилище знаний и Business Intelligence (BI, ранее Хранилище бизнес-информации SAP ). В SAP NetWeaver BI механизм TREX обеспечивает работу BI Accelerator, который представляет собой подключаемый модуль для повышения производительности онлайн-аналитическая обработка. Название «TREX» означает Поиск текста и извлечение информации, но это не зарегистрированная торговая марка SAP и не используется в маркетинговых материалах.

Функции поиска

TREX поддерживает различные виды текстового поиска, включая точный поиск, логический поиск, поиск по шаблонам, лингвистический поиск (грамматические варианты нормализованы для поиска по индексу) и нечеткий поиск (входные строки, которые отличаются на несколько букв от термина индекса, нормализованы для поиск по индексу). Наборы результатов ранжируются с использованием термина "частота-обратная частота документа" (tf-idf ), а результаты могут включать фрагменты с выделенными условиями поиска.

TREX поддерживает интеллектуальный анализ текста и классификация с использованием векторная космическая модель. Группы документов могут быть классифицированы с использованием классификации на основе запроса, классификации на основе примеров или их комбинации плюс управление ключевыми словами.

TREX поддерживает поиск по структурированным данным не только по метаданным документа, но и по массовым бизнес-данным и данным в SAP. BusinessObjects. Индексы для структурированных данных реализованы компактно с использованием Сжатие данных данные могут быть агрегированы за линейное время, что позволяет обрабатывать большие объемы данных полностью в памяти.

Последние разработки включают:

  • Механизм объединения для объединения структурированных данных из разных полей в бизнес-объектах
  • Возможность быстрого обновления для записи дельта-индекса рядом с основным индексом и их объединения в автономном режиме, в то время как второй дельта-индекс принимает обновления.
  • А сбор данных пакет функций для расширенного математического анализа

История

Первый код для механизма был написан в 1998 году, а TREX стал компонентом SAP в 2000 году. SAP NetWeaver BI Accelerator был впервые запущен в 2005 году. По состоянию на первый квартал 2013 года текущим выпуском TREX является SAP NW 7.1.

Безопасность

Уязвимость системы безопасности в TREX была впервые обнаружена и исправлена ​​в 2015 году (см. SAP Security Note 2234226 )[1]. Уязвимость возникла из-за отсутствия аутентификации в TREXnet, внутреннем протоколе связи. Вышеупомянутый патч устранил проблему, удалив некоторые важные функции.

Позже руководитель отдела разведки угроз ERPScan Мэтью Гели продолжил изучение уязвимости и обнаружил, что уязвимость все еще может быть использована. [2]. Более того, в случае успешной атаки уязвимость позволит удаленному злоумышленнику получить полный контроль над сервером без авторизации. [3]. Наконец, уязвимость была исправлена ​​с помощью SAP Security Note 2419592.

Рекомендации

  1. ^ Даниэль Абади; Петер Бонч; Ставрос Харизопулос; Stratos Idreos; Сэмюэл Мэдден (2012). «Разработка и внедрение современных систем баз данных, ориентированных на столбцы» (PDF). Основы и тенденции в базах данных. 5 (3): 197–280. Дои:10.1561/1900000024.

внешняя ссылка