Weka (машинное обучение) - Википедия - Weka (machine learning)
Логотип Weka с изображением Weka, птица эндемичный в Новую Зеландию | |
Weka 3.5.5 с окном проводника, открытым с помощью Iris UCI набор данных | |
Разработчики) | Университет Вайкато |
---|---|
Стабильный выпуск | 3.8.5 (стабильный) / 21 декабря 2020 г. |
Предварительный выпуск | 3.9.5 / 21 декабря 2020 г. |
Репозиторий | |
Написано в | Ява |
Операционная система | Windows, OS X, Linux |
Платформа | IA-32, x86-64; Java SE |
Тип | Машинное обучение |
Лицензия | Стандартная общественная лицензия GNU |
Интернет сайт | www |
Среда Вайкато для анализа знаний (Weka), разработанная в Университет Вайкато, Новая Зеландия, является бесплатно программное обеспечение под лицензией Стандартная общественная лицензия GNU, а также программное обеспечение, сопутствующее книге «Интеллектуальный анализ данных: практические инструменты и методы машинного обучения».[1]
Описание
Weka содержит набор инструментов и алгоритмов визуализации для анализ данных и прогнозное моделирование вместе с графическим пользовательским интерфейсом для легкого доступа к этим функциям.[1] Первоначальная версия Weka, отличная от Java, была Tcl / Tk интерфейс для (в основном сторонних) алгоритмов моделирования, реализованных на других языках программирования, а также предварительная обработка данных коммунальные услуги в C, а Makefile система для проведения экспериментов по машинному обучению. Эта оригинальная версия была в первую очередь разработана как инструмент для анализа данных из сельскохозяйственных областей,[2][3] но более поздние полностью Ява Версия на основе Weka (Weka 3), разработка которой началась в 1997 году, в настоящее время используется во многих различных прикладных областях, в частности, в образовательных целях и в исследованиях. Преимущества Weka:
- Бесплатная доступность под Стандартная общественная лицензия GNU.
- Переносимость, так как полностью реализована в Язык программирования Java и, таким образом, работает практически на любой современной вычислительной платформе.
- Исчерпывающий набор методов предварительной обработки данных и моделирования.
- Простота использования благодаря графическому пользовательскому интерфейсу.
Weka поддерживает несколько стандартных сбор данных задачи, а точнее предварительная обработка данных, кластеризация, классификация, регресс, визуализация и выбор функции. Все методы Weka основаны на предположении, что данные доступны в виде одного плоского файла или отношения, где каждая точка данных описывается фиксированным числом атрибутов (обычно числовые или номинальные атрибуты, но также поддерживаются некоторые другие типы атрибутов) . Weka предоставляет доступ к SQL базы данных с помощью Подключение к базе данных Java и может обрабатывать результат, возвращаемый запросом к базе данных. Weka предоставляет доступ к глубокое обучение с Deeplearning4j.[4] Он не поддерживает мульти-реляционный анализ данных, но есть отдельное программное обеспечение для преобразования набора связанных таблиц базы данных в единую таблицу, которая подходит для обработки с помощью Weka.[5] Еще одна важная область, которая в настоящее время не охвачена алгоритмами, включенными в дистрибутив Weka, - это моделирование последовательностей.
Пакеты расширения
В версии 3.7.2 был добавлен менеджер пакетов, позволяющий упростить установку пакетов расширений.[6]Некоторые функции, которые раньше были включены в Weka до этой версии, с тех пор были перенесены в такие пакеты расширений, но это изменение также упрощает другим пользователям вносить расширения в Weka и поддерживать программное обеспечение, поскольку эта модульная архитектура позволяет выполнять независимые обновления ядро Weka и отдельные расширения.
История
- В 1993 г. Университет Вайкато в Новая Зеландия началась разработка исходной версии Weka, которая стала смесью Tcl / Tk, C и Makefiles.
- В 1997 году было принято решение заново разработать Weka с нуля на Java, включая реализации алгоритмов моделирования.[7]
- В 2005 году Weka получила SIGKDD Премия за службу интеллектуального анализа данных и обнаружения знаний.[8][9]
- В 2006 г. Пентахо Корпорация приобрела эксклюзивную лицензию на использование Weka для бизнес-аналитика.[10] Он формирует интеллектуальный анализ данных и прогнозная аналитика компонент пакета бизнес-аналитики Pentaho. С тех пор Pentaho был приобретен Hitachi Vantara, и Weka теперь поддерживает компонент с открытым исходным кодом PMI (Plugin for Machine Intelligence).[11]
Связанные инструменты
- Auto-WEKA - это автоматизированное машинное обучение система для Weka.[12]
- Среда для разработки KDD-приложений, поддерживаемых Index-Structures (ELKI ) - проект, похожий на Weka, с упором на кластерный анализ, то есть неконтролируемые методы.
- H2O.ai платформа для анализа данных и машинного обучения с открытым исходным кодом
- KNIME программное обеспечение для машинного обучения и интеллектуального анализа данных, реализованное в Ява.
- Массовый онлайн-анализ (MOA) - это проект с открытым исходным кодом для крупномасштабного анализа потоков данных, также разработанный в Университет Вайкато в Новая Зеландия.
- Нейронный дизайнер программное обеспечение интеллектуального анализа данных, основанное на глубокое обучение методы, написанные в C ++.
- апельсин аналогичный проект с открытым исходным кодом для интеллектуального анализа данных, машинного обучения и визуализации на основе scikit-learn.
- RapidMiner это реклама машинное обучение структура реализована в Ява который объединяет Weka.
- Scikit-Learn - популярная библиотека машинного обучения на Python.
Смотрите также
Рекомендации
- ^ а б Виттен, Ян Х.; Франк, Эйбе; Холл, Марка А .; Пал, Кристофер Дж. (2011). «Интеллектуальный анализ данных: практические инструменты и методы машинного обучения, 3-е издание». Морган Кауфманн, Сан-Франциско (Калифорния). Получено 2011-01-19.
- ^ Холмс, Джеффри; Донкин Андрей; Виттен, Ян Х. (1994). "Weka: инструмент для машинного обучения" (PDF). Труды Второй конференции Австралии и Новой Зеландии по интеллектуальным информационным системам, Брисбен, Австралия. Получено 2007-06-25.
- ^ Гарнер, Стивен Р .; Каннингем, Салли Джо; Холмс, Джеффри; Невилл-Мэннинг, Крейг Г.; Виттен, Ян Х. (1995). «Применение инструментария машинного обучения: опыт работы с сельскохозяйственными базами данных» (PDF). Труды семинара по машинному обучению на практике, Конференция по машинному обучению, Тахо-Сити (Калифорния), США. стр. 14–21. Получено 2007-06-25.
- ^ «Метаданные пакета Weka». SourceForge. 2017. Получено 2017-11-11.
- ^ Reutemann, Питер; Пфарингер, Бернхард; Франк, Эйбе (2004). «Правильный: набор инструментов для изучения реляционных данных с предполагаемыми и многоэкземплярными учащимися». 17-я Австралийская объединенная конференция по искусственному интеллекту (AI2004). Springer-Verlag. CiteSeerX 10.1.1.459.8443.
- ^ "weka-wiki - Пакеты". Получено 27 января 2020.
- ^ Виттен, Ян Х .; Франк, Эйбе; Тригг, Лен; Холл, Марка А .; Холмс, Джеффри; Каннингем, Салли Джо (1999). «Weka: практические инструменты и методы машинного обучения с реализациями Java» (PDF). Материалы семинара ICONIP / ANZIIS / ANNES'99 по разработке новых знаний и коннекционистским информационным системам. стр. 192–196. Получено 2007-06-26.
- ^ Пятецкий-Шапиро, Григорий И. (2005-06-28). "Новости KDnuggets о SIGKDD Service Award 2005". Получено 2007-06-25.
- ^ «Обзор победителей SIGKDD Service Award». 2005. Получено 2007-06-25.
- ^ «Pentaho приобретает Weka Project». Пентахо. Получено 2018-02-06.
- ^ «Плагин для машинного интеллекта».
- ^ Торнтон, Крис; Хаттер, Фрэнк; Хус, Хольгер Х.; Лейтон-Браун, Кевин (2013). Auto-WEKA: комбинированный выбор и гиперпараметрическая оптимизация алгоритмов классификации. KDD '13 Материалы 19-й международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных. С. 847–855.
внешняя ссылка
- Официальный веб-сайт в Университете Вайкато в Новой Зеландии