Поиск музыкальной информации - Music information retrieval

Поиск музыкальной информации (МИР) - междисциплинарная наука о поиске Информация из Музыка. MIR - это небольшая, но развивающаяся область исследований с множеством реальных приложений. Те, кто участвует в МИР, могут иметь опыт работы в музыковедение, психоакустика, психология, академическая музыка, обработка сигналов, информатика, машинное обучение, оптическое распознавание музыки, вычислительный интеллект или их комбинация.

Приложения

MIR используется компаниями и учеными для классификации, манипулирования и даже создания музыки.

Рекомендательные системы

Несколько рекомендательные системы для музыки уже существуют, но на удивление немногие из них основаны на методах MIR, вместо этого используют сходство между пользователями или трудоемкий сбор данных. Пандора, например, использует экспертов, чтобы пометить музыку определенными качествами, такими как «певица» или «сильная басовая линия». Многие другие системы находят пользователей с похожей историей прослушивания и предлагают пользователям неслышную музыку из их соответствующих коллекций. Техника МИР для сходство в музыке теперь начинают составлять часть таких систем.

Разделение треков и распознавание инструментов

Разделение треков заключается в извлечении исходных треков в том виде, в котором они были записаны, при этом на треке может играть более одного инструмента. Распознавание инструментов - это идентификация задействованных инструментов и / или разделение музыки на одну дорожку для каждого инструмента. Были разработаны различные программы, которые могут разделять музыку на составляющие треки без доступа к основной копии. Таким образом, например, караоке-треки могут быть созданы из обычных музыкальных треков, хотя этот процесс еще не совершенен из-за того, что вокал занимает часть того же частотного пространства, что и другие инструменты.

Автоматическая транскрипция музыки

Автоматический транскрипция музыки представляет собой процесс преобразования аудиозаписи в символическое обозначение, такое как партитура или MIDI файл.[1] Этот процесс включает в себя несколько задач аудиоанализа, которые могут включать в себя обнаружение нескольких шагов, обнаружение начала, оценка длительности, идентификация инструмента и извлечение гармонической, ритмической или мелодической информации. Эта задача становится более сложной с большим количеством инструментов и большим количеством инструментов. уровень полифонии.

Автоматическая категоризация

Категоризация музыкальных жанров - обычная задача для MIR и обычная задача для ежегодного обмена оценками поиска музыкальной информации (MIREX).[2] Методы машинного обучения, такие как опорные векторные машины имеют тенденцию работать хорошо, несмотря на несколько субъективный характер классификации. Другие возможные классификации включают определение художника, места происхождения или настроения произведения. Если на выходе ожидается число, а не класс, регрессивный анализ необходимо.

Музыкальное поколение

В автоматическая генерация музыки - цель многих исследователей МИР. Были предприняты попытки с ограниченным успехом с точки зрения оценки результатов людьми.

Используемые методы

Источник данных

Очки дать четкое и логичное описание музыки, с которой можно работать, но доступ к нотам, цифровым или другим, часто непрактичен. MIDI музыка также использовалась по тем же причинам, но некоторые данные теряются при преобразовании в MIDI из любого другого формата, если музыка не была написана с учетом стандартов MIDI, что бывает редко. Цифровые аудиоформаты, такие как WAV, mp3, и ogg используются, когда сам звук является частью анализа. Форматы с потерями, такие как mp3 и ogg, хорошо работают с человеческим ухом, но могут не содержать важных данных для изучения. Кроме того, некоторые кодировки создают артефакты, которые могут ввести в заблуждение любой автоматический анализатор. Несмотря на это, повсеместное распространение mp3 означает, что многие исследования в этой области привлекают их в качестве исходного материала. Все чаще метаданные, полученные из Интернета, включаются в MIR для более всестороннего понимания музыки в ее культурном контексте, и в последнее время это состоит из анализа социальные теги для музыки.

Представление функции

Анализ часто может потребовать некоторого обобщения,[3] а для музыки (как и для многих других форм данных) это достигается извлечение признаков, особенно когда анализируется сам аудиоконтент и применяется машинное обучение. Цель состоит в том, чтобы сократить огромное количество данных до управляемого набора значений, чтобы обучение могло быть выполнено в разумные сроки. Извлечен один общий признак: Кепстральный коэффициент частоты Mel (MFCC), который является мерой тембр музыкального произведения. Другие функции могут использоваться для представления ключ, аккорды, гармонии, мелодия, главный подача, Ударов в минуту или ритм в пьесе. Есть ряд доступных инструментов для извлечения аудиофайлов.[4] Доступно здесь

Статистика и машинное обучение

Другие вопросы

  • Человеко-компьютерное взаимодействие и интерфейсы - мультимодальные интерфейсы, пользовательские интерфейсы и удобство использования, мобильные приложения, поведение пользователей
  • Восприятие музыки, познание, аффект и эмоции - музыка метрики сходства, синтаксические параметры, семантические параметры, музыкальные формы, структуры, стили и методологии аннотации музыки
  • Музыкальные архивы, библиотеки и электронные коллекции - музыка электронные библиотеки, публичный доступ к музыкальным архивам, тестам и исследовательским базам данных
  • Интеллектуальная собственность права и музыка - национальные и международные Авторские права вопросы, управление цифровыми правами, идентификация и отслеживаемость
  • Социология и экономика музыки - музыкальная индустрия и использование MIR в производстве, распространении, цепочке потребления, профилирование пользователей, проверка, потребности и ожидания пользователей, оценка музыкальных IR-систем, сборка тестовых коллекций, экспериментальный дизайн и показатели

Смотрите также

Рекомендации

  1. ^ Редакторы А. Клапури и М. Дэви. Методы обработки сигналов для музыкальной транскрипции. Springer-Verlag, Нью-Йорк, 2006.
  2. ^ http://www.music-ir.org/mirex/wiki/MIREX_HOME - Обмен оценкой поиска музыкальной информации.
  3. ^ Эйденбергер, Хорст (2011). «Фундаментальное понимание СМИ», атпресс. ISBN  978-3-8423-7917-6.
  4. ^ Дэвид Моффат, Дэвид Ронан и Джошуа Ди Рейсс. «Оценка наборов инструментов для извлечения звуковых функций». В материалах Международной конференции по цифровым звуковым эффектам (DAFx), 2016.

внешняя ссылка

Примеры приложений МИР