MP3 - MP3

MP3
Расширение имени файла	.mp3; .кусочек (до 1995 г.)
Тип интернет-СМИ	аудио / MPEG; аудио / MPA; аудио / MPA-надежный;
Разработан	Карлхайнц Бранденбург, Эрнст Эберляйн, Хайнц Герхойзер, Бернхард Гриль, Юрген Херре и Харальд Попп (все Общество Фраунгофера ), и другие
изначальный выпуск	1993; 27 лет назад
Тип формата	Цифровое аудио
Содержится	MPEG-ES
Стандарты	ИСО / МЭК 11172-3; ИСО / МЭК 13818-3;
Открытый формат ?	да

MP3 (формально MPEG-1 Audio Layer III или же MPEG-2 Audio Layer III)^[4] это формат кодирования за цифровой звук разработан в основном Общество Фраунгофера в Германии при поддержке других ученых в области цифровых технологий в США и других странах. Первоначально определялся как третий аудиоформат MPEG-1 стандарт, он был сохранен и расширен - определение дополнительных битрейтов и поддержка большего количества аудиоканалы - как третий аудиоформат последующего MPEG-2 стандарт. Третья версия, известная как MPEG 2.5, расширенная для лучшей поддержки более низких битрейтов, обычно реализуется, но не является признанным стандартом.

MP3 (или же mp3) как формат файла обычно обозначает файлы, содержащие элементарный поток кодированных данных MPEG-1 Audio или MPEG-2 Audio, без других сложностей стандарта MP3.

В отношении сжатие звука (аспект стандарта, наиболее очевидный для конечных пользователей и наиболее известный), MP3 использует сжатие данных с потерями для кодирования данных с использованием неточных приближений и частичного отбрасывания данных. Это позволяет значительно уменьшить размер файлов по сравнению с несжатым аудио. Комбинация небольшого размера и приемлемой точности воспроизведения привела к буму распространения музыки через Интернет в середине-конце 1990-х годов, когда MP3 выступал в качестве поддерживающей технологии в то время, когда пропускная способность и объем хранилища все еще были в дефиците. Формат MP3 вскоре стал ассоциироваться со спорами вокруг Нарушение авторского права, музыкальное пиратство, а файл разрывание /обмен Сервисы MP3.com и Napster, среди прочего. С появлением портативные медиаплееры, категория продукта также включает смартфоны, Поддержка MP3 остается почти универсальной.

Сжатие MP3 работает за счет снижения (или приближения) точности определенных компонентов звука, которые, как считается (с помощью психоакустического анализа) выходят за рамки допустимого диапазона. возможности слуха большинства людей. Этот метод обычно называют перцептивным кодированием или психоакустический моделирование.^[9] Оставшаяся аудиоинформация затем записывается компактно с использованием MDCT и БПФ алгоритмы. В сравнении с Цифровой звук CD-качества, Сжатие MP3 обычно позволяет уменьшить размер от 75 до 95%. Например, MP3, закодированный с постоянным битрейтом 128 кбит / с, приведет к получению файла размером примерно 9% от размера исходного аудио компакт-диска.^[10] В начале 2000-х годов проигрыватели компакт-дисков все чаще стали поддерживать воспроизведение файлов MP3 на компакт-дисках с данными.

В Группа экспертов по киноискусству (MPEG) разработал MP3 как часть своего MPEG-1, и позже MPEG-2, стандарты. MPEG-1 Audio (MPEG-1 Part 3), который включал MPEG-1 Audio Layer I, II и III, был одобрен в качестве проекта комитета для ISO /IEC стандарт 1991 г.,^[11]^[12] завершено в 1992 г.,^[13] и опубликован в 1993 году как ISO / IEC 11172-3: 1993.^[6] Расширение MPEG-2 Audio (MPEG-2 Part 3) с более низкой скоростью дискретизации и битовой скоростью было опубликовано в 1995 году как ISO / IEC 13818-3: 1995.^[7]^[14] Это требует лишь минимальных модификаций существующих декодеров MPEG-1 (распознавание бита MPEG-2 в заголовке и добавление новых более низких значений скорости дискретизации и битовой скорости).

История

Фон

MP3 с потерями сжатие аудиоданных алгоритм использует ограничение восприятия человеческого слуха, называемое слуховая маскировка. В 1894 г. американский физик Альфред М. Майер сообщил, что тон может быть не слышен другим тоном более низкой частоты.^[15] В 1959 году Ричард Эмер описал полный набор слуховых кривых, касающихся этого явления.^[16] Между 1967 и 1974 гг. Эберхард Цвикер работал в области настройки и маскировки критических полос частот,^[17]^[18] которые, в свою очередь, основаны на фундаментальных исследованиях в этой области, Харви Флетчер и его сотрудники в Bell Labs.^[19]

Перцептивное кодирование было впервые использовано для кодирование речи сжатие с кодирование с линейным прогнозированием (LPC),^[20] который берет свое начало в работе Фумитада Итакура (Нагойский университет ) и Сюдзо Сайто (Nippon Telegraph and Telephone ) в 1966 году.^[21] В 1978 г. Бишну С. Атал и Манфред Р. Шредер в Bell Labs предложили выступить с речью LPC кодек, называется адаптивное кодирование с предсказанием, в котором использовался алгоритм психоакустического кодирования, использующий маскирующие свойства человеческого уха.^[20]^[22] Дальнейшая оптимизация Шредером и Аталом с Дж. Л. Холлом была позже описана в статье 1979 года.^[23] В том же году М.А. Краснер предложил психоакустический маскирующий кодек.^[24] который опубликовал и произвел аппаратное обеспечение для речи (не используемое для сжатия музыки), но публикация его результатов в относительно малоизвестном Лаборатория Линкольна Технический отчет^[25] не сразу повлиял на мейнстрим разработки психоакустических кодеков.

В дискретное косинусное преобразование (DCT), разновидность преобразование кодирования за сжатие с потерями, предложено Насир Ахмед в 1972 году был разработан Ахмедом с Т. Натараджаном и К. Р. Рао в 1973 г .; они опубликовали свои результаты в 1974 году.^[26]^[27]^[28] Это привело к развитию модифицированное дискретное косинусное преобразование (MDCT), предложенный Дж. П. Принсеном, А. В. Джонсоном и А. Б. Брэдли в 1987 г.,^[29] после более ранней работы Принсена и Брэдли в 1986 году.^[30] Позднее MDCT стал основной частью алгоритма MP3.^[31]

Эрнст Терхардт и другие. построил алгоритм, описывающий слуховую маскировку с высокой точностью в 1982 году.^[32] Эта работа добавлена к множеству отчетов авторов, восходящих к Флетчеру, и к работе, которая изначально определяла критические отношения и критическую пропускную способность.

В 1985 году Атал и Шредер представили линейное предсказание с кодовым возбуждением (CELP), основанный на LPC алгоритм перцептивного речевого кодирования со слуховой маскировкой, достигший значительного степень сжатия данных для своего времени.^[20] IEEE рефери Журнал по избранным направлениям коммуникаций сообщил о большом количестве (в основном перцептуальных) алгоритмов сжатия звука в 1988 году.^[33] В издании "Voice Coding for Communications", опубликованном в феврале 1988 г., сообщалось о широком диапазоне установленных, работающих технологий сжатия аудио битов,^[33] некоторые из них используют слуховую маскировку как часть своей основной конструкции, а некоторые демонстрируют аппаратные реализации в реальном времени.

Разработка

Генезис технологии MP3 полностью описан в статье профессора Ханса Мусманна,^[34] который несколько лет возглавлял группу ISO MPEG Audio. В декабре 1988 года MPEG потребовал ввести стандарт кодирования звука. В июне 1989 года было представлено 14 алгоритмов кодирования звука. Из-за определенного сходства между этими предложениями по кодированию они были сгруппированы в четыре группы разработчиков. Первой группой была компания ASPEC. Fraunhofer Gesellschaft, AT&T, France Telecom, Deutsche и Томсон-Брандт. Вторая группа была МУЗЫКА, к Мацусита, CCETT, ITT и Philips. Третьей группой была ATAC. Fujitsu, JVC, NEC и Sony. И четвертая группа была SB-ADPCM, к NTT и BTRL.^[34]

Непосредственными предшественниками MP3 были «Оптимальное кодирование в частотной области» (OCF),^[35] и кодирование с преобразованием восприятия (PXFM).^[36] Эти два кодека, наряду с вкладом Thomson-Brandt в переключение блоков, были объединены в кодек под названием ASPEC, который был представлен в MPEG и выиграл конкурс качества, но был ошибочно отклонен как слишком сложный для реализации. Первой практической реализацией кодера восприятия звука (OCF) на аппаратном уровне (оборудование Краснера было слишком громоздким и медленным для практического использования) была реализация кодера психоакустического преобразования, основанного на Motorola 56000 DSP чипсы.

Другой предшественник формата и технологии MP3 можно найти в перцепционном кодеке MUSICAM, основанном на наборе фильтров целочисленной арифметики из 32 поддиапазонов, управляемом психоакустической моделью. Он был в первую очередь разработан для цифрового аудиовещания (цифрового радио) и цифрового телевидения, и его основные принципы были раскрыты научному сообществу CCETT (Франция) и IRT (Германия) в Атланте во время конференции IEEE-ICASSP в 1991 году.^[37] после работы над MUSICAM с Мацусита и Philips с 1989 года.^[34]

Этот кодек, встроенный в систему вещания с использованием модуляции COFDM, демонстрировался в эфире и в полевых условиях.^[38] с Radio Canada и CRC Canada во время шоу NAB (Лас-Вегас) в 1991 году. Реализация звуковой части этой системы вещания была основана на кодере с двумя чипами (один для преобразования поддиапазонов, один для психоакустической модели, разработанной команда Г. Столл (IRT Germany), позже известная как психоакустическая модель I) и декодер реального времени, использующий один Motorola 56001 DSP Микросхема с программным обеспечением для целочисленной арифметики, разработанным Ю.Ф. Команда Дехери (CCETT, Франция). Простота соответствующего декодера вместе с высоким качеством звука этого кодека, впервые использующего частоту дискретизации 48 кГц, входной формат 20 бит / отсчет (наивысший доступный стандарт дискретизации в 1991 г., совместимый с профессиональным цифровым стандартом AES / EBU). входной студийный стандарт) были основными причинами, по которым позже были приняты характеристики MUSICAM в качестве основных функций для усовершенствованного кодека сжатия цифровой музыки.

При разработке программного обеспечения для кодирования MUSICAM команда Столла и Дехери тщательно использовала набор высококачественных материалов для оценки звука.^[39] выбран группой профессионалов в области звука из Европейского вещательного союза, а затем использовался в качестве справочного материала для оценки кодеков сжатия музыки. Метод кодирования поддиапазонов оказался эффективным не только для перцептивного кодирования высококачественных звуковых материалов, но особенно для кодирования критически важных ударных звуковых материалов (барабаны, треугольник и т. Д.) Из-за особого эффекта временной маскировки. набора фильтров поддиапазона MUSICAM (это преимущество является специфической особенностью методов кодирования с коротким преобразованием).

Будучи докторантом немецкого Университет Эрлангена-Нюрнберга, Карлхайнц Бранденбург начал работать над сжатием цифровой музыки в начале 1980-х, уделяя особое внимание тому, как люди воспринимают музыку. В 1989 году защитил докторскую диссертацию.^[40] MP3 является прямым потомком OCF и PXFM и представляет собой результат сотрудничества Бранденбурга - работы постдокторского исследователя в AT & T-Bell Labs с Джеймсом Д. Джонстоном («JJ») из AT & T-Bell Labs - с Институт интегральных схем Фраунгофера, Эрланген (где он работал с Бернхард Гриль и еще четыре исследователя - «Первоначальная шестерка»^[41]), с относительно небольшими вкладами из ветви MP2 психоакустических кодеров поддиапазона. В 1990 году Бранденбург стал доцентом в Эрлангене-Нюрнберге. Находясь там, он продолжал работать над сжатием музыки с учеными из Общество Фраунгофера с Институт Генриха Герца (в 1993 году он присоединился к коллективу Fraunhofer HHI).^[40] Песня "Закусочная Тома " к Сюзанна Вега была первой песней, которую Карлхайнц Бранденбург использовал для разработки MP3. Бранденбург использовал песню для тестирования, слушая ее снова и снова, каждый раз уточняя схему, чтобы убедиться, что она не повлияет отрицательно на тонкость голоса Веги.^[42]

Стандартизация

В 1991 году было два доступных предложения, которые были оценены для звукового стандарта MPEG: МУЗЫКА (Mадаптированный шаблон запроса Uуниверсальный Sуббанд яинтегрированный Cодинг Аnd Multiplexing) и ASPEC (Аадаптивный Sгрудной пэмпирический Eнтропия Cодинг). Техника MUSICAM, предложенная Philips (Нидерланды), CCETT (Франция), Институт вещательных технологий (Германия) и Мацусита (Япония),^[43] был выбран из-за его простоты и устойчивости к ошибкам, а также из-за высокого уровня вычислительной эффективности.^[44] Формат MUSICAM, основанный на поддиапазонное кодирование, стал основой для формата сжатия MPEG Audio, включая, например, его структуру кадра, формат заголовка, частоту дискретизации и т. д.

Хотя большая часть технологии и идей MUSICAM была включена в определение MPEG Audio Layer I и Layer II, только банк фильтров и структура данных, основанная на кадрировании 1152 сэмплов (формат файла и байтовый поток) MUSICAM, остались на уровне III ( MP3) как часть вычислительно неэффективного гибридного фильтр банк. Под председательством профессора Мусманна Университет Лейбница в Ганновере редактирование стандарта было поручено Леону ван де Керкхофу (Нидерланды), Герхарду Штоллю (Германия) и Ив-Франсуа Дехери (Франция), которые работали над уровнем I и уровнем II. ASPEC был совместным предложением AT&T Bell Laboratories, Thomson Consumer Electronics, Общества Фраунгофера и CNET.^[45] Это обеспечило высочайшую эффективность кодирования.

А рабочая группа состоящий из ван де Керкхофа, Штолля, Леонардо Кьяриглионе (CSELT Вице-президент по медиа), Ив-Франсуа Дехери, Карлхайнц Бранденбург (Германия) и Джеймс Д. Джонстон (США) позаимствовали идеи из ASPEC, интегрировали банк фильтров из уровня II, добавили некоторые из своих собственных идей, таких как совместное стереокодирование MUSICAM и создал формат MP3, который был разработан для достижения того же качества на 128кбит / с в качестве MP2 на 192 кбит / с.

Алгоритмы для MPEG-1 Audio Layer I, II и III были утверждены в 1991 г.^[11]^[12] и завершена в 1992 г.^[13] как часть MPEG-1, первый стандартный люкс от MPEG, результатом чего стал международный стандарт ISO /IEC 11172-3 (a.k.a. Аудио MPEG-1 или же MPEG-1, часть 3), опубликованный в 1993 году.^[6] Файлы или потоки данных, соответствующие этому стандарту, должны обрабатывать частоты дискретизации 48k, 44100 и 32k и по-прежнему поддерживаться текущими Mp3-плееры и декодеры. Таким образом, первое поколение MP3 определило $14 \times 3 = 42$ интерпретации структур данных кадров MP3 и макетов размеров.

Дальнейшая работа над аудио MPEG^[46] был завершен в 1994 году как часть второго набора стандартов MPEG, MPEG-2, более официально известный как международный стандарт ИСО / МЭК 13818-3 (a.k.a. MPEG-2, часть 3 или обратно совместимый MPEG-2 аудио или же MPEG-2 Audio BC^[14]), первоначально опубликованная в 1995 году.^[7]^[47] MPEG-2 Part 3 (ISO / IEC 13818-3) определил 42 дополнительных битрейта и частоты дискретизации для MPEG-1 Audio Layer I, II и III. Новые частоты дискретизации ровно вдвое ниже тех, что были изначально определены в MPEG-1 Audio. Это снижение частоты дискретизации позволяет вдвое сократить доступную точность воспроизведения частоты, а также снизить битрейт на 50%. MPEG-2 Part 3 также улучшил звук MPEG-1, позволив кодировать аудиопрограммы с более чем двумя каналами, вплоть до 5.1. многоканальный.^[46] MP3, закодированный в MPEG-2, дает половину полосы пропускания воспроизведения MPEG-1, подходящего для фортепиано и пения.

Третье поколение потоков данных (файлов) в стиле «MP3» расширило MPEG-2 идеи и реализация, но был назван MPEG-2.5 audio, поскольку MPEG-3 уже имел другое значение. Это расширение было разработано Fraunhofer IIS, зарегистрированными владельцами патентов на MP3, путем уменьшения поля кадровой синхронизации в заголовке MP3 с 12 до 11 бит. Как и при переходе от MPEG-1 к MPEG-2, MPEG-2.5 добавляет дополнительные частоты дискретизации ровно половину от тех, которые доступны при использовании MPEG-2. Таким образом, он расширяет сферу применения MP3, включая человеческую речь и другие приложения, но требует только 25% полосы пропускания (частотного воспроизведения), возможной с использованием частот дискретизации MPEG-1. Хотя MPEG-2.5 не является признанным стандартом ISO, он широко поддерживается как недорогими китайскими, так и фирменными цифровыми аудиоплеерами, а также кодировщиками MP3 на основе компьютерного программного обеспечения (ХРОМОЙ ), декодеры (FFmpeg) и плееры (MPC) добавление $3 \times 8 = 24$ дополнительные типы кадров MP3. Таким образом, каждое поколение MP3 поддерживает 3 частоты дискретизации, ровно вдвое меньшие, чем у предыдущего поколения, всего 9 разновидностей файлов формата MP3. Таблица сравнения частот дискретизации между MPEG-1, 2 и 2.5 приведена далее в статье.^[48]^[49] MPEG-2.5 поддерживается LAME (с 2000 г.), Media Player Classic (MPC), iTunes и FFmpeg.

MPEG-2.5 не был разработан MPEG (см. Выше) и никогда не был утвержден в качестве международного стандарта. Таким образом, MPEG-2.5 является неофициальным или частным расширением формата MP3. Тем не менее, он широко распространен и особенно полезен для приложений, использующих человеческую речь с низкой скоростью передачи данных.

Версии MPEG Audio Layer III^[6]^[7]^[12]^[48]^[49]^[50]
Версия	Международный стандарт^[*]	Дата публичного выпуска первого издания	Дата публичного выпуска последней редакции
MPEG-1 Audio Layer III	ИСО / МЭК 11172-3 (MPEG-1, часть 3)	1993
MPEG-2 Audio Layer III	ИСО / МЭК 13818-3 (MPEG-2, часть 3)	1995	1998
MPEG-2.5 Audio Layer III	нестандартный, проприетарный	2000	2008

Стандарт ISO / IEC 11172-3 (также известный как MPEG-1 Audio) определяет три формата: MPEG-1 Audio Layer I, Layer II и Layer III. Стандарт ISO / IEC 13818-3 (он же MPEG-2 Audio) определяет расширенную версию MPEG-1 Audio: MPEG-2 Audio Layer I, Layer II и Layer III. MPEG-2 Audio (MPEG-2 Part 3) не следует путать с MPEG-2 AAC (MPEG-2 Part 7 - ISO / IEC 13818-7).^[14]

Эффективность сжатия кодеров обычно определяется скоростью передачи данных, поскольку степень сжатия зависит от битовая глубина и частота выборки входного сигнала. Тем не менее, степени сжатия часто публикуются. Они могут использовать Компакт-диск (CD) параметры как ссылки (44.1 кГц, 2 канала по 16 бит на канал или 2 × 16 бит), или иногда Цифровая аудиокассета (DAT) Параметры SP (48 кГц, 2 × 16 бит). Коэффициенты сжатия для этой последней ссылки выше, что демонстрирует проблему с использованием термина коэффициент сжатия для кодировщиков с потерями.

Карлхайнц Бранденбург использовал запись компакт-диска Сюзанна Вега песня "Закусочная Тома "для оценки и уточнения MP3 алгоритм сжатия. Эта песня была выбрана из-за того, что она почти однотонный характер и широкий спектральный состав, что позволяет легче услышать недостатки в формате сжатия во время воспроизведения. Некоторые называют Сюзанну Вегу «матерью MP3».^[51] Эта конкретная дорожка имеет интересное свойство в том, что два канала почти, но не полностью, одинаковы, что приводит к случаю, когда понижение уровня бинауральной маскировки вызывает пространственное демаскирование шумовых артефактов, если кодер должным образом не распознает ситуацию и не применит коррекции, аналогичные тем, которые подробно описана в психоакустической модели MPEG-2 AAC. Еще несколько важных аудиозаписей (глокеншпиль, треугольник, аккордеон и др.) взяты из EBU Эталонный компакт-диск V3 / SQAM, который использовался профессиональными звукорежиссерами для оценки субъективного качества аудиоформатов MPEG. LAME - самый продвинутый кодировщик MP3. LAME включает в себя кодирование с переменной скоростью передачи данных VBR, в котором используется параметр качества, а не целевое значение скорости передачи. Более поздние версии 2008+) поддерживают цель качества n.nnn, которая автоматически выбирает частоту дискретизации MPEG-2 или MPEG-2.5, подходящую для записей человеческой речи, для которых требуется только разрешение полосы пропускания 5512 Гц.

Выход на публику

Реализация эталонного программного обеспечения для моделирования, написанная на языке C и позже известная как ISO 11172-5, был разработан (в 1991–1996 гг.) членами комитета ISO MPEG Audio с целью создания битовых совместимых файлов MPEG Audio (Layer 1, Layer 2, Layer 3). Он был одобрен в качестве проекта технического отчета комитета ISO / IEC в марте 1994 г. и напечатан как документ CD 11172-5 в апреле 1994 г.^[52] Он был утвержден как проект технического отчета (DTR / DIS) в ноябре 1994 г.^[53] доработан в 1996 г. и опубликован как международный стандарт ISO / IEC TR 11172-5: 1998 в 1998 г.^[54] В справочное программное обеспечение на языке C был позже опубликован как свободно доступный стандарт ISO.^[55] Работая не в реальном времени на ряде операционных систем, он смог продемонстрировать первое аппаратное декодирование в реальном времени (DSP на основе) сжатого звука. Некоторые другие реализации кодеров и декодеров MPEG Audio в реальном времени^[56] были доступны для цифрового вещания (радио DAB, телевидение DVB ) в сторону бытовых приемников и телевизионных приставок.

7 июля 1994 г. Общество Фраунгофера выпустила первый программный кодировщик MP3, названный l3enc.^[57] В расширение имени файла .mp3 был выбран командой Фраунгофера 14 июля 1995 г. (ранее файлы назывались .кусочек).^[1] С первым MP3-плеером, работающим в реальном времени WinPlay3 (выпущен 9 сентября 1995 г.) многие люди могли кодировать и воспроизводить файлы MP3 на своих ПК. Из-за относительно небольшого жесткие диски эпохи (≈500–1000 МБ ) сжатие с потерями было необходимо для хранения музыки из нескольких альбомов на домашнем компьютере в виде полных записей (в отличие от MIDI обозначение, или трекер файлы, сочетающие нотацию с короткими записями инструментов, играющих отдельные ноты). Как отмечает Джонатан Стерн, «австралийский хакер приобрел l3enc с использованием украденной кредитной карты. Затем хакер перепроектировал программное обеспечение, написал новый пользовательский интерфейс и бесплатно распространил его, назвав его «спасибо Fraunhofer» ».^[58]

Пример реализации фраунгофера

Хакер по имени SoloH обнаружил исходный код из "dist10" MPEG эталонная реализация вскоре после релиза на серверах Университет Эрлангена. Он разработал более качественную версию и распространил ее в Интернете. Этот код положил начало широко распространенному Копирование компакт-дисков и распространение цифровой музыки в формате MP3 через Интернет.^[59]^[60]^[61]^[62]

Интернет-распространение

Во второй половине 1990-х файлы MP3 начали распространяться на Интернет, часто через подпольные сети пиратских песен. Первый известный эксперимент по распространению через Интернет был организован в начале 1990-х годов подпольным музыкальным архивом Интернета, более известным под аббревиатурой IUMA. После некоторых экспериментов^[63] Используя несжатые аудиофайлы, этот архив начал доставлять в собственный всемирный низкоскоростной Интернет некоторые сжатые аудиофайлы MPEG с использованием формата MP2 (Layer II), а затем использованные файлы MP3, когда стандарт был полностью завершен. Популярность MP3 начала быстро расти с появлением Нуллсофт аудиоплеер Winamp, выпущенный в 1997 году. В 1998 году появился первый портативный твердотельный цифровой аудиоплеер. MPMan, разработан Информационные системы SaeHan со штаб-квартирой в Сеул, Южная Корея, был выпущен и Rio PMP300 был продан впоследствии в 1998 году, несмотря на попытки судебного пресечения со стороны RIAA.^[64]

В ноябре 1997 г. на сайте mp3.com предлагал бесплатно тысячи MP3, созданных независимыми артистами.^[64] Небольшой размер файлов MP3 сделал возможным широкое распространение пиринговый обмен файлами музыки разорванный с компакт-дисков, что раньше было почти невозможно. Первая большая одноранговая сеть для обмена файлами, Napster, был запущен в 1999 году. Простота создания и обмена MP3 привела к широкому распространению Нарушение авторского права. Крупные звукозаписывающие компании утверждали, что это бесплатное распространение музыки снижает продажи, и называли это "музыкальное пиратство ". Они отреагировали возбуждением исков против Napster (который в конечном итоге был закрыт, а затем продан) и против отдельных пользователей, которые участвовали в обмене файлами.^[65]

Несанкционированный обмен файлами MP3 продолжается в следующем поколении одноранговые сети. Некоторые авторизованные сервисы, такие как Beatport, Писк, Juno Records, электронная музыка, Zune Marketplace, Walmart.com, Рапсодия, звукозаписывающая индустрия одобрила реинкарнацию Napster, и Amazon.com продавать музыку в формате MP3 без ограничений.

Дизайн

Файловая структура

Схема структуры файла MP3 (MPEG версии 2.5 не поддерживается, поэтому для MP3 Sync Word 12 бит вместо 11).

Файл MP3 состоит из кадров MP3, которые состоят из заголовка и блока данных. Эта последовательность кадров называется элементарный поток. Из-за «битового резервуара» кадры не являются независимыми элементами и обычно не могут быть извлечены на произвольных границах кадра. Блоки данных MP3 содержат (сжатую) звуковую информацию с точки зрения частот и амплитуд. На схеме показано, что заголовок MP3 состоит из синхронизировать слово, который используется для определения начала допустимого кадра. За этим следует бит, указывающий, что это MPEG стандартный и два бита, указывающие, что используется уровень 3; отсюда MPEG-1 Audio Layer 3 или MP3. После этого значения будут отличаться в зависимости от файла MP3. ISO /IEC 11172-3 определяет диапазон значений для каждого раздела заголовка вместе со спецификацией заголовка. Большинство файлов MP3 сегодня содержат ID3 метаданные, который предшествует или следует за кадрами MP3, как указано на схеме. Поток данных может содержать необязательную контрольную сумму.

Совместное стерео выполняется только покадрово.^[66]

Кодирование и декодирование

Алгоритм кодирования MP3 обычно делится на четыре части. Часть 1 делит аудиосигнал на более мелкие части, называемые кадрами, и модифицированное дискретное косинусное преобразование Затем на выходе выполняется фильтр (MDCT). Часть 2 передает образец в 1024-точечный быстрое преобразование Фурье (БПФ), то психоакустический Модель применяется, и на выходе выполняется другой фильтр MDCT. Часть 3 количественно оценивает и кодирует каждую выборку, известную как распределение шума, которое настраивается для соответствия требованиям битрейт и звуковая маскировка требования. Часть 4 форматирует битовый поток, называемый звуковым кадром, который состоит из 4 частей, заголовок, проверка ошибок, аудиоданные, и вспомогательные данные.^[31]

В MPEG-1 Стандарт не включает точную спецификацию для кодировщика MP3, но предоставляет примеры психоакустических моделей, петлю скорости и тому подобное в ненормативной части исходного стандарта.^[67]MPEG-2 удваивает количество поддерживаемых частот дискретизации, а MPEG-2.5 добавляет еще 3. Когда это было написано, предлагаемые реализации были довольно устаревшими. Разработчики стандарта должны были разработать свои собственные алгоритмы, подходящие для удаления части информации из аудиовхода. В результате стало доступно множество различных кодировщиков MP3, каждый из которых производит файлы разного качества. Сравнения были широко доступны, поэтому потенциальному пользователю кодировщика было легко найти лучший выбор. Некоторые кодеры, которые умеют кодировать с более высокой скоростью передачи данных (например, ХРОМОЙ ) не обязательно были такими хорошими при более низких скоростях передачи данных. Со временем LAME развился на сайте SourceForge, пока не стал де-факто кодировщиком CBR MP3. Позже был добавлен режим ABR. Продолжалась работа над истинной переменной скоростью передачи данных с использованием цели качества от 0 до 10. В конечном итоге числа (такие как -V 9.600) могли генерировать превосходное качество кодирования голоса с низкой скоростью передачи данных всего лишь 41 кбит / с с использованием расширений MPEG-2.5.

Во время кодирования берутся 576 отсчетов во временной области и преобразуются в 576 выборки в частотной области.^{[требуется разъяснение ]} Если есть преходящий, Вместо 576 берутся 192 отсчета. Это сделано для ограничения временного разброса шума квантования, сопровождающего переходный процесс (см. психоакустика ). Разрешение по частоте ограничено небольшим размером окна длинного блока, что снижает эффективность кодирования.^[66] Временное разрешение может быть слишком низким для переходных сигналов и может вызвать размытие перкуссионных звуков.^[66]

Из-за древовидной структуры банка фильтров проблемы с опережающим эхом усугубляются, поскольку комбинированная импульсная характеристика двух банков фильтров не обеспечивает и не может обеспечить оптимальное решение с точки зрения разрешения по времени / частоте.^[66] Кроме того, объединение выходов двух банков фильтров создает проблемы наложения спектров, которые должны частично решаться стадией «компенсации наложения спектров»; однако это создает избыточную энергию для кодирования в частотной области, тем самым снижая эффективность кодирования.^{[нужна цитата ]}

С другой стороны, декодирование тщательно определено в стандарте. Наиболее декодеры находятся "битовый поток совместимый ", что означает, что распакованный вывод, который они производят из данного файла MP3, будет таким же, в пределах указанной степени округление Допуск, как результат, указанный математически в документе высоких стандартов ISO / IEC (ISO / IEC 11172-3). Поэтому сравнение декодеров обычно основывается на их вычислительной эффективности (т. Е. На сколько объем памяти или же ЦПУ время, которое они используют в процессе декодирования). Со временем эта проблема стала менее серьезной, поскольку частота процессора перешла с МГц на ГГц. Общая задержка кодировщика / декодера не определена, что означает, что нет официального положения для воспроизведение без пауз. Однако некоторые кодеры, такие как LAME, могут присоединять дополнительные метаданные, которые позволят игрокам, которые могут их обработать, обеспечить плавное воспроизведение.

Качественный

При выполнении кодирования звука с потерями, такого как создание потока данных MP3, существует компромисс между объемом сгенерированных данных и качеством звука результатов. Человек, создающий MP3, выбирает битрейт, который указывает, сколько килобиты в секунду звука желательно. Чем выше битрейт, тем больше будет поток данных MP3 и, как правило, тем ближе он будет звучать к исходной записи. При слишком низкой скорости передачи данных артефакты сжатия (то есть звуки, которых не было в исходной записи) могут быть слышны при воспроизведении. Некоторый звук сложно сжать из-за его случайности и резких атак. Когда этот тип звука сжимается, артефакты, такие как звон или предварительное эхо обычно слышны. Образец аплодисментов или треугольный инструмент с относительно низкой скоростью передачи данных являются хорошими примерами артефактов сжатия. Большинство субъективных тестов перцепционных кодеков, как правило, избегают использования этих типов звуковых материалов, однако артефакты, генерируемые ударными звуками, едва заметны из-за специфической функции временного маскирования 32 поддиапазонного набора фильтров уровня II, на котором основан формат. .

Помимо скорости передачи кодированного фрагмента звука, качество звука в формате MP3 также зависит от качества алгоритма кодировщика, а также от сложности кодируемого сигнала. Поскольку стандарт MP3 допускает некоторую свободу действий с алгоритмами кодирования, разные кодировщики имеют совершенно разное качество даже при одинаковой скорости передачи данных. Например, в тесте публичного прослушивания с двумя ранними кодировщиками MP3, установленными на скорости около 128 кбит / с,^[68] один получил 3,66 балла по шкале от 1 до 5, а другой - только 2,22. Качество зависит от выбора кодировщика и параметров кодирования.^[69]

Это наблюдение произвело революцию в кодировании звука. Раньше битрейт был главным и единственным соображением. В то время файлы MP3 были самого простого типа: они использовали одинаковый битрейт для всего файла: этот процесс известен как Постоянная скорость передачи данных (CBR) кодирование. Использование постоянной скорости передачи данных упрощает кодирование и снижает нагрузку на процессор. Однако также можно создавать файлы, в которых скорость передачи данных изменяется по всему файлу. Они известны как Переменная скорость передачи данных. Резервуар битов и кодирование VBR были фактически частью исходного стандарта MPEG-1. Их концепция заключается в том, что в любом звуковом фрагменте некоторые фрагменты легче сжимать, например, тишину или музыку, содержащую только несколько тонов, в то время как другие сжимать труднее. Таким образом, общее качество файла может быть увеличено за счет использования более низкой скорости передачи битов для менее сложных отрывков и более высокой для более сложных частей. С некоторыми усовершенствованными кодировщиками MP3 можно указать заданное качество, и кодировщик соответствующим образом отрегулирует скорость передачи данных. Пользователи, которым нужна особая "настройка качества", прозрачный до ушей могут использовать это значение при кодировании всей своей музыки, и, вообще говоря, не нужно беспокоиться о выполнении личных тестов прослушивания для каждого музыкального произведения, чтобы определить правильную скорость передачи данных.

На воспринимаемое качество может влиять среда прослушивания (окружающий шум), внимание слушателя и подготовка слушателя, а также, в большинстве случаев, звуковое оборудование слушателя (например, звуковые карты, динамики и наушники). Кроме того, достаточное качество может быть достигнуто за счет более низкой настройки качества для лекций и приложений с человеческой речью, а также за счет уменьшения времени и сложности кодирования. Тест, проводимый для новых студентов Стэндфордский Университет Профессор музыки Джонатан Бергер показал, что предпочтение студентов музыке в формате MP3 растет с каждым годом. Бергер сказал, что студенты, кажется, предпочитают «шипящие» звуки, которые MP3 привносят в музыку.^[70]

Углубленное изучение качества звука MP3, звукового исполнителя и композитора Райан Магуайр Проект «Призрак в MP3» изолирует звуки, потерянные при сжатии MP3. В 2015 году он выпустил трек «moDernisT» (анаграмма «Tom's Diner»), составленный исключительно из звуков, удаленных при сжатии MP3 песни «Tom's Diner».^[71]^[72]^[73] трек, изначально использовавшийся при разработке стандарта MP3. Подробный отчет о методах, используемых для выделения звуков, удаленных во время сжатия MP3, а также концептуальная мотивация проекта были опубликованы в Трудах Международной конференции компьютерной музыки 2014 года.^[74]

Битрейт

Битрейт - это произведение частоты дискретизации и количества бит на образец, используемых для кодирования музыки. CD-аудио - 44100 отсчетов в секунду. Количество битов на выборку также зависит от количества аудиоканалов. CD стерео и 16 бит на канал. Итак, умножение 44100 на 32 дает 1411200 - битрейт несжатого цифрового аудио CD. MP3 был разработан для кодирования этих данных со скоростью 1411 кбит / с со скоростью 320 кбит / с или меньше. Поскольку алгоритмы MP3 обнаруживают менее сложные отрывки, можно использовать более низкие битрейты. При использовании MPEG-2 вместо MPEG-1 MP3 поддерживает только более низкие частоты дискретизации (16000, 22050 или 24000 отсчетов в секунду) и предлагает выбор скорости передачи данных от 8 кбит / с, но не выше 160 кбит / с. Уменьшая частоту дискретизации, уровень III MPEG-2 удаляет все частоты, превышающие половину новой частоты дискретизации, которая могла присутствовать в исходном звуке.

Как показано в этих двух таблицах, 14 выбранных битрейты разрешены в стандарте MPEG-1 Audio Layer III: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 и 320 кбит / с, а также 3 самых высоких доступных частоты дискретизации из 32, 44,1 и 48кГц.^[49] MPEG-2 Audio Layer III также позволяет 14 несколько различных (и в основном ниже) битрейты из 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 кбит / с с частоты дискретизации из 16, 22.05 и 24кГц которые ровно вдвое меньше MPEG-1^[49] Количество кадров MPEG-2.5 Audio Layer III ограничено 8 битрейты 8, 16, 24, 32, 40, 48, 56 и 64 кбит / с с 3 еще ниже частоты дискретизации 8, 11,025 и 12 кГц.^{[нужна цитата ]} В более ранних системах, которые поддерживали только стандарт MPEG-1 Audio Layer III, файлы MP3 с битовой скоростью ниже 32 кбит / с могли воспроизводиться с ускорением и повышением частоты.

В более ранних системах также отсутствуют перемотка вперед и перемотка элементов управления воспроизведением на MP3.^[76]^[77]

Кадры MPEG-1 содержат наибольшую детализацию в режиме 320 кбит / с, максимально допустимой настройке скорости передачи данных,^[78] с тишиной и простыми тонами, по-прежнему требующими 32 кбит / с. Кадры MPEG-2 могут захватывать воспроизведение звука с частотой до 12 кГц, необходимое для воспроизведения звука до 160 кбит / с. Файлы MP3, созданные с помощью MPEG-2, не имеют полосы пропускания 20 кГц из-за Теорема выборки Найквиста – Шеннона. Воспроизведение частоты всегда строго меньше половины частоты дискретизации, а несовершенные фильтры требуют большей погрешности (уровень шума в зависимости от резкости фильтра), поэтому частота дискретизации 8 кГц ограничивает максимальную частоту до 4 кГц, а частота дискретизации 48 кГц. скорость ограничивает воспроизведение звука MP3 до 24 кГц. MPEG-2 использует половину, а MPEG-2.5 только четверть частот дискретизации MPEG-1.

Для общей области воспроизведения человеческой речи ширина полосы 5512 Гц достаточна для получения отличных результатов (для голоса) с использованием частоты дискретизации 11025 и кодирования VBR из 44100 (стандартного) файла WAV. У носителей английского языка в среднем 41–42 кбит / с с настройкой -V 9.6, но это может варьироваться в зависимости от количества записываемой тишины или скорости доставки (слов в минуту). Передискретизация до 12000 (полоса пропускания 6K) выбирается параметром LAME -V 9.4. Аналогично -V 9.2 выбирает частоту дискретизации 16000 и результирующую фильтрацию нижних частот 8K. Для получения дополнительной информации см. Найквист - Шеннон. Более старые версии LAME и FFmpeg поддерживают только целочисленные аргументы для параметра выбора качества с переменной скоростью передачи данных. Параметр качества n.nnn (-V) задокументирован на lame.sourceforge.net, но поддерживается только в LAME с селектором качества с переменной скоростью передачи данных нового стиля VBR, а не средней скоростью передачи (ABR).

Частота дискретизации 44,1 кГц обычно используется для воспроизведения музыки, потому что она также используется для CD аудио, основной источник, используемый для создания файлов MP3. В Интернете используется большое количество битрейтов. Обычно используется скорость передачи 128 кбит / с,^[79] со степенью сжатия 11: 1, предлагая адекватное качество звука на относительно небольшом пространстве. Как Интернет пропускная способность доступность и размеры жестких дисков увеличились, широко распространены более высокие скорости передачи данных до 320 кбит / с. Несжатый звук, хранящийся на аудио-компакт-диске, имеет скорость передачи данных 1411,2 кбит / с (16 бит / выборка × 44100 выборок / секунду × 2 канала / 1000 бит / килобит), поэтому битрейты 128, 160 и 192 кбит / с. представлять степени сжатия приблизительно 11: 1, 9: 1 и 7: 1 соответственно.

Нестандартные скорости передачи данных до 640 кбит / с могут быть достигнуты с помощью ХРОМОЙ кодировщик и опция свободного формата, хотя некоторые MP3-плееры могут воспроизводить эти файлы. Согласно стандарту ISO от декодеров требуется только возможность декодировать потоки до 320 кбит / с.^[80]^[81]^[82] Ранние кодеры MPEG Layer III использовали то, что сейчас называется Постоянная скорость передачи данных (ЦБ РФ). Программа могла использовать только единый битрейт для всех кадров в файле MP3. Позже более сложные кодировщики MP3 смогли использовать битовый резервуар для нацеливания средняя скорость передачи данных выбор скорости кодирования для каждого кадра на основе сложности звука в этой части записи.

Более сложный кодировщик MP3 может производить переменный битрейт аудио. Аудио MPEG может использовать переключение битрейта для каждого кадра, но только декодеры уровня III должны его поддерживать.^[49]^[83]^[84]^[85] VBR используется, когда целью является достижение фиксированного уровня качества. Окончательный размер файла в кодировке VBR менее предсказуем, чем с постоянный битрейт. Средний битрейт - это тип VBR, реализованный как компромисс между ними: битрейт может изменяться для более стабильного качества, но контролируется таким образом, чтобы он оставался близким к среднему значению, выбранному пользователем для предсказуемых размеров файла. Хотя декодер MP3 должен поддерживать VBR, чтобы соответствовать стандартам, исторически некоторые декодеры имели ошибки с декодированием VBR, особенно до того, как кодеры VBR получили широкое распространение. Наиболее развитый кодировщик LAME MP3 поддерживает генерацию VBR, ABR и даже более старые форматы CBR MP3.

Аудио уровня III может также использовать «битовый резервуар», способность частично полного кадра удерживать часть аудиоданных следующего кадра, что позволяет временно изменять эффективный битрейт даже в потоке с постоянным битрейтом.^[49]^[83] Внутренняя обработка битового резервуара увеличивает задержку кодирования.^{[нужна цитата ]} Диапазон масштабного коэффициента 21 (sfb21) отсутствует для частот выше примерно 16.кГц, заставляя кодировщик выбирать между менее точным представлением в полосе 21 или менее эффективным хранилищем во всех полосах ниже полосы 21, последнее приводит к потере битрейта при кодировании VBR.^[86]

Вспомогательные данные

Поле вспомогательных данных может использоваться для хранения данных, определенных пользователем. Вспомогательные данные не являются обязательными, и количество доступных битов явно не указано. Вспомогательные данные расположены после битов кода Хаффмана и находятся в диапазоне от того места, где указывает main_data_begin следующего кадра. Кодировщик mp3PRO использовал вспомогательные данные для кодирования дополнительной информации, которая могла улучшить качество звука при декодировании с помощью собственного алгоритма.

Метаданные

«Тег» в аудиофайле - это раздел файла, содержащий метаданные например название, исполнитель, альбом, номер дорожки или другая информация о содержимом файла. Стандарты MP3 не определяют форматы тегов для файлов MP3, также нет стандарта формат контейнера которые будут поддерживать метаданные и избавят от необходимости в тегах. Однако несколько де-факто стандарты для форматов тегов существуют. По состоянию на 2010 г. наиболее распространенными являются ID3v1 и ID3v2, а недавно представленные APEv2. Эти теги обычно встраиваются в начало или конец файлов MP3, отдельно от фактических данных кадра MP3. Декодеры MP3 либо извлекают информацию из тегов, либо просто обрабатывают их как игнорируемые нежелательные данные, отличные от MP3.

Программное обеспечение для воспроизведения и редактирования часто содержит функции редактирования тегов, но есть также редактор тегов приложения, посвященные этой цели. Помимо метаданных, относящихся к аудиоконтенту, теги также могут использоваться для DRM.^[87] ReplayGain стандарт для измерения и сохранения громкости файла MP3 (нормализация звука ) в теге метаданных, позволяя проигрывателю, совместимому с ReplayGain, автоматически регулировать общую громкость воспроизведения для каждого файла. MP3Gain может использоваться для обратимого изменения файлов на основе измерений ReplayGain, чтобы можно было добиться настроенного воспроизведения на проигрывателях без возможности ReplayGain.

Лицензирование, право собственности и законодательство

Базовая технология декодирования и кодирования MP3 не имеет патентов в Европейском Союзе, причем срок действия всех патентов истекает не позднее 2012 года. В США технология стала практически свободной от патентов 16 апреля 2017 г. (см. Ниже). Срок действия патентов на MP3 в США истек в период с 2007 по 2017 годы. В прошлом многие организации заявляли права собственности на патенты связанные с декодированием или кодированием MP3. Эти претензии привели к ряду юридических угроз и действий из разных источников. В результате неопределенность в отношении того, какие патенты должны быть лицензированы для создания продуктов MP3 без нарушения патентных прав в странах, которые разрешают патенты на программное обеспечение было общей чертой на ранних этапах внедрения технологии.

Первоначальный почти полный стандарт MPEG-1 (части 1, 2 и 3) был общедоступен 6 декабря 1991 года как ISO CD 11172.^[88]^[89] В большинстве стран патенты не могут быть поданы после обнародования известного уровня техники, а срок действия патентов истекает через 20 лет после первоначальной даты подачи, которая может быть до 12 месяцев спустя для подачи заявок в других странах. В результате в большинстве стран срок действия патентов, необходимых для реализации MP3, истек к декабрю 2012 года, через 21 год после публикации ISO CD 11172.

Исключением являются Соединенные Штаты, где действующие патенты, поданные до 8 июня 1995 г., истекают по истечении 17 лет с даты выдачи или 20 лет с даты приоритета. Длительный процесс патентного преследования может привести к выдаче патента намного позже, чем обычно ожидается (см. подводные патенты ). Срок действия различных патентов, связанных с MP3, в США истек в период с 2007 по 2017 год.^[90] Патенты на все, что раскрыто в ISO CD 11172, поданные через год или более после его публикации, вызывают сомнения. Если рассматривать только известные патенты MP3, поданные к декабрю 1992 г., тогда декодирование MP3 не является патентованным в США с 22 сентября 2015 г., когда Патент США 5812672 , срок действия которой истек.^[91]^[92]^[93] Если принять в качестве меры самый длительный патент, упомянутый в вышеупомянутых ссылках, то технология MP3 стала свободной от патентов в Соединенных Штатах 16 апреля 2017 года, когда Патент США 6 009399 , держал^[94] и управляется Разноцветный,^[95] истекший. В результате многие бесплатное программное обеспечение с открытым исходным кодом проекты, такие как Операционная система Fedora, решили начать поставлять поддержку MP3 по умолчанию, и пользователям больше не придется прибегать к установке неофициальных пакетов, поддерживаемых сторонними репозиториями программного обеспечения для воспроизведения или кодирования MP3.^[96]

Разноцветный (ранее называвшаяся Thomson Consumer Electronics) утверждала, что контролирует лицензирование MP3 патентов уровня 3 во многих странах, включая США, Японию, Канаду и страны ЕС.^[97] Technicolor активно защищала эти патенты.^[98] Доходы от лицензий на MP3 от администрации Technicolor принесли Обществу Фраунгофера около 100 миллионов евро в 2005 году.^[99] В сентябре 1998 года Институт Фраунгофера разослал письмо нескольким разработчикам программного обеспечения MP3, в котором говорилось, что лицензия требуется для «распространения и / или продажи декодеров и / или кодировщиков». В письме утверждалось, что нелицензионные продукты «нарушают патентные права Fraunhofer и Thomson. Чтобы производить, продавать или распространять продукты с использованием стандарта [MPEG Layer-3] и, следовательно, наших патентов, вам необходимо получить у нас лицензию на эти патенты».^[100] Это привело к ситуации, когда ХРОМОЙ Проект кодировщика MP3 не мог предлагать своим пользователям официальные двоичные файлы, которые могли работать на их компьютере. Позиция проекта заключалась в том, что исходный код LAME был просто описанием того, как кодировщик MP3 мог быть реализованным. Неофициально скомпилированные двоичные файлы были доступны из других источников.

Sisvel S.p.A.^[101] и ее дочерняя компания в США Audio MPEG, Inc. ранее предъявили иск Thomson за нарушение патентных прав на технологию MP3,^[102] но эти споры были разрешены в ноябре 2005 года, когда Sisvel предоставила Thomson лицензию на их патенты. Вскоре за этим последовала Motorola, которая в декабре 2005 года подписала с Sisvel лицензию на патенты, связанные с MP3.^[103] За исключением трех патентов, патенты США, находящиеся в ведении Sisvel^[104] срок действия всех истек в 2015 году. Три исключения: Патент США 5,878,080 срок действия истек в феврале 2017 г .; Патент США 5,850,456 срок действия истек в феврале 2017 г .; и Патент США 5,960,037 срок действия истек 9 апреля 2017 г.

В сентябре 2006 г. немецкие власти изъяли MP3-плееры у SanDisk стенд на Выставка IFA в Берлине после того, как итальянская патентная фирма выиграла судебный запрет от имени Sisvel против SanDisk в споре о лицензионных правах. Позднее судебный запрет был отменен берлинским судьей.^[105] но это изменение, в свою очередь, было заблокировано в тот же день другим судьей из того же суда, по словам одного из комментаторов, «принесшим в Германию патентный Дикий Запад».^[106] В феврале 2007 года Texas MP3 Technologies подала в суд на Apple, Samsung Electronics и Sandisk. федеральный суд восточного Техаса, заявляя о нарушении патента портативного MP3-плеера, который, по словам Texas MP3, был передан ему. Apple, Samsung и Sandisk урегулировали иски против них в январе 2009 года.^[107]^[108]

Alcatel-Lucent отстаивает несколько патентов на кодирование и сжатие MP3, якобы унаследованных от AT & T-Bell Labs, в собственном судебном процессе. В ноябре 2006 г., перед слиянием компаний, Alcatel подал в суд Microsoft якобы за нарушение семи патентов. 23 февраля 2007 г. жюри Сан-Диего присудило Alcatel-Lucent 1,52 миллиарда долларов США в качестве компенсации за нарушение двух из них.^[109] Однако впоследствии суд отменил решение, установив, что один патент не был нарушен и что другой не принадлежал Alcatel-Lucent; он был совладельцем AT&T и Фраунгофера, который лицензировал его Microsoft, постановил судья.^[110] Это решение защиты было оставлено без изменения при рассмотрении апелляции в 2008 году.^[111] Видеть Alcatel-Lucent против Microsoft для дополнительной информации.

Альтернативные технологии

Сравнение MP3 и Vorbis

Первый - это несжатый файл WAV. Второй - это файл Vorbis, закодированный со скоростью 48 кбит / с, а третий - MP3, закодированный со скоростью 48 кбит / с, с использованием ХРОМОЙ.

Проблемы с воспроизведением этого файла? Видеть помощь СМИ.

Существуют и другие форматы с потерями. Среди этих, Расширенное кодирование звука (AAC) является наиболее широко используемым и был разработан как преемник MP3. Также существуют другие форматы с потерями, такие как mp3PRO и MP2. Они являются членами того же технологического семейства, что и MP3, и зависят от примерно одинаковых психоакустические модели и MDCT алгоритмы. В то время как MP3 использует гибридный подход к кодированию, который является частью MDCT и частью БПФ, AAC - это чисто MDCT, что значительно повышает эффективность сжатия.^[112] Многие из основных патенты лежащие в основе этих форматов принадлежат Общество Фраунгофера, Alcatel-Lucent, Бытовая электроника Thomson,^[112] Колокол, Долби, LG Electronics, NEC, NTT Docomo, Panasonic, Sony Corporation,^[113] ETRI, JVC Kenwood, Philips, Microsoft, и NTT.^[114]

Когда рынок цифровых аудиоплееров находился на подъеме, MP3 был широко принят в качестве стандарта, отсюда и популярное название «MP3-плеер». Компания Sony была исключением и использовала собственные ATRAC кодек взят из их MiniDisc формат, который, по утверждению Sony, был лучше.^[115] После критики и ниже ожидаемого Walkman продаж, в 2004 году Sony впервые представила встроенную поддержку MP3 для своих плееров Walkman.^[116]

Также существуют открытые форматы сжатия, такие как Opus и Vorbis которые доступны бесплатно и без каких-либо известных патентных ограничений. Некоторые из новых форматов сжатия звука, такие как AAC, WMA Pro и Vorbis, свободны от некоторых ограничений, присущих формату MP3, которые не могут быть преодолены никаким кодировщиком MP3.^[90]

Помимо методов сжатия с потерями, форматы без потерь являются важной альтернативой MP3, поскольку они предоставляют неизмененный аудиоконтент, хотя и с увеличенным размером файла по сравнению со сжатием с потерями. Форматы без потерь включают FLAC (Бесплатный аудиокодек без потерь), Яблоко без потерь и много других.

Смотрите также

дальнейшее чтение

Герт Ловинк (9 ноября 2014 г.). «Размышления о формате MP3: интервью с Джонатаном Стерном». Вычислительная культура (4). ISSN 2047-2390.

внешняя ссылка

MP3 в Керли
MP3-history.com, История MP3: как был изобретен MP3, Фраунгофер IIS
Архив новостей в формате MP3, Более 1000 статей с 1999 по 2011 год, посвященных MP3 и цифровому аудио.
MPEG.chiariglione.org, Официальный веб-сайт MPEG

[mp3-name-1] а ^б "С Днем Рождения, MP3!". Фраунгофера IIS. 12 июля 2005 г.. Получено 18 июля 2010.

[audio/mpeg-2] «Тип носителя audio / mpeg - RFC 3003». IETF. Ноябрь 2000 г.. Получено 7 декабря 2009.

[RTP-3] «Регистрация типа MIME для форматов полезной нагрузки RTP - RFC 3555». IETF. Июль 2003 г.. Получено 7 декабря 2009.

[rfc5219-4] а ^б «Более устойчивый к потерям формат полезной нагрузки RTP для аудио в формате MP3 - RFC 5219». IETF. Февраль 2008 г.. Получено 4 декабря 2014.

[5] "Команда mp3". Фраунгофера IIS. Получено 12 июн 2020.

[11172-3-6] а ^б ^c ^d ^е «ISO / IEC 11172-3: 1993 - Информационные технологии. Кодирование движущихся изображений и связанного звука для цифровых носителей со скоростью до 1,5 Мбит / с - Часть 3: Аудио». ISO. 1993 г.. Получено 14 июля 2010.

[13818-3-7] а ^б ^c ^d «ИСО / МЭК 13818-3: 1995 - Информационные технологии. Общее кодирование движущихся изображений и связанной с ними звуковой информации - Часть 3: Аудио». ISO. 1995 г.. Получено 14 июля 2010.

[8] «Технология MP3 в Fraunhofer IIS». Фраунгофера IIS. Получено 12 июн 2020.

[Jayant1993-9] Джаянт, Никил; Джонстон, Джеймс; Сафранек, Роберт (октябрь 1993 г.). «Сжатие сигналов на основе моделей человеческого восприятия». Труды IEEE. 81 (10): 1385–1422. Дои:10.1109/5.241504.

[10] «MP3 (кодирование звука MPEG Layer III)». Библиотека Конгресса. 27 июля 2017 г.. Получено 9 ноября 2017.

[cd-1991-11] а ^б ISO (ноябрь 1991 г.). "Пресс-релиз MPEG, Курихама, ноябрь 1991 г.". ISO. Архивировано из оригинал 3 мая 2011 г.. Получено 17 июля 2010.

[neuron2-cd-1991-12] а ^б ^c ^d ^е ISO (ноябрь 1991 г.). "CD 11172-3 - КОДИРОВАНИЕ ДВИЖУЩИХСЯ ИЗОБРАЖЕНИЙ И СВЯЗАННОГО АУДИО ДЛЯ ЦИФРОВЫХ НОСИТЕЛЕЙ СО СКОРОСТЬЮ ДО 1,5 Мбит / с Часть 3 АУДИО" (PDF). Архивировано из оригинал (PDF) 30 декабря 2013 г.. Получено 17 июля 2010.

[dis-1992-13] а ^б ISO (6 ноября 1992 г.). "Пресс-релиз MPEG, Лондон, 6 ноября 1992 г.". Кьяриглионе. Архивировано из оригинал 12 августа 2010 г.. Получено 17 июля 2010.

[mpeg-audio-faq-bc-14] а ^б ^c ISO (октябрь 1998 г.). «Часто задаваемые вопросы по MPEG Audio, версия 9 - MPEG-1 и MPEG-2 BC». ISO. Получено 28 октября 2009.

[Mayer1894-15] Майер, Альфред Маршалл (1894). «Исследования в акустике». Лондонский, Эдинбургский и Дублинский философский журнал. 37 (226): 259–288. Дои:10.1080/14786449408620544.

[Ehmer1959-16] Эмер, Ричард Х. (1959). «Маскировка тонами против шумовых полос». Журнал акустического общества Америки. 31 (9): 1253. Bibcode:1959ASAJ ... 31.1253E. Дои:10.1121/1.1907853.

[Zwicker-17] Цвикер, Эберхард (1974). «О психоакустическом эквиваленте кривых настройки». Факты и модели в слухе. Факты и модели в слухе (Материалы симпозиума по психофизическим моделям и физиологическим фактам слуха; проходивший в Тузинге, Обербайерн, 22–26 апреля 1974 г.). Связь и кибернетика. 8. стр.132 –141. Дои:10.1007/978-3-642-65902-7_19. ISBN 978-3-642-65904-1.

[Eberhard-18] Цвикер, Эберхард; Фельдткеллер, Ричард (1999) [1967]. Das Ohr als Nachrichtenempfänger [Ухо как приемник связи]. Пер. Ханнеса Мюша, Сёрена Бууса и Марии Флорентийской. Архивировано из оригинал 14 сентября 2000 г.. Получено 29 июн 2008.

[Fletcher-19] Флетчер, Харви (1995). Речь и слух в общении. Акустическое общество Америки. ISBN 978-1-56396-393-3.

[Schroeder2014-20] а ^б ^c Шредер, Манфред Р. (2014). "Bell Laboratories". Акустика, информация и связь: Мемориальный том в честь Манфреда Р. Шредера. Springer. п. 388. ISBN 9783319056609.

[21] Грей, Роберт М. (2010). "История цифровой речи в режиме реального времени в пакетных сетях: Часть II линейного прогнозного кодирования и Интернет-протокола" (PDF). Найденный. Тенденции сигнального процесса. 3 (4): 203–303. Дои:10.1561/2000000036. ISSN 1932-8346.

[22] Атал, Б .; Шредер, М. (1978). «Прогнозирующее кодирование речевых сигналов и критерии субъективной ошибки». ICASSP '78. Международная конференция IEEE по акустике, речи и обработке сигналов. 3: 573–576. Дои:10.1109 / ICASSP.1978.1170564.

[Schroeder1979-23] Шредер, М.; Атал, Б.С.; Холл, Дж. Л. (декабрь 1979 г.). «Оптимизация кодеров цифровой речи путем использования маскирующих свойств человеческого уха». Журнал акустического общества Америки. 66 (6): 1647. Bibcode:1979ASAJ ... 66.1647S. Дои:10.1121/1.383662.

[Krasner-24] Краснер, М. А. (18 июня 1979 г.). Цифровое кодирование речи и звуковых сигналов на основе требований восприятия слуховой системы (Тезис). Массачусетский Институт Технологий. HDL:1721.1/16011.

[25] Краснер, М. А. (18 июня 1979 г.). «Цифровое кодирование речи на основе требований восприятия слуховой системы (Технический отчет 535)» (PDF). Архивировано из оригинал (PDF) 3 сентября 2017 г.

[Ahmed-26] Ахмед, Насир (Январь 1991 г.). "Как я пришел к дискретному косинусному преобразованию". Цифровая обработка сигналов. 1 (1): 4–5. Дои:10.1016 / 1051-2004 (91) 90086-Z.

[pubDCT-27] Ахмед, Насир; Натараджан, Т .; Рао, К. Р. (январь 1974 г.), "Дискретное косинусное преобразование", Транзакции IEEE на компьютерах, С-23 (1): 90–93, Дои:10.1109 / T-C.1974.223784

[pubRaoYip-28] Рао, К.; Ип, П. (1990), Дискретное косинусное преобразование: алгоритмы, преимущества, приложения, Бостон: Academic Press, ISBN 978-0-12-580203-1

[29] Дж. П. Принсен, А. В. Джонсон и А. Б. Брэдли: Кодирование поддиапазона / преобразования с использованием схем набора фильтров на основе отмены наложения спектров во временной области, IEEE Proc. Intl.Конференция по акустике, речи и обработке сигналов (ICASSP), 2161–2164, 1987 г.

[30] Джон П. Принсен, Алан Б. Брэдли: Дизайн банка фильтров анализа / синтеза на основе отмены наложения спектров во временной области, IEEE Trans. Акуст. Обработка речевого сигнала, АССП-34 (5), 1153–1161, 1986

[Guckert-31] а ^б Гукерт, Джон (весна 2012 г.). «Использование БПФ и MDCT в сжатии аудио MP3» (PDF). Университет Юты. Получено 14 июля 2019.

[Terhardt1982-32] Terhardt, E .; Stoll, G .; Сиванн, М. (март 1982 г.). «Алгоритм извлечения высоты звука и яркости звука из сложных тональных сигналов». Журнал акустического общества Америки. 71 (3): 679. Bibcode:1982ASAJ ... 71..679T. Дои:10.1121/1.387544.

[Voice_Coding_for_Communications-33] а ^б «Голосовое кодирование для связи». Журнал IEEE по избранным областям коммуникаций. 6 (2). Февраль 1988 г.

[musmann-34] а ^б ^c Генезис стандарта кодирования звука MP3 в транзакциях IEEE в бытовой электронике, IEEE, Vol. 52, № 3, стр. 1043–1049, август 2006 г.

[Brandenburg-35] Бранденбург, Карлхайнц; Зейтцер, Дитер (3–6 ноября 1988 г.). OCF: кодирование высококачественного звука со скоростью передачи данных 64 кбит / с. 85-й съезд общества звукоинженеров.

[Johnston1988-36] Джонстон, Джеймс Д. (февраль 1988 г.). «Преобразование кодирования аудиосигналов с использованием критериев восприятия шума». Журнал IEEE по избранным областям коммуникаций. 6 (2): 314–323. Дои:10.1109/49.608.

[37] Ю.Ф. Дехери и др. (1991) Исходный кодек MUSICAM для цифрового аудиовещания и хранения Proceedings IEEE-ICASSP 91 страницы 3605–3608 Май 1991

[38] "Комментарий DAB от Алана Бокса, представителя EZ и председателя целевой группы NAB DAB" (PDF).

[39] EBU SQAM CD Оценка качества звука Записи материалов для субъективных тестов. 7 октября 2008 г.

[BusinessWeek_2007-40] а ^б Юинг, Джек (5 марта 2007 г.). "Как родился MP3". Bloomberg BusinessWeek. Получено 24 июля 2007.

[41] Витт, Стивен (2016). Как музыка стала бесплатной: конец индустрии, рубеж веков и терпеливый ноль пиратства. Соединенные Штаты Америки: Penguin Books. п. 13. ISBN 978-0143109341. К Бранденбургу и Грилю присоединились еще четыре исследователя фраунгофера. Хайнц Герхаузер руководил исследовательской группой института аудио; Харальд Попп был специалистом по оборудованию; Эрнст Эберлейн был экспертом по обработке сигналов; Юрген Херре был еще одним аспирантом, математические способности которого не уступали Бранденбургу. В последующие годы эта группа будет называть себя «первоначальной шестеркой».

[Sterne2012_Vega-42] Джонатан Стерн (17 июля 2012 г.). MP3: значение формата. Издательство Университета Дьюка. п. 178. ISBN 978-0-8223-5287-7.

[43] Технология цифрового видео и аудиовещания: Практическое руководство по проектированию (сигналы и коммуникационные технологии) ISBN 3-540-76357-0 п. 144: «В 1988 году метод MASCAM был разработан в Institut für Rundfunktechnik (IRT) в Мюнхене в рамках подготовки к системе цифрового аудиовещания (DAB). От MASCAM - MUSICAM (универсальное кодирование и мультиплексирование поддиапазонов с маскирующими шаблонами) Метод был разработан в 1989 году в сотрудничестве с CCETT, Philips и Matsushita ».

[santa-clara-1990-44] «Отчет о состоянии ISO MPEG» (Пресс-релиз). Международная организация по стандартизации. Сентябрь 1990 г. Архивировано с оригинал 14 февраля 2010 г.

[Aspec-45] «Адаптивное спектрально-энтропийное кодирование высококачественных музыкальных сигналов». Электронная библиотека AES. 1991. Получено 24 августа 2010.

[sydney1993-46] а ^б «Принято на 22-м заседании WG11» (Пресс-релиз). Международная организация по стандартизации. 2 апреля 1993 г. Архивировано из оригинал 6 августа 2010 г.. Получено 18 июля 2010.

[Brandenburg1997-47] Бранденбург, Карлхайнц; Бози, Марина (февраль 1997 г.). «Обзор MPEG Audio: текущие и будущие стандарты кодирования аудио с низкой скоростью передачи данных». Журнал Общества звукорежиссеров. 45 (1/2): 4–21. Получено 30 июн 2008.

[MPEG-2.5-48] а ^б ^c ^d «Технические характеристики MP3 (MPEG-2 и MPEG-2.5)». Фраунгофера IIS. Сентябрь 2007. Архивировано с оригинал 24 января 2008 г. «MPEG-2.5» - это название собственного расширения, разработанного Fraunhofer IIS. Это позволяет MP3 удовлетворительно работать с очень низкими битрейтами и вводит дополнительные частоты дискретизации 8 кГц, 11,025 кГц и 12 кГц.

[MPEG-2.5-2-49] а ^б ^c ^d ^е ^ж ^грамм ^час Супурович, Предраг (22 декабря 1999 г.). «Заголовок аудиокадра MPEG». Архивировано из оригинал 8 февраля 2015 г.. Получено 29 мая 2009.

[mp3tech-iso13818-3-50] а ^б ^c "ISO / IEC 13818-3: 1994 (E) - Информационные технологии - Общее кодирование движущихся изображений и связанного звука: аудио" (ZIP). 11 ноября 1994 г.. Получено 4 августа 2010.

[motherofmp3-51] "Интересные факты: музыка". Официальное сообщество Сюзанны Вега.

[paris_press-52] MPEG (25 марта 1994 г.). «Утверждено на 26-м заседании (Париж)». Архивировано из оригинал 26 июля 2010 г.. Получено 5 августа 2010.

[singapore_press-53] MPEG (11 ноября 1994 г.). «Утверждено на 29-м заседании». Архивировано из оригинал 8 августа 2010 г.. Получено 5 августа 2010.

[ISO/IEC_TR_11172-5:1998-54] ISO. «ISO / IEC TR 11172-5: 1998 - Информационные технологии - Кодирование движущихся изображений и связанного звука для цифровых носителей со скоростью до 1,5 Мбит / с - Часть 5: Моделирование программного обеспечения». Получено 5 августа 2010.

[Software_Simulation.zip-55] «ISO / IEC TR 11172-5: 1998 - Информационные технологии - Кодирование движущихся изображений и связанного звука для цифровых носителей информации со скоростью до 1,5 Мбит / с - Часть 5: Моделирование программного обеспечения (Эталонное программное обеспечение)» (ZIP). Получено 5 августа 2010.

[56] Дехери, Ив-Франсуа (1994). Стандарт высококачественного кодирования звука для радиовещательных, телекоммуникационных и мультимедийных систем.. Нидерланды: Elsevier Science BV. С. 53–64. ISBN 978-0-444-81580-4. Эта статья относится к рабочей станции со сжатым цифровым звуком Musicam (MPEG Audio Layer II), реализованной на микрокомпьютере, которая используется не только как профессиональная монтажная станция, но и как сервер в сети Ethernet для библиотеки сжатого цифрового звука, поэтому в будущем ожидается появление MP3 в Интернете.

[MP3_Todays_Technology-57] «Современные технологии MP3». Много информативной информации о музыке. 2005. Архивировано с оригинал 4 июля 2008 г.. Получено 15 сентября 2016.

[Sterne2012_ThankYou-58] Джонатан Стерн (17 июля 2012 г.). MP3: значение формата. Издательство Университета Дьюка. п. 202. ISBN 978-0-8223-5287-7.

[59] Небесный музыкальный автомат на Атлантический океан «Чтобы показать отрасли, как использовать кодек, MPEG собрал бесплатный образец программы, который преобразовывал музыку в файлы MP3. Демонстрационное программное обеспечение создавало некачественный звук, и Фраунгофер не предполагал, что он будет использоваться.« Исходный код »программного обеспечения - его основные инструкции - хранились на легкодоступном компьютере в Университете Эрлангена, с которого он был загружен неким SoloH, хакером из Нидерландов (и, можно предположить, фанатом Звездных войн). SoloH обновила исходный код, чтобы создать программа, конвертирующая треки компакт-дисков в музыкальные файлы приемлемого качества ». (2000)

[60] Поп-идолы и пираты: механизмы потребления и глобального распространения ... доктор Чарльз Фэирчайлд

[61] Технологии пиратства? - Изучение взаимосвязи между коммерциализмом и идеализмом в развитии MP3 и DivX Авторы HENDRIK STORSTEIN SPILKER, SVEIN HÖIER, страница 2072

[62] www.euronet.nl/~soloh/mpegEnc/ (Archive.org )

[63] "Об Интернет-подпольном музыкальном архиве".

[seattlepi-64] а ^б Шуберт, Рут (10 февраля 1999 г.). "Техническая подкованность в получении музыки для песни; индустрия разочарована тем, что Интернет делает бесплатную музыку простой". Сиэтл Пост-Интеллидженсер. Получено 22 ноября 2008.

[Giesler-65] Гислер, Маркус (2008). «Конфликт и компромисс: драма эволюции рынка». Журнал потребительских исследований. 34 (6): 739–753. CiteSeerX 10.1.1.564.7146. Дои:10.1086/522098. S2CID 145796529.

[Limitations-66] а ^б ^c ^d Бувинь, Габриэль (2003). «Технология MP3 - Ограничения». Архивировано из оригинал 7 января 2011 г.

[mpeg1-67] "ISO / IEC 11172-3: 1993 / Cor 1: 1996". Международная организация по стандартизации. 2006. Получено 27 августа 2009.

[Amorim-68] Аморим, Роберто (3 августа 2003 г.). «Результаты теста публичного прослушивания с расширением 128 кбит / с». Получено 17 марта 2007.

[listening-test-128-2006-69] Марес, Себастьян (декабрь 2005 г.). "Результаты публичного многоформатного прослушивания при 128 кбит / с". Получено 17 марта 2007.

[Dougherty-70] Догерти, Дейл (1 марта 2009 г.). "Обжигающий звук музыки". О'Рейли Радар.

[noisey-71] "Познакомьтесь с музыкальным ясновидящим, который находит призраков в ваших MP3". ШУМ. 18 марта 2015.

[schroeder2015-72] "Призраки в mp3". 15 марта 2015 г.

[hull2015-73] «Бюро находок: аспирантка Университета Вирджинии обнаруживает призраков в MP3». UVA сегодня. 23 февраля 2015.

[Maguire2014-74] Призрак в MP3

[lame-usage-75] «Руководство по параметрам командной строки (в CVS)». Получено 4 августа 2010.

[RC-EX30-76] «Руководство по эксплуатации JVC RC-EX30» (PDF) (на нескольких языках). 2004. с. 14. Поиск - поиск нужного места на диске (только аудио CD) (2004 магнитола )

[DV-RW250-77] "DV-RW250H Руководство по эксплуатации GB" (PDF). 2004. с. 33. • Ускоренное воспроизведение вперед и просмотр не работает с дисками MP3 / WMA / JPEG-CD.

[78] «Сравнение качества звука Hi-Res Audio, CD и MP3». www.sony.com. Sony. Получено 11 августа 2020.

[Woon-Seng-79] Вун-Сенг Ган; Сен-Мо Куо (2007). Встроенная обработка сигналов с помощью архитектуры Micro Signal Architecture. Wiley-IEEE Press. п. 382. ISBN 978-0-471-73841-1.

[Bouvigne-80] Бувинь, Габриэль (28 ноября 2006 г.). "свободный формат на 640 кбит / с и foobar2000, возможности?". Получено 15 сентября 2016.

[81] "lame (1): создание аудиофайлов в формате mp3 - справочная страница Linux". linux.die.net. Получено 22 августа 2020.

[82] "Linux Manpages Online - страницы руководства man.cx". man.cx. Получено 22 августа 2020.

[LAME_GPSYCHO-83] а ^б «GPSYCHO - переменная скорость передачи данных». LAME MP3 Encoder. Получено 11 июля 2009.

[TwoLAME-84] "TwoLAME: MPEG Audio Layer II VBR". Получено 11 июля 2009.

[MPEG-1_and_MPEG-2_BC-85] Подгруппа ISO MPEG Audio. «Часто задаваемые вопросы по MPEG Audio, версия 9: MPEG-1 и MPEG-2 BC». Получено 11 июля 2009.

[LAME_Y-86] "Хромой переключатель Y". База знаний Hydrogenaudio. Получено 23 марта 2015.

[Rae-87] Рэй, Кейси. «Метаданные и вы». Будущее музыкальной коалиции. Получено 12 декабря 2014.

[Patel-88] Патель, Кетан; Смит, Брайан Ч .; Роу, Лоуренс А. Производительность программного декодера видео MPEG (PDF). Конференция ACM Multimedia 1993.

[mpegfa31.txt-89] «MPEG-FAQ, версия 3.1». 14 мая 1994 г. Архивировано с оригинал 23 июля 2009 г.

[big-list-90] а ^б «Большой список патентов MP3 (и предполагаемые даты истечения срока действия)». tunequest. 26 февраля 2007 г.

[Cogliati-91] Коглиати, Джош (20 июля 2008 г.). «Патентный статус MPEG-1, H.261 и MPEG-2». Kuro5hin. В этой работе не учитывались патентные разделения и продолжения.

[US5812672-92] Патент США № 5812672.

[Patent_expiration-93] "Истечение срока действия патента США на MP3, MPEG-2, H.264". OSNews.com.

[94] «Патент US6009399 - Способ и устройство для кодирования цифровых сигналов ... - Патенты Google».

[95] "mp3licensing.com - Патенты". mp3licensing.com.

[96] "Полная поддержка MP3 скоро появится в Fedora". 5 мая 2017.

[ffii-97] «Сжатие акустических данных - базовый патент MP3». Фонд свободной информационной инфраструктуры. 15 января 2005 г. Архивировано с оригинал 15 июля 2007 г.. Получено 24 июля 2007.

[Technicolor-98] «Интеллектуальная собственность и лицензирование». Разноцветный. Архивировано из оригинал 4 мая 2011 г.

[Kistenfeger-99] Kistenfeger, Muzinée (июль 2007 г.). "Общество Фраунгофера (Fraunhofer-Gesellschaft, FhG)". Генеральное консульство Великобритании в Мюнхене. Архивировано из оригинал 18 августа 2002 г.. Получено 24 июля 2007.

[chillingeffects-100] «Раннее исполнение патентов на MP3». Информационная служба Chilling Effects. 1 сентября 1998 г.. Получено 24 июля 2007.

[101] «Программа лицензирования звука MPEG от SISVEL».

[ZDNet_India-102] «Audio MPEG и Sisvel: Thomson подали в суд за нарушение патентных прав в Европе и США - MP3-плееры остановлены таможней». ZDNet Индия. 6 октября 2005 г. Архивировано с оригинал 11 октября 2007 г.. Получено 24 июля 2007.

[SISVEL-103] "предоставляет Motorola патентную лицензию на звук в форматах MP3 и MPEG 2". SISVEL. 21 декабря 2005 г. Архивировано с оригинал 21 января 2014 г.. Получено 18 января 2014.

[104] «Патенты США на MPEG Audio» (PDF). Sisvel.

[SanDisk_MP3_seizure-105] Огг, Эрика (7 сентября 2006 г.). «Порядок изъятия файлов SanDisk MP3 отменен». CNET Новости. Архивировано из оригинал 4 ноября 2012 г.. Получено 24 июля 2007.

[Patent_Wild_West-106] «Sisvel приносит патентный Дикий Запад в Германию». Блог IPEG. 7 сентября 2006 г.. Получено 24 июля 2007.

[law360-107] "Apple, SanDisk урегулировали спор о патентах на MP3 в Техасе". Закон об интеллектуальной собственности360. 26 января 2009 г.. Получено 16 августа 2010.

[Kelly-108] «Специалисты Baker Botts LLP: Лиза Кэтрин Келли - работа с представителями». ТОО «Бейкер Боттс». Архивировано из оригинал 10 декабря 2014 г.. Получено 15 сентября 2016.

[MP3_payout-109] «Microsoft грозит выплата MP3 в размере 1,5 млрд долларов». Новости BBC. 22 февраля 2007 г.. Получено 30 июн 2008.

[Microsoft_wins_reversal-110] «Microsoft выигрывает отмену решения о патенте MP3». CNET. 6 августа 2007 г.. Получено 17 августа 2010.

[Alcatel-Lucent-111] «Апелляционный суд по решению федерального округа» (PDF). 25 сентября 2008 г. Архивировано с оригинал (PDF) 29 октября 2008 г.

[brandenburg-112] а ^б Бранденбург, Карлхайнц (1999). «Объяснение MP3 и AAC». Архивировано из оригинал (PDF) 19 октября 2014 г.

[businesswire-113] "Via Licensing объявляет об обновленной совместной патентной лицензии AAC". Деловой провод. 5 января 2009 г.. Получено 18 июн 2019.

[aac-licensors-114] «Лицензиары AAC». Via Corp. Получено 6 июля 2019.

[115] ttps://www.nytimes.com/1999/09/30/technology/news-watch-new-player-from-sony-will-give-a-nod-to-mp3.html

[116] ttps://www.cnet.com/reviews/sony-nw-e100-review/

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[*]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]

[60]

[61]

[62]

[63]

[64]

[65]

[66]

[67]

[68]

[69]

[70]

[71]

[72]

[73]

[74]

[75]

[76]

[77]

[78]

[79]

[80]

[81]

[82]

[83]

[84]

[85]

[86]

[87]

[88]

[89]

[90]

[91]

[92]

[93]

[94]

[95]

[96]

[97]

[98]

[99]

MPEG (Группа экспертов по движущемуся изображению)
MPEG-1 2 3 4 7 21 А B C D E грамм V M U ЧАС
Части MPEG-1	Часть 1: Системы Программный поток Часть 2: Видео на основе H.261 Часть 3: Аудио Слой I Слой II Слой III
Части MPEG-2	Часть 1: Системы (H.222.0) Транспортный поток Программный поток Часть 2: Видео (H.262) Часть 3: Аудио Слой I Слой II Слой III Многоканальный MPEG Часть 6: DSM CC Часть 7: Расширенное кодирование звука
Части MPEG-4	Часть 2: Видео на основе H.263 Часть 3: Аудио Часть 6: DMIF Часть 10: Расширенное кодирование видео (H.264) Часть 11: Описание сцены Часть 12: базовый формат медиафайлов ISO Часть 14: формат файла MP4 Часть 17: Потоковый текстовый формат Часть 20: ЛАЗЕР Часть 22: Открытый формат шрифта Часть 33: Кодирование Интернет-видео
Части MPEG-7	Часть 2: язык определения описания
Компоненты MPEG-21	Части 2, 3 и 9: Цифровой элемент Часть 5: Язык выражения прав
Части MPEG-D	Часть 1: MPEG Surround Часть 3: Унифицированное кодирование речи и звука
Части MPEG-G	Часть 1: Транспортировка и хранение геномной информации Часть 2: Кодирование геномной информации Часть 3: API Часть 4: Эталонное программное обеспечение Часть 5: Соответствие
Детали MPEG-H	Часть 1: транспорт мультимедиа MPEG Часть 2: Высокоэффективное кодирование видео (H.265) Часть 3: MPEG-H 3D Audio Часть 12: высокоэффективный формат файла изображения
Другой	MPEG-DASH

Музыкальные технологии
Музыкальные технологии	Механический Электрические Электронный и цифровой
Запись звука	Аудио канал Микшерный пульт Бинауральная запись Цифровая звуковая рабочая станция (DAW) Блок эффектов Эквалайзер Наушники Микрофон Микрофонный предусилитель Монитор-динамик Многодорожечная запись Музыкальное производство Музыкальный секвенсор Подвесное оборудование
Носитель записи	Фонографическая пластинка Магнитная лента Компактная кассета Компакт-диск DAT Жесткий диск MiniDisc MP3 Opus
Аналоговая запись	8-трековый картридж Усилитель мощности Кассетная дека Сравнение аналоговой и цифровой записи Экспериментальный музыкальный инструмент Фонограф Игрок на пианино Запись аудиокассеты с катушки на катушку Магнитофон
Датчики воспроизведения	Громкоговоритель Наушники Монитор-динамик Система громкой связи Система звукоусиления Корпус динамика Сабвуфер
Цифровое аудио	Цифровая запись Цифровая обработка сигналов
Живая музыка	Микшерный пульт Усилитель басов Блок эффектов Foldback Гитарный усилитель Усилитель клавиатуры Система громкой связи * Реверберация Система звукоусиления
Электронная музыка	Chiptune Гибка контуров Барабанная машина Электронные барабаны Электронный музыкальный инструмент MIDI MIDI-контроллер Музыкальная рабочая станция Сэмплер Секвенсор Звуковой модуль Синтезатор Терменвокс
Программного обеспечения	Цифровой аудио редактор Цифровая звуковая рабочая станция Гаражная группа ProTools Автор партитуры Программный процессор эффектов Программный сэмплер Программный синтезатор
Профессии	Аудио инженер Диджей Гитарный техник Инженер по микшированию Инженер по монитору Тюнер пианино Продюсер звукозаписи Перезаписывающий микшер Звукорежиссер Звуковой последователь Звукооператор Звукооператор Лента op
Люди и организации	Аудио инженерное общество Goji Electronics Институт вещательного звука Леджарен Хиллер IRCAM Макс Мэтьюз Библиотека музыкальной электроники Профессиональная ассоциация освещения и звука Роберт Муг SMPTE STEIM
похожие темы	Аудиофил Высокая точность Домашнее аудио Домашний кинотеатр Музыкальный магазин Профессиональный магазин аудио Новые интерфейсы для музыкального выражения (NIME) Автомобильная аудиосистема