что такое mp3 файл
Формат mp3, что это такое, работа с ним, как создать mp3 файл
Формат mp3, что это такое? В статье расскажем подробно об этом формате. Кроме того, разберем вопрос, как создавать файл mp3 и с ним работать. С помощью этой информации начинающие пользователи будут знать, какой формат использовать для работы с аудио.
Формат mp3, что это такое, где используется
Здравствуйте, друзья! Многие пользователи ПК знают, что есть такой формат, как mp3, но не все понимают, что он обозначает. Сегодня мы ответим на вопрос, формат mp3, что это такое.
Итак, форматом mp3 называют цифровой формат, который хранит аудио-файлы. Его разработали программисты MPEG в 1993 году. Простыми словами, mp3 относят к кодекам, которые выполняют задачу цифрового кодирования. Они воспроизводят и передают аудио-информацию (скрин 1).
Формат mp3 используется для воспроизведения музыки на Андроид, компьютере или других устройствах. Вместе с тем, аудио файлы в этом формате загружают в социальные сети, на сайты в Интернете, записывают речь в mp3 формате, используют в музыке.
Далее рассмотрим характеристики формата mp3 и виды. Также разберем, какие программы работают с данным форматом.
Характеристики формата(файла) mp3
В этом разделе будут показаны технические характеристики формата mp3. С помощью характеристик вы сможете определить, какой формат для аудио-файлов лучше использовать:
Теперь, вы знаете, какие имеет основные характеристики формат mp3.
Виды и типы аудио форматов
Кратко сделаем обзор на виды аудио форматов. Они разделены на три типа:
Перечисленные форматы отлично подойдут для работы со звуком и медиа-файлами.
Битрейт, что это такое? Это нужно знать для работы с аудио форматами
Важно знать, битрейт, что это такое? Давайте рассмотрим подробно понятие, чтобы понять значимость битрейта в работе с аудио форматами.
Итак, битрейт – это количество бит, которые используются для обработки и передачи информации в единицу времени. Проще говоря, битрейтом можно назвать скорость потокового воспроизведения аудио-файла.
Битрейт принято разделять на три вида: Постоянный – когда значение битрейта не меняется, Переменный – число битрейта может меняться в зависимости от пользовательских настроек, Усредненный – когда сочетаются первые два вида битрейта.
Стандартные значения битрейта следующие – «32 kbps-1411 kbps». Показатель битрейта можно увидеть в свойствах аудио файла (скрин 2).
Далее будут рассмотрены программы, которые работают с аудио-форматом mp3.
Программы для mp3
Если вам нужно открыть аудио файл в формате mp3, для этого есть специальные программы (скрин 3).
Они работают в качестве аудио-плееров. Некоторые программы не нужно устанавливать на ваши устройства – они уже установлены. Чтобы открыть формат mp3, достаточно запустить аудио-файлы в нужном проигрывателе. Далее по инструкции это сделаем.
Программы для работы с mp3 на компьютере с ОС Windows
Для работы с mp3 форматом можно использовать бесплатные программы:
Остальные утилиты можно найти и скачать с этого ресурса: «soft.mydiv.net/win/cname47/cname48/proigryvateli/».
Итак, чтобы открыть mp3 на компьютере или ноутбуке, воспользуемся программой Windows Media Player. Приготовьте заранее аудио-файл в формате mp3 на рабочем столе компьютера. Далее нажмите по данному файлу правой кнопкой компьютерной мыши и из меню кликните кнопку «Воспроизвести» (скрин 4).
После этого аудио файл формата mp3 будет открыт для воспроизведения. Если у вас установлены другие проигрыватели для аудио файлов mp3, то нажмите по файлу правой кнопкой мыши далее «Открыть с помощью». Затем выберите программу, которая воспроизведет аудио-файл в этом формате.
Программы для работы с mp3 на компьютере с ОС Mac
Для операционной системы Mac есть специальные аудио-программы, которые работают с mp3 файлами:
Чтобы пользоваться проигрывателями, скачайте и установите их на Mac. Далее открываете стандартными способами файл mp3 в этих программах. Вместе с тем, компьютеры OC Mac имеют свои проигрыватели, которые запускают mp3. Есть еще такие программы, которые можно использовать для других форматов – «xmediasoft.ru/macintosh/media-players».
Формат mp3, что это такое для телефона? Работа на Андроиде и iOS
Для Андроид и iOS есть приложения, которые воспроизводят аудио файлы в mp3. Если вы работаете с телефона с ОС Андроид, то в таком случае можете скачать и установить с Плей Маркета следующие приложения:
Практически все Андроид оснащены встроенным проигрывателем. Можно скачать музыку, например, из ВК и сразу ее воспроизвести на телефоне в формате mp3.
Некоторые пользователи работают с операционной системой iOS и слушают музыку в формате mp3. Чтобы успешно открыть этот формат файлов в данной OC, можете воспользоваться приложениями:
Конечно, это еще не все программы, которые работают с форматом mp3 на iOS. Остальные вы можете скачать с магазина АппСторе.
Как создать файл mp3, простые шаги
Создать файл mp3 вам поможет любая программа для записи звука. Практически на каждом компьютере есть приложение, которое записывает звук, либо установите другую программу. Чтобы активировать приложение записи голоса, наберите в поиске Windows: «Запись голоса».
Далее нажмите по программе. Затем подключите к компьютеру микрофон. Кликните на значок записи и запишите с помощью приложения свой голос (скрин 5).
После чего остановите запись и найдете в разделе «Документы», далее «Аудио-записи» файл в формате mp3.
Чем конвертировать формат mp3 в ogg, wav и другие форматы и наоборот
При необходимости, пользователи конвертируют формат mp3 в другие форматы. Сделать это можно с помощью онлайн-конвертеров или программ. В статье: «Бесплатный конвертер видео в видео — Video to video converter» рассказывается о бесплатном конвертере, который конвертирует разные форматы. Вы можете его применить.
Принцип работы сервисов и программ конвертеров простой. Загружаете в них аудио файл в формате mp3 далее выбираете, например, формат wav и нажимаете Конвертировать. После этого на компьютер скачиваете обработанный файл с другим форматом.
Кроме того, вы можете загрузить в этот конвертер, например, формат WAV и перевести его обратно в формат mp3.
Заключение
В статье рассмотрен вопрос, формат mp3, что это такое. Кроме того мы рассмотрели характеристики формата, какие программы запускают файлы mp3. Использование данного формата даст вам много преимуществ: вы сможете не только слушать музыку в этом формате, но и создавать аудио-файлы, редактировать.
Внутри MP3. А как оно всё устроено?
Однажды мне понадобилось решить простенькую (как мне тогда казалось) задачу – в PHP-скрипте узнать длительность mp3-файла. Я слышал о ID3 тегах и сразу подумал, что информация о длительности хранится либо в тегах, либо в заголовках mp3-файла. Поверхностные поиски в интернете показали что за пару-тройку минут решить эту задачу не получится. Поскольку от природы я довольно любопытен а время не поджимало — решил не использовать сторонние инструменты а разобраться в одном из самых популярных форматов самостоятельно.
Если Вам интересно, что там внутри – добро пожаловать под кат (трафик).
В данной статье мы не будем подробно останавливаться на извлечении ID3v2 тегов – это можно вынести в отдельную статью, так как там есть различные нюансы. А так же на фрагментах заголовков, которые практически не используются в настоящее время (например, часть Emphasis заголовка mp3-фрейма). Так же мы не рассматриваем структуру самих аудиоданных — тех самых, которые слышим из колонок.
ID3 теги
ID3 (от англ. Identify a MP3) — формат метаданных, наиболее часто используемый в звуковых файлах в формате MP3. ID3 подпись содержит данные о названии трека, альбома, имени исполнителя и т. д., которые используются мультимедиапроигрывателями и другими программами, а также аппаратными проигрывателями, для отображения информации о файле и автоматического упорядочивания аудиоколлекции.
Существует две абсолютно разных версии ID3-данных: ID3v1 и ID3v2.
ID3v1 – имеет фиксированный размер в 128 байт, которые дописываются в конец mp3-файла. Там можно хранить: название трека, исполнитель, альбом, год, комментарий, номер трека (для версии 1.1) и жанр.
Довольно быстро всем стало понятно, что 128 байт – очень уж небольшое место для хранения таких данных. И поэтому, со временем, появилась и успешно используется вторая версия данных – ID3v2.
В отличии от первой версии, теги v2 имеют переменную длину и размещаются в начале файла, что позволяет поддерживать потоковое воспроизведение. (Формат ID3v2.4 позволяет так же хранить данные и в конце файла).
Данные ID3v2 состоят из заголовка и последующих фреймов ID3v2. Например, в версии ID3v2.3 существует более 70 типов фреймов.
В данном случае вместе с заголовком ID3v2 (10 байт) – данные ID3v2 занимают 1024 байта.
После ID3v2-заголовка идут собственно теги. Подробный разбор чтения тегов ID3v2, как сказано выше, я решил не включать в эту статью.
Теперь у нас есть информация о наличии и длине тегов ID3 и мы можем приступать в разбору mp3-фрейма и понять-таки – где же хранится длительность. А заодно понять и всё остальное.
MP3-фрейм
Весь mp3-файл состоит из фреймов, которые можно извлекать только последовательно. Фрейм содержит в себе заголовок и аудио-данные. Поскольку мы не ставим себе целью написать прошивку для магнитофона – нас интересует именно заголовок фрейма.
О нем подробнее (куча таблиц и сухой информации)
Размер заголовка – 4 байта.
Режимы сжатия данных или какой бывает битрейт
Существует 3 режима сжатия данных:
CBR (constant bitrate) – постоянный битрейт. Не меняется на всем протяжении трека.
VBR (variable bitrate) – переменный битрейт. При этом сжатии битрейт постоянно меняется на протяжении трека.
ABR (average bitrate) – усредненный битрейт. Это понятие используется только при кодировании файла. На «выходе» получается файл с VBR.
Длительность = Размер аудиоданных / Битрейт (в битах!) * 8
Например, файл имеет размер 350670 байт. Есть ID3v1 теги (128 байт) и ID3v2 теги (1024 байта). Битрейт = 96. Следовательно размер аудиоданных равен 350670 – 128 – 1024 = 349518 байт.
Длительность = 349518 / 96000 * 8 = 29,1265 = 29 секунд
Необходимо пояснить – как определить режим сжатия. Всё просто. Если файл сжат с VBR – то добавляется VBR-заголовок. По его наличию мы и можем понять, что используется переменный битрейт.
Есть два вида заголовков: Xing и VBRI.
Xing размещается со смещением от начала первого mp3-фрейма в позиции, согласно таблице:
Например: у нас ID3v2 тег занимает 1024 байта. Если наш mp3-файл имеет режим канала «Стерео» — то заголовок VBR Xing будет начинаться со смещения 1024 + 32 = 1056 байт.
Заголовок VBRI всегда размещается со смещением +32 байта от начала первого mp3-фрейма.
Первые четыре байта в обоих заголовках содержат маркер ‘Xing’ или ‘Info’ для Xing. И ‘VBRI’ для VBRI.
Эти VBR заголовки имеют переменную длину и содержат различную информацию о кодировании файла. Подробнее о структуре заголовков VBR (и не только) можно почитать, например, тут.
Я же расскажу только о том, что нас интересует в данный момент. А именно – количество фреймов (Number of Frames). Это число длиной 4 байта.
В заголовке Xing оно содержится по смещению +8 байт от начала заголовка. В VBRI +14 байт от начала заголовка.
Используя таблицу Сэмплов на фрейм (Sampler Per Frame) мы можем получить длительность mp3-файла, закодированного с переменным битрейтом.
Длительность = Количество фреймов * Сэмплов на фрейм / Частоту дискретизации
Например: из заголовка VBRI получили количество фреймов 1118, сэмплов на фрейм = 1152. Частота дискретизации = 44100.
Длительность = 1118 * 1152 / 44100 = 29.204 = 29 секунд.
На этом на сегодня всё. Если был кому-то полезен — спасибо.
Для тех, кто захочет немедленно поковырять внутренности mp3 — Тут лежат скрипт на php, которые я писал для себя одновременно с данной статьей и четыре небольших mp3-файла для теста.
Что такое mp3 файл
MP3 (более точно, англ. MPEG-1/2/2.5 Layer 3 ; но не MPEG-3) — это кодек третьего уровня, разработанный командой MPEG, лицензируемый формат файла для хранения аудиоинформации.
MP3 является одним из самых распространённых и популярных форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Формат может проигрываться практически во всех популярных операционных системах, на большинстве портативных аудиоплееров, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.
В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения звука очень близкого к оригинальному (по мнению большинства слушателей), хотя аудиофилы говорят об ощутимом различии. При создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/11 от оригинального файла с CD-Audio. Само по себе несжатое аудио формата CD-Audio имеет битрейт 1411,2 кбит/с. MP3-файлы могут создаваться с высоким или низким битрейтом, который влияет на качество файла-результата. Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Данный метод называют кодированием восприятия. [1] При этом на первом этапе строится диаграмма звука в виде последовательности коротких промежутков времени, затем на ней удаляется информация, не различимая человеческим ухом, а оставшаяся информация сохраняется в компактном виде. Данный подход похож на метод сжатия, используемый при сжатии картинок в формат JPEG. [уточнить]
Содержание
История
MP3 разработан рабочей группой института Фраунгофера (нем. Fraunhofer-Institut für Integrierte Schaltungen ) под руководством Карлхайнца Бранденбурга и университета Эрланген-Нюрнберг в сотрудничестве с AT&T Bell Labs и Thomson (Джонсон, Штолл, Деери и др.).
Основой разработки MP3 послужил экспериментальный кодек ASPEC (Adaptive Spectral Perceptual Entropy Coding). Первым кодировщиком в формат MP3 стала программа L3Enc, выпущенная летом 1994 года. Спустя один год появился первый программный MP3-плеер — Winplay3.
При разработке алгоритма тесты проводились на вполне конкретных популярных композициях. Основной стала песня Сюзанны Веги «Tom’s Diner». Отсюда возникла шутка, что «MP3 был создан исключительно ради комфортного прослушивания любимой песни Бранденбурга», а Вегу стали называть «мамой MP3».
Описание формата
Как и формат JPEG, MP3 использует спектральные отсечения, согласно психоакустической модели. Звуковой сигнал разбивается на равные по продолжительности отрезки, каждый из которых после обработки упаковывается в свой фрейм (кадр). Разложение в спектр требует непрерывности входного сигнала, посему для расчётов используется также предыдуший и следующий фрейм. В звуковом сигнале есть гармоники с меньшей амплитудой и гармоники, лежащие вблизи более интенсивных — такие гармоники отсекаются, так как среднестатистическое человеческое ухо не всегда сможет определить присутствие либо отсутствие таких гармоник. Такая особенность слуха называется эффектом маскировки. Также возможна замена двух и более близлежащих пиков одним усреднённым (что как правило и приводит к искажению звука). Критерий отсечения определяется требованием к выходному потоку. Поскольку весь спектр актуален, высокочастотные гармоники не отсекаются, как в JPEG, а только выборочно удаляются, чтобы уменьшить поток информации за счёт разрежения спектра. После спектральной «зачистки» применяются математические методы сжатия и упаковка во фреймы. Каждый фрейм может иметь несколько контейнеров, что позволяет хранить информацию о нескольких потоках (левый и правый канал либо центральный канал и разница каналов). Степень сжатия можно варьировать, в том числе в пределах одного фрейма. Интервал возможных значений битрейта составляет 8-320 кбит/c.
MP3 и «качество Audio-CD»
В прошлом было распространено мнение, что запись с битрейтом 128 кбит/c подходит для музыкальных произведений, предназначенных для прослушивания большинством людей, обеспечивая качество звучания Audio-CD. В действительности всё намного сложнее. Во-первых, качество полученного MP3 зависит не только от битрейта, но и от кодирующей программы (кодека) (стандарт не устанавливает алгоритм кодирования, только описывает способ представления). Во-вторых, помимо превалирующего режима CBR (Constant Bitrate — постоянный битрейт) (в котором, проще говоря, каждая секунда аудио кодируется одинаковым числом бит) существуют режимы ABR (Average Bitrate — усреднённый битрейт) и VBR (Variable Bitrate — переменный битрейт). В-третьих, граница 128 кбит/c является условной, так как она была «изобретена» в эпоху становления формата, когда качество воспроизведения звуковых плат и компьютерных колонок как правило было ниже, чем в настоящее время.
На данный момент наиболее часто встречаются MP3 файлы с битрейтом 192 кбит/c, что может косвенно говорить о том, что большинство считает этот битрейт достаточным. Реально воспринимаемое «качество» зависит от исходного аудиофайла, слушателя и его аудиосистемы. Некоторые меломаны предпочитают сжимать музыку с «максимальным качеством» — 320 кбит/c, либо даже переходить на кодеки без потерь, например FLAC. Также среди меломанов бытует мнение, что некоторые семплы (фрагменты аудиозаписи) не поддаются качественному сжатию с потерями: на всех возможных битрейтах не составляет особого труда отличить сжатое аудио от оригинала. Однако есть и серьёзные возражения [2] :
Совершенно очевидно, что (возьмём с запасом) битрейта 256 kbps в подавляющем большинстве случаев должно быть более чем достаточно для комфортного восприятия музыки с CDA-источника (44 kHz/16 bit/stereo). Это очевидно не только из моего доморощенного теста, но и по анализу профессиональных слепых тестов (например, германского издания «c’t», июнь 2000 г.): даже в них экспертам не всегда удается «угадать» сжатый до 256 kbps звук, причем тестирование проходит в специально подготовленных помещениях и на дорогом оборудовании, а эксперт знает, что надо «слушать», чтобы почувствовать сжатие.
Режимы кодирования и опции
Существует три версии MP3 формата для различных нужд: MPEG-1, MPEG-2 и MPEG-2.5. Отличаются они возможными диапазонами битрейта и частоты дискретизации:
Режимы управления кодированием звуковых каналов
Так как формат MP3 поддерживает двухканальное кодирование (стерео), существует 4 режима:
CBR расшифровывается как Constant Bit Rate, то есть постоянный битрейт, который задаётся пользователем и не изменяется при кодировании произведения. Таким образом, каждой секунде произведения соответствует одинаковое количество закодированных бит данных (даже при кодировании тишины). CBR может быть полезен для потоков мультимедиа данных по ограниченному каналу; в таком случае кодирование использует все возможности канала данных. Для хранения данный режим кодирования не является оптимальным, так как он не может выделить достаточно места для сложных отрезков исходного произведения, при этом бесполезно тратя место на простых отрезках. Повышенные битрейты (выше 256 кбит/c) могут решить данную проблему, выделив больше места для данных, но зато и пропорционально увеличивая размер файла.
VBR расшифровывается как Variable Bit Rate, то есть изменяющийся битрейт или переменный битрейт, который динамически изменяется программой-кодером при кодировании в зависимости от насыщенности кодируемого аудиоматериала и установленного пользователем качества кодирования (например, тишина закодируется с минимальным битрейтом). Этот метод MP3-кодирования является самым прогрессивным и до сих пор развивается и улучшается, так как аудиоматериал разной насыщенности может быть закодирован с определённым качеством, которое обычно выше, чем при установке среднего значения в методе CBR. Плюс к тому, размер файла уменьшается за счёт фрагментов, не требующих высокого битрейта. Минусом данного метода кодирования является сложность предсказания размера выходного файла. Но этот недостаток VBR-кодирования незначителен в сравнении с его достоинствами. Также минусом является то, что VBR считает «незначительной» звуковой информацией более тихие фрагменты, таким образом получается, что если слушать очень громко, то эти фрагменты будут некачественными, в то время как CBR делает с одинаковым битрейтом и тихие, и громкие фрагменты.
Формат VBR постоянно улучшается, благодаря постоянному совершенствованию математической модели кодеков, в частности, после выхода обновлённой версии свободного MP3-кодека LAME (версия 3.99.3), кодирование с переменным битрейтом, по заявлению самих разработчиков, качественно лучше CBR и тем более ABR.
ABR расшифровывается как Average Bit Rate, то есть усредненный битрейт, который является гибридом VBR и CBR: битрейт в кбит/c задаётся пользователем, а программа варьирует его, постоянно подгоняя под заданный битрейт. Таким образом, кодек будет с осторожностью использовать максимально и минимально возможные значения битрейта, так как рискует не вписаться в заданный пользователем битрейт. Это является явным минусом данного метода, так как сказывается на качестве выходного файла, которое будет немного лучше, чем при использовании CBR, но намного хуже, чем при использовании VBR. С другой стороны, этот метод позволяет наиболее гибко задавать битрейт (может быть любым числом между 8 и 320, против исключительно кратных 16 чисел метода CBR) и вычислять размер выходного файла.
Кодеки
Типы программ, необходимые для преобразования форматов файлов. Наиболее распространённые кодеки MP3:
Структура файла
MP3-файл состоит из нескольких фрагментов (фреймов) MP3, которые, в свою очередь, состоят из заголовка и блока данных. Такая последовательность фрагментов называется элементарным потоком. Фрагменты не являются независимыми элементами («резервуар байт»), и поэтому не могут быть извлечены произвольно. Блок данных MP3-файла содержит сжатую аудио информацию в виде частот и амплитуд. На приведённой диаграмме показано, что заголовок MP3 состоит из маркера, который служит для нахождения верного MP3-фрагмента. За ним следует бит, показывающий, что используется стандарт MPEG и два бита, показывающие использование layer 3; другими словами, это определяет MPEG-1 Audio Layer 3 или MP3. Последующие значения могут варьироваться в зависимости от типа MP3-файла. Стандарт ISO/IEC 11172-3 определяет диапазон значений для каждой секции заголовка, вместе с общей его спецификацией. Большинство MP3 файлов в настоящий момент содержат ID3-метаданные, которые предшествуют или следуют за MP3-фрагментом; они также отображены на диаграмме.
Теги (от англ. tag — ярлык, метка, бирка) — метки в границах MP3-файла (в начале и/или в конце). В них может быть записана информация об авторстве, альбоме, годе выпуска и прочая информация о треке. В более поздних версиях тегов возможно хранение обложек альбомов и текстов песен. Существуют различные версии тегов (см.: ID3).
Недостатки
Юридические ограничения. Патентом на MP3 владеет компания Alcatel-Lucent, которая требует лицензирования некоторых способов использования формата. Срок действия связанных с MP3 патентов истекает в 2007—2017 годах. Почти полный стандарт появился в открытом доступе 6 декабря 1991 года. В США изобретения публично раскрытые более года не могут быть запатентованы. Однако для патентов, оформленных до 8 июня 1995 года, существовала возможность увеличить их сроки действия. Известные патенты, касающиеся расшифровки MP3, прекращают действие в США к декабрю 2012.
См. также
Примечания
Ссылки
AMBE • iLBC • IMBE • iSAC • Nellymoser • QCELP • RTAudio • SILK • Siren • Speex • SVOPC • Truespeech