Популярні формати аудіофайлів: WAV, MP3, M4A

Питання вибору формату звукових файлів виникає щоразу, як тільки починаєш працювати над записом, обробкою чи поширенням аудіо. Усім відомо, що .mp3 = звук. І це зрозуміло, адже такий формат − найбільш популярний та один із найуніверсальніших. Однак, якби він був ідеальним, то у відповідних меню диктофонів і програмного забезпечення для обробки звуку не було би традиційної опції «вибір формату». Навіщо ж вибирати, якщо існує один найкращий для будь-якої ситуації? Не існує! Нема повністю універсального рішення.

У зображенні частково використано дизайн з Freepik

Вибір формату − це завжди компроміс. Здебільшого доводиться балансувати між розміром цифрового файлу та якістю звучання, або розміром і потенціалом для подальшої обробки. Звичайно, оптимальним буде співвідношення, у якому поєднано найкраще звучання з найменшим розміром файлу. Щоправда, на різних етапах роботи зі звуком воно може змінюватися. Наприклад, під час звукозапису розмір файлу не такий важливий, головне зберегти якість звучання та потенціал для обробки. Але під час рендеру (експорту) звукової доріжки, доведеться стиснути файл до найменшого розміру, щоб його поширення / публікація / зберігання було максимально зручним та ефективним. Не думаю, що багато користувачів хотіли би завантажити 5-хвилинне аудіо з розміром 50-70 мегабайтів.

Коротко описати всі доступні формати неможливо (їх надто багато). Та й нема потреби знати всі для повсякденної роботи журналіста. Зауважу, що ця публікація не претендує на вичерпність, бо розрахована на людей, які тільки починають начитувати, записувати та монтувати свої перші проекти, а не на професійних звукорежисерів. Тому зосередимося лише на трьох форматах.

.WAV (Waveform audio files)

Це один з найбільш популярних цифрових форматів аудіо та “золотий стандарт” для студійного запису. WAV був одним з перших цифрових аудіоформатів і швидко став основним продуктом на всіх платформах. Незважаючи на десятиліття прогресу, він все ще зберігає свої позиції як один з провідних світових форматів аудіо.

Характерним для WAV є відсутність стиснення (Uncompressed Lossless). Дані зберігаються як є у повному оригінальному форматі, який не потребує розшифровки. Отож, що захоплюється та записується − це найближче цифрове представлення оригінальної форми звукової хвилі. У процесі майже не відбувається суттєвих втрат якості звуку. Це забезпечує величезну універсальність, що дозволяє чудово редагувати та маніпулювати.

  • Основний недолік: великий розмір файлу.
  • Використовуємо для: високоякісного запису та відтворення звуку.

Ми записали коротенький тест, щоб не пояснювати різницю «на пальцях». У цьому тесті почергово записано начитку з різними параметрами диктофона. Чи чуєте ви різницю? Я так. А також дуже добре помітна різниця в розмірі файлів.


Завантажити оригінальні файли можна тут:

.MP3 (MPEG-2 Audio Layer III)

Нестиснені аудіо формати, як, наприклад, WAV, забезпечують чудову якість звуку, але ціною великого розміру файлу. У середині 90-х, люди швидко зрозуміли, що надсилати нестиснені файли через Інтернет було недоцільно − а часто й неможливо. Саме тому найбільшу популярність отримали MP3-файли, розмір яких був майже у 10 разів меншим, аніж WAV.

Завдяки алгоритмам стиснення, які змогли досягти вражаючо невеликих розмірів файлів, MP3 став основним елементом епохи Інтернету і зберігає свої сильні позиції нині. Не зважаючи на те, що сучасна швидкість передачі даних в мережі суттєво зросла, зберігати на серверах великі файли недоцільно, адже хостинг небезрозмірний. Також це знижує швидкість завантаження сторінок сайту, а відтак негативно впливає на його ранжування в Google.

Однак невеликий розмір файлу досягається ціною якості. Для стиснення використовують різні варіанти перекодування даних щоб економити місце. Але ця економія означає, що деякі дані повинні загубитися в процесі. Зазвичай високі частоти втрачаються першими, оскільки більшість людей не чують деталей на дуже високих частотах. Чим нижча якість кодування, тим більше частот і деталей загубиться в аудіо.

Сучасні алгоритми стиснення дозволяють отримати більш високі бітрейти (bitrate), а це, означає, що вони здатні досягати високих коефіцієнтів стиснення з невеликими втратами якості звуку.

Бітрейт − швидкість передачі даних аудіопотоку. Наприклад, бітрейт 128 kbps розшифровується як 128 кілобіт в секунду і означає, що для кодування однієї секунди звуку використовується 128 тисяч біт (1 байт = 8 біт). Якщо перевести це значення в кілобайти, то вийде що одна секунда звуку займає близько 16 Кб. При цьому загальне правило: більші бітрейти = більша якість = більший розмір файлу.

Для журналістських матеріалів, у яких здебільшого є лише голоси (можливо, ще якась музика на тлі), видається оптимальним бітрейт 192 kbps (320 kbps для складних композицій).

Не варто забувати, що поганий запис не покращиться від збільшення бітрейту.

  • Основний недолік: помітна втрата якості від стиснення (здебільшого через неправильні налаштування).
  • Використовуємо для: універсального запису та публікації аудіороликів.

Ще один тест. Цього разу ми записували лише один раз, а потім конвертували формат WAV у MP3. Тут звучить чоловічий, жіночий та дитячий голоси, а також є музика на тлі. Ми намагалися створити якомога більше різноманіття звуків, але різниця в якості звучання, до і після компресії, майже непомітна. Можливо, у мене проблеми зі слухом, пишіть в коментарях, чи чуєте ви різницю. Щодо розміру файлів, то, думаю, тут не треба коментувати. Все очевидно.

Завантажити оригінальні файли можна тут:

.M4A (MPEG-4 Part 14)

Цей формат добре знайомий усім, хто використовує iPhone для звукозапису. M4A розробила компанія Apple як нову альтернативу для MP3, і активно просуває його в усіх своїх пристроях та програмному забезпеченні. Хоча більшість сучасних аудіоплеєрів можуть відтворювати файли M4A, однак досі цей формат не може конкурувати з універсальною сумісністю MP3.

Для M4A-файлів застосовується розширений кодек Advanced Audio Coding (AAC), який здатний забезпечити ті ж бітрейти, що й MP3, але при цьому досягається більш ефективне стиснення, тобто отримуємо ще менший розмір файлів зі збереженням високої якості звуку.

В IOS є можливість вимкнути компресію, щоб зберегти максимальну якість запису (див. інструкцію нижче), але не варто забувати, що водночас збільшиться розмір файлів.


Незважаючи на технічні переваги M4A, в журналістській практиці він може бути ефективно використаний на стадіях запису та обробки аудіо, а от екпортувати готову композицію доцільніше в MP3 (принаймні, поки що).

  • Основний недолік: недостатня популярність, що ускладнює крос-платформове використання.
  • Використовуємо для: запису аудіороликів за допомогою смартфонів.

Немає коментарів:

Дописати коментар