С каждым годом компьютерные технологии совершенствуются все больше и больше, в том числе и программное обеспечение, предназначенное для профессиональной обработки аудио данных. Огромный скачок вперед совершила компания Microsoft, разработав программный интерфейс DirectX, предназначенный для упрощения написания программ для работы с графикой и звуком.
Обработка цифровогоподразделяется на:
Линейная обработка происходит в настоящем времени и для нее нужна быстрая реакция процессора.
Внелинейная обработка отсутствуют временные ограничения, поэтому можно использовать любые процессоры. Но процесс обработки может затянуться до нескольких часов.
В данной статье мы рассмотрим такие аспекты обработки цифрового звука как сжатие,технология AudioMPEGLayer3 (MP3),формат MP3 цифрового звука,психоакустическая модель,адаптивное кодирование,хранение цифрового звука,носители цифрового звука.
1. Сжатие цифрового звукаПри цифровом кодировании звук и видео можно довести до зрителя, значительно уменьшив поток или ширину полосы частот, причем с обновлением компьютерных технологий известные методы сжатия дешевеют, а новые начинают быть все более востребованными.
Сжатие осуществляется по нескольким правилам:
Если можно не сжимать данные, постарайтесь обойтись без этого.
При сжатии ставьтесамый маленький коэффициент компрессии.
Избегайте сжатия уже сжатых данных.
Сжатиемможнорассинхронизироватьаудио- и видеопотоки.
При сжатии используйте данные без лишних шумов.
После сжатия увеличивается возможность ошибок при передаче данных.
MPEG (MotionPicturesExpertGroup) - название рабочей группы, созданной при Международной организации по стандартизации и Международном электрическом комитете (ISO/IEC) с целью разработки стандартов сжатия видео и аудиоинформации. Собственно MPEG определет аудио и видео форматы, использующие сжатие с частичной потерей информации, а также операции, производимые декодерами MPEG.
Стандарт MP3 - схема сильного сжатия аyдио с потеpями, полное название - MPEG-1 Layer3 (иногда пишут просто MPEG Layer 3).
MP3 использует спектральные отсечения, согласно психоакустической модели. Звуковой сигнал делится на одинаковые отрезки, каждый из которых после обработки записывается в свой фрейм (кадр). Разложение в спектр требует непрерывности входного сигнала. Два и более пикарасположенные рядом, заменяется одним усреднённым. После спектральной «зачистки» применяются математические методы сжатия и упаковка во фреймы. Каждый фрейм может иметь несколько контейнеров, что позволяет хранить информацию о нескольких потоках (по-канально).
3Психоакустическая модельС помощью психоакустических моделейкодер определяет порог допустимого шума квантования. Стандарт MPEG устанавливает 2психоакустические модели.
Стандарт сжатия звука MPEG допускаетбольшую свободу при реализации моделей. Суть этой реализации в конкретном кодере зависит от требуемой степени сжатия. В приложениях широкого потребления, в которых не требуется высокий фактор сжатия, психоакустическая модель может вовсе отсутствовать. В этом случае алгоритм назначения битов не использует соотношение SMR (signaltomaskratio, соотношение сигнал/маскирование).
Шаги психоакустических моделей:
1. Путемоперций Фурье делается переход от родных звуков к их частотным коэффициентам.
2. Полученные частоты распределяются по критическим полосам.
3. Спектральные значения критических полос деляться на тональные и нетональные компоненты.
4. Перед определением порогов маскирования шумов для различных критических полос, модель применяет функцию маскирования к сигналам из разных критических полос.
5. Модель определяет пороги маскирования для каждой подполосы.
Заключение
Целью исследования темы реферата было предоставить необходимые теоретические сведения в области обработки цифрового звука.
Кроме того, были выполнены основные задачи реферата: выявить принципы психоакустики и психоакустических моделей, во-вторых, исследовать способы сжатия цифрового цифрового звука, в-третьих, исследовать работу формата МР3, в-четвертых, сформулировать понятие адаптивного кодировании цифрового звука, и в-пятых, узнать больше о хранении цифрового звука и носителях цифровой аудио-информации.
На основании вышеизложенного были сделаны следующие выводы.
Психоакустика — научная дисциплина, изучающая психологические и физиологические особенности восприятия звука человеком, основанные на том, что человеческое ухо воспринимает только достаточно небольшую область спектра и терпимо относится к небольшим искажениям звука.
Современные методы сжатия цифрового звука используют сложные математические алгоритмы и знания в области психоакустики. Условно их можно разделить на два основных типа: сжатие без потерь (например, формат flac) и сжатие с потерями (к нему относится популярный формат МР3).
MP3 является одним из самых распространённых и популярных форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений.
Таким образом, в настоящее время существует огромное разнообразие методов и способов обработки звукового сигнала. Для сжатия цифрового звука используются различные математические модели, в том числе адаптивные алгоритмы, а также знания в области психоакустики. Одним из самых известных форматов хранения цифрового звука является формат МР3, применяющий адаптивную технологию сжатие данных с потерями. Несмотря на огромное разнообразие уже имеющихся методов, программных средств для обработки цифрового звука и видов электронных носителей, данная область мультимедийных технологий не теряет актуальности как для профессионалов, так и для рядовых слушателей, и продолжает активно развиваться.
Список литературы
Загуменнов А.П. Компьютерная обработка звука, 2013 г. [Электронный ресурс] URL= http://www.litres.ru/aleksandr-zagumennov/komputernaya-obrabotka-zvuka/5352013/Дата обращения: 01.06.13
Сэломон, Д. Сжатие данных, изображений и звука."Техносфера", 2004 г., 368 с.
Цифровой аудио формат MP3. [Электронный ресурс] URL= http://www.n-audio.com/articles/format-2.htm Дата обращения: 01.06.13.