ИССЛЕДОВАНИЕ МЕТОДОВ ИДЕНТИФИКАЦИИ АУДИОКОНТЕНТА ПО ЕГО РИТМУ - Студенческий научный форум

V Международная студенческая научная конференция Студенческий научный форум - 2013

ИССЛЕДОВАНИЕ МЕТОДОВ ИДЕНТИФИКАЦИИ АУДИОКОНТЕНТА ПО ЕГО РИТМУ

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
В настоящее время существует достаточно много методов идентификации аудиоконтента. Но практически во всех известных идентификационных системах используются алгоритмы, которые фирма-производитель скрывает от пользователей, не предоставляя возможность ознакомиться с исходным кодом программы и математическими моделями.

Целью работы является усовершенствование одного из этих алгоритмов и разработка собственного приложения, способного показывать лучшие результаты при тестировании и впоследствии использовании.

Среди исследованных подходов к данной задаче можно особо выделить два принципиально разных, но одинаково успешных:

- идентификация по музыкальным параметрам, таким как темп, характерные ритмические рисунки, гармонические и мелодические конструкции.

- идентификация по технологии акустических отпечатков

Первый метод, как было сказано ранее, заключается в определении ряда музыкальных параметров аудиофайла. Эти параметры подвергаются анализу, результатом которого является набор метаданных, содержащий описание ключевых параметров исследуемого контента. Операции с этими метаданными позволяют выполнять поиск содержимого цифровой фонотеки в автоматическом режиме. Для определения параметров, используемых при реализации данного метода, применяется непрерывное вейвлет-преобразование.

Второй метод, именуемый технологией акустических отпечатков, был разработан и запатентован компанией Relatable, которая утверждает, что поиск по уникальным для аудиофайла акустическим характеристикам является очень эффективным. Совокупность этих характеристик не меняется при перекодировании в другой формат или при изменении частоты. Таким образом, системы, основанные на данной технологии способны опознать искомую композицию независимо от формата.

Большинство существующих систем идентификации аудиоконтента основаны все-таки на втором методе – технологии акустических отпечатков. Наиболее известные из них: TrackID и Shazam, работающие по одинаковому принципу: для идентификации музыкального трека пользователь запускает программу — она записывает отрывок (от 10 до 12 секунд) музыкального произведения с помощью встроенного в телефон микрофона в формате AMR и отсылает на сервер, где он анализируется сравнивается с образцами, существующими в базе данных, и через несколько секунд, в случае успешного сравнения, на экране высвечивается требуемая информация о песне: Исполнитель, Название, Альбом, Жанр, Студия, YouTube Видео, Стихи.

В данной работе будет использоваться алгоритм, основанный на методе идентификации по музыкальным параметрам. В дальнейшем анализу подвергнется такой тип данных как MP3 на предмет возможности получения из него АЧХ объекта. Амплитудно-частотная характеристика является основополагающей для реализации выбранной методики. Поэтому будут проанализированы характеристики, нужные для ее построения. Она будет анализироваться не полностью, а лишь по срезу. Анализу будут подвергаться расстояния между пиками, соответствующими максимальным всплескам амплитуды. То есть сравнение исследуемого и хранимого в базе данных аудиофайлов будет проводиться по их ритму. Также следует учесть факторы, которые могут повлиять на точность сравнения образцов: такие, как шумы, изменение частоты. Для увеличения точности идентификации необходимо ввести погрешности для результатов сравнения.

Для последующего решения ставятся следующие задачи:

1. Математическое представление и алгоритм процедуры идентификации аудиоконтента.

2. Выбор среды программирования и создание в ней приложения, идентифицирующего аудиоконтент по разработанному алгоритму.

3. Анализ разработанного приложения, его тестирование при различных входных данных.

Список использованной литературы:

1. Фадеев А.С.Идентификация музыкальных объектов на основе непрерывного вейвлет-преобразования. Томск: «Кибернетический центр» ТПУ, 2008. – с. 6-8

2. Асмаков С. Идентификация звука: миссия выполнима.// Компьютер Пресс – 2010 – №10:

http://www.compress.ru/article.aspx?id=21709&iid=991

3. Андреев Г. Напевы Рабиновича.//КомпьюТерра – 2001 – №17 :

http://www.kinnet.ru/cterra/394/index.html

Просмотров работы: 1173