Целью работы является усовершенствование одного из этих алгоритмов и разработка собственного приложения, способного показывать лучшие результаты при тестировании и впоследствии использовании.
Среди исследованных подходов к данной задаче можно особо выделить два принципиально разных, но одинаково успешных:
- идентификация по музыкальным параметрам, таким как темп, характерные ритмические рисунки, гармонические и мелодические конструкции.
- идентификация по технологии акустических отпечатков
Первый метод, как было сказано ранее, заключается в определении ряда музыкальных параметров аудиофайла. Эти параметры подвергаются анализу, результатом которого является набор метаданных, содержащий описание ключевых параметров исследуемого контента. Операции с этими метаданными позволяют выполнять поиск содержимого цифровой фонотеки в автоматическом режиме. Для определения параметров, используемых при реализации данного метода, применяется непрерывное вейвлет-преобразование.
Второй метод, именуемый технологией акустических отпечатков, был разработан и запатентован компанией Relatable, которая утверждает, что поиск по уникальным для аудиофайла акустическим характеристикам является очень эффективным. Совокупность этих характеристик не меняется при перекодировании в другой формат или при изменении частоты. Таким образом, системы, основанные на данной технологии способны опознать искомую композицию независимо от формата.
Большинство существующих систем идентификации аудиоконтента основаны все-таки на втором методе – технологии акустических отпечатков. Наиболее известные из них: TrackID и Shazam, работающие по одинаковому принципу: для идентификации музыкального трека пользователь запускает программу — она записывает отрывок (от 10 до 12 секунд) музыкального произведения с помощью встроенного в телефон микрофона в формате AMR и отсылает на сервер, где он анализируется сравнивается с образцами, существующими в базе данных, и через несколько секунд, в случае успешного сравнения, на экране высвечивается требуемая информация о песне: Исполнитель, Название, Альбом, Жанр, Студия, YouTube Видео, Стихи.
В данной работе будет использоваться алгоритм, основанный на методе идентификации по музыкальным параметрам. В дальнейшем анализу подвергнется такой тип данных как MP3 на предмет возможности получения из него АЧХ объекта. Амплитудно-частотная характеристика является основополагающей для реализации выбранной методики. Поэтому будут проанализированы характеристики, нужные для ее построения. Она будет анализироваться не полностью, а лишь по срезу. Анализу будут подвергаться расстояния между пиками, соответствующими максимальным всплескам амплитуды. То есть сравнение исследуемого и хранимого в базе данных аудиофайлов будет проводиться по их ритму. Также следует учесть факторы, которые могут повлиять на точность сравнения образцов: такие, как шумы, изменение частоты. Для увеличения точности идентификации необходимо ввести погрешности для результатов сравнения.
Для последующего решения ставятся следующие задачи:
1. Математическое представление и алгоритм процедуры идентификации аудиоконтента.
2. Выбор среды программирования и создание в ней приложения, идентифицирующего аудиоконтент по разработанному алгоритму.
3. Анализ разработанного приложения, его тестирование при различных входных данных.
Список использованной литературы:
1. Фадеев А.С.Идентификация музыкальных объектов на основе непрерывного вейвлет-преобразования. Томск: «Кибернетический центр» ТПУ, 2008. – с. 6-8
2. Асмаков С. Идентификация звука: миссия выполнима.// Компьютер Пресс – 2010 – №10:
http://www.compress.ru/article.aspx?id=21709&iid=991
3. Андреев Г. Напевы Рабиновича.//КомпьюТерра – 2001 – №17 :
http://www.kinnet.ru/cterra/394/index.html