VOCO – ПИШИ ГОЛОСОМ! - Студенческий научный форум

IX Международная студенческая научная конференция Студенческий научный форум - 2017

VOCO – ПИШИ ГОЛОСОМ!

Погорельцева Е.Е. 1, Хримучкова Д.А. 1
1Тюменский Индустриальный Университет
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
В постиндустриальном обществе невозможно представить жизнь человека без информационных систем. Они проникают во все сферы деятельности людей: медицина, образование, экономика, бизнес. И даже такая сфера как искусство, в которой, казалось бы, нет места информационным системам, не стоит на месте. Появляются новые течения в музыке, киноиндустрии, театральных постановках, связанные с использованием компьютерной техники, графических программ. 3D фильмы, электронно-музыкальные жанры, такие, как DuBStep, Electro, Newbeat, электронные билеты в театр не предел. Существует несколько способов, при помощи которых технологии влияют на культурные процессы: учреждения культуры создают свои сайты в Интернете; многие художники перешли на графические планшеты, которые применяются для создания изображений на компьютере; создается огромное множество программ для звукозаписи и её редактирования .

В октябре 2016 года на конференции Adobe Max Creativity состоялся анонс программы « Photoshopping Voiceovers» и его возможностей. Создателем умной системы является известный инженер Adobe Цзэ-ю Цзинь (Zeyu Jin). "Photoshopping Voiceovers" или #VoCo – это аудиоредактор, который способен после 20-ти минутного изучения речи не только менять местами слова на звуковой дорожке, но и добавлять фразы и предложения, которых изначально там не было. И даже новые слова будут «произноситься» голосом того человека, чья запись редактируется. Говоря простым языком, VoCo разбивает речь на отдельные фонемы, из которых можно составить звуки, слова и целые предложения. Фонемой называется языковая единица, представленная рядом позиционно чередующихся звуков и служащая для отождествления и различения слов и морфем. VoCo так же называют «голосовым Photoshop». Его возможности в основном ориентированы на создателей подкастов, представителей киноиндустрии и на другие сферы деятельности, где нужно быстро подправить аудиодорожку, без перезаписи реплик.

Photoshopping Voiceovers отличается от своих предшественников рядом новых функций, присущих только ему:

  1. При распознавании аудиофайлов VoCo автоматически расставляет знаки препинания.

  2. Позволяет нам осуществлять распознавание речи из аудиозаписей.

  3. Количество тематических словарей в программе постоянно пополняется.

  4. VoCo включает базовый словарь с общим объемом около 85 тысяч слов. С ним легко можно найти общий язык на любую тему.

  5. Photoshopping Voiceovers может работать при отсутствии сети Интернет.

Однако Photoshopping Voiceovers находится на стадии доработки. Разработчики считают, что в руках мошенников подобная информационная система может представлять собой опасное оружие. Цзинь признался, что уже думали о внедрении в подобное аудио цифровых водяных знаков. По его словам, людям сложно различить настоящий голос и скомпонованную подделку, поэтому в компании подходят к вопросу со всей серьезностью и думают над тем, как сделать различия легко обнаружимыми.

В заключение можно сказать, что программа Photoshopping Voiceovers является несомненным достижением в области звукозаписи. VoCo упрощает работу звукооператоров и позволяет быстро изменить содержание звукозаписи без особых усилий. Все же разработчикам нужно подумать над тем, как не допустить использования Photoshopping Voiceovers в негативных целях.

Литература:

  1. https://blogs.adobe.com/conversations/2016/11/lets-get-experimental-behind-the-adobe-max-sneaks.html

  2. https://xakep.ru/2016/11/07/adobe-project-voco/

  3. http://www.speechpro.ru/product/rechevye-produkty/voco

Просмотров работы: 727