Доброго времени суток.
В вашей статье вы написали, что точность программ общего профиля при распознавании речи, составляет 80% в отличии от человеческой, приближающейся к 100%. Почему, на Ваш взгляд нет возможности увеличить точность, за счет подавления внешних шумов и более точной обработке информации при их отсутствии? Программе, работающей по верному алгоритму должно быть безразлично говорю я слово с веселым или грустным настроением, разве это не так?
Спасибо большое за статью.
Здравствуйте.
Дело в том, что алгоритмы фильтрации сигнала и подавления шумов уже используются при предобработке звукового сигнала. И их совершенствование не сможет дать сильного прироста точности, т.к. мелкие шумы очень хорошо фильтруются и текущими алгоритмами, а сильные шумы так сильно искажают полезный сигнал, что даже человеку часто не под силу понять его (представьте себе например разговор людей рядом со строительной площадкой).
Отвечая на второй вопрос, не понял что вы имеете ввиду под "п
Здравствуйте. Скажите, а есть ли системы распознавания речи, в основе которых лежит простой классификатор слов, обучить которые можно на наборе слов, каждое из которых повторяется с разной скоростью говорения, акцентом, интонацией и т.д., при этом исключив одинаково произносимые слов?
Спасибо.
Здравствуйте.
Если я правильно понял, то имеется ввиду система в которой хранятся экзэмпляры или признаки всех слов, а затем производится сравнение с ними? Если да, то так были устроены одни из самых первых систем распознавания речи.
Рад, что смог заинтересовать вас данной тематикой!
Ответить
Обсуждение работ закрыто!
Ответить
Обсуждение работ закрыто!
Ответить
Обсуждение работ закрыто!
Ответить
Обсуждение работ закрыто!