Актуальность: Nasal plosion - важный элемент фонетики английского языка, отражающий принцип речевой экономии. Несмотря на высокое качество современных нейросетевых синтезаторов, их способность точно воспроизводить данное явление изучена недостаточно. Сравнительный анализ реализации nasal plosion в речи людей и нейросетей необходим для оценки фонетической естественности синтезированных голосов и выявления существующих недостатков.
Nasal plosion (носовой взрыв) — это фонетическое явление в английском языке, возникающее при коартикуляции взрывных согласных /p/, /b/, /t/, /d/, /k/, /g/ с последующими носовыми сонорными /n/, /m/. В процессе артикуляции мягкое нёбо опускается, в результате чего воздушный поток направляется через носовую полость, а смычный согласный реализуется без характерного взрыва, образуя носовой сонорант. Примеры данного явления: kitten [ˈkɪtn̩], button [ˈbʌtn̩], hidden [ˈhɪdn̩], garden [ˈgɑːdn̩].
Исследование проводилось в два этапа:
1. Анализ естественной речи: для определения реальной частотности nasal plosion, для каждого словосочетания была проанализирована спонтанная речь 10 носителей британского варианта английского языка с помощью платформы Youglish. Исследовались следующие фонетические контексты и лексические единицы: Контекст /tn/: power button, kitten, certain person, Great Britain, brighten up;
Контекст /dn/: small garden, all of a sudden, hidden behind, wooden box, heavy burden.
2. Анализ синтезированной речи: для каждой из двух TTS-моделей (NaturalReader и LoveVoiceAi) были сгенерированы речевые образцы, содержащие те же лексические единицы, с использованием пяти различных голосов (мужских и женских) с настройкой на британский произносительный стандарт. Полученные аудиофайлы анализировались по той же методике.
Результаты исследования представлены в таблице 1.
|
Словосочетание |
Носители языка |
ИИ |
|
Small garden |
40% |
30% |
|
Power button |
90% |
40% |
|
All of sudden |
70% |
50% |
|
Kitten |
50% |
10% |
|
Hidden behind |
60% |
40% |
|
Certain person |
80% |
10% |
|
Great Britain |
60% |
40% |
|
Wooden box |
80% |
70% |
|
Brighten up |
70% |
10% |
|
Heavy burden |
50% |
20% |
|
Общий итог |
65% |
32% |
Таблица 1.
1. Первичный анализ словосочетаний «small garden» (/dn/) и «power button» (/tn/) выявил значительный дисбаланс у носителей языка: nasal plosion был реализован в 40% случаев контекста /dn/ и 90% случаев /tn/. Для проверки возможной гипотезы корпус был расширен дополнительными единицами. Расширенный анализ показал, что разница между контекстами оказалась минимальной: средний показатель для /dn/ составил 60%, для /tn/ - 70%. Гипотеза о более последовательной реализации явления в контексте /tn/ не подтвердилась. Частотность nasal plosion демонстрирует высокую вариативность и зависит от конкретной лексемы, устойчивости словосочетания и индивидуальных особенностей говорящего. Общий средний показатель для всех исследуемых единиц - 65%.
2. Анализ синтезированной речи показал, что NaturalReader реализует nasal plosion в среднем в 28% случаев (/tn/ - 20%, /dn/ - 36%), что значительно уступает естественной речи. LoveVoiceAI показал более низкий результат - 18% (/tn/ - 8%, /dn/ - 28%).
По проведенному исследованию «Исследование частотности фонетического явления nasal plosion в современном английском языке с применением искусственного интеллекта» были сделаны следующие выводы:
- Анализ показал отсутствие строгого правила в реализации nasal plosion. Носители британского английского демонстрируют высокую вариативность. Общий средний показатель реализации составляет 65%. Nasal plosion представляет собой гибкую речевую привычку, а не обязательную норму.
- Современные TTS-модели демонстрируют значительное отставание от естественной речи. NaturalReader и LoveVoiceAI в среднем реализуют явление в 2–3 раза ниже показателей носителей языка. Это свидетельствует о недостаточной фонетической естественности синтезированной речи.
- Дальнейшее совершенствование алгоритмов позволит сократить разрыв между синтезированной и естественной речью. Текущие модели требуют доработки для достижения полной фонетической естественности.
Список источников:
1. Фонетика английского языка : введение : учебно-методическое пособие по дисциплине «Практическая фонетика английского языка» для 1 курса фак. иностр. яз. : доп. УМО вузов РФ / С. П. Хорошилова, Т. Л. Бородина ; Новосиб. гос. пед. ун-т. — 2-е изд., перераб. и доп. — Новосибирск : НГПУ, 2014. — 146 с. — URL: https://lib.nspu.ru/views/library/60858/read.php (дата обращения: 08.11.2025).
2. Youglish URL: https://youglish.com/ (дата обращения: 08.11.2025).
3. NaturalReaders URL: https://www.naturalreaders.com/ (датаобращения: 10.11.2025).
4. LoveVoiceAI URL: https://lovevoiceai.com/ (дата обращения: 10.11.2025).
5. Roach, P. English Phonetics and Phonology: A Practical Course / P. Roach. — 4th ed. — Cambridge : Cambridge University Press, 2009. — 46 p.