Исследование частотности фонетического явления nasal plosion в современном английском языке с применением искусственного интеллекта - Студенческий научный форум

XVIII Международная студенческая научная конференция Студенческий научный форум - 2026

Исследование частотности фонетического явления nasal plosion в современном английском языке с применением искусственного интеллекта

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Актуальность: Nasal plosion - важный элемент фонетики английского языка, отражающий принцип речевой экономии. Несмотря на высокое качество современных нейросетевых синтезаторов, их способность точно воспроизводить данное явление изучена недостаточно. Сравнительный анализ реализации nasal plosion в речи людей и нейросетей необходим для оценки фонетической естественности синтезированных голосов и выявления существующих недостатков.

Nasal plosion (носовой взрыв) — это фонетическое явление в английском языке, возникающее при коартикуляции взрывных согласных /p/, /b/, /t/, /d/, /k/, /g/ с последующими носовыми сонорными /n/, /m/. В процессе артикуляции мягкое нёбо опускается, в результате чего воздушный поток направляется через носовую полость, а смычный согласный реализуется без характерного взрыва, образуя носовой сонорант. Примеры данного явления: kitten [ˈkɪtn̩], button [ˈbʌtn̩], hidden [ˈhɪdn̩], garden [ˈgɑːdn̩].

Исследование проводилось в два этапа:

1. Анализ естественной речи: для определения реальной частотности nasal plosion, для каждого словосочетания была проанализирована спонтанная речь 10 носителей британского варианта английского языка с помощью платформы Youglish. Исследовались следующие фонетические контексты и лексические единицы: Контекст /tn/: power button, kitten, certain person, Great Britain, brighten up;

Контекст /dn/: small garden, all of a sudden, hidden behind, wooden box, heavy burden.

2. Анализ синтезированной речи: для каждой из двух TTS-моделей (NaturalReader и LoveVoiceAi) были сгенерированы речевые образцы, содержащие те же лексические единицы, с использованием пяти различных голосов (мужских и женских) с настройкой на британский произносительный стандарт. Полученные аудиофайлы анализировались по той же методике.

Результаты исследования представлены в таблице 1.

Словосочетание

Носители языка

ИИ

Small garden

40%

30%

Power button

90%

40%

All of sudden

70%

50%

Kitten

50%

10%

Hidden behind

60%

40%

Certain person

80%

10%

Great Britain

60%

40%

Wooden box

80%

70%

Brighten up

70%

10%

Heavy burden

50%

20%

Общий итог

65%

32%

Таблица 1.

1. Первичный анализ словосочетаний «small garden» (/dn/) и «power button» (/tn/) выявил значительный дисбаланс у носителей языка: nasal plosion был реализован в 40% случаев контекста /dn/ и 90% случаев /tn/. Для проверки возможной гипотезы корпус был расширен дополнительными единицами. Расширенный анализ показал, что разница между контекстами оказалась минимальной: средний показатель для /dn/ составил 60%, для /tn/ - 70%. Гипотеза о более последовательной реализации явления в контексте /tn/ не подтвердилась. Частотность nasal plosion демонстрирует высокую вариативность и зависит от конкретной лексемы, устойчивости словосочетания и индивидуальных особенностей говорящего. Общий средний показатель для всех исследуемых единиц - 65%.

2. Анализ синтезированной речи показал, что NaturalReader реализует nasal plosion в среднем в 28% случаев (/tn/ - 20%, /dn/ - 36%), что значительно уступает естественной речи. LoveVoiceAI показал более низкий результат - 18% (/tn/ - 8%, /dn/ - 28%).

По проведенному исследованию «Исследование частотности фонетического явления nasal plosion в современном английском языке с применением искусственного интеллекта» были сделаны следующие выводы:

- Анализ показал отсутствие строгого правила в реализации nasal plosion. Носители британского английского демонстрируют высокую вариативность. Общий средний показатель реализации составляет 65%. Nasal plosion представляет собой гибкую речевую привычку, а не обязательную норму.

- Современные TTS-модели демонстрируют значительное отставание от естественной речи. NaturalReader и LoveVoiceAI в среднем реализуют явление в 2–3 раза ниже показателей носителей языка. Это свидетельствует о недостаточной фонетической естественности синтезированной речи.

- Дальнейшее совершенствование алгоритмов позволит сократить разрыв между синтезированной и естественной речью. Текущие модели требуют доработки для достижения полной фонетической естественности.

Список источников:

1. Фонетика английского языка : введение : учебно-методическое пособие по дисциплине «Практическая фонетика английского языка» для 1 курса фак. иностр. яз. : доп. УМО вузов РФ / С. П. Хорошилова, Т. Л. Бородина ; Новосиб. гос. пед. ун-т. — 2-е изд., перераб. и доп. — Новосибирск : НГПУ, 2014. — 146 с. — URL: https://lib.nspu.ru/views/library/60858/read.php (дата обращения: 08.11.2025).

2. Youglish URL: https://youglish.com/ (дата обращения: 08.11.2025).

3. NaturalReaders URL: https://www.naturalreaders.com/ (датаобращения: 10.11.2025).

4. LoveVoiceAI URL: https://lovevoiceai.com/ (дата обращения: 10.11.2025).

5. Roach, P. English Phonetics and Phonology: A Practical Course / P. Roach. — 4th ed. — Cambridge : Cambridge University Press, 2009. — 46 p.

Просмотров работы: 0