Современный британский английский демонстрирует значительную фонетическую вариативность, одной из ярких особенностей которой является yod coalescence. В последние годы активно развивается синтез речи с помощью нейросетевых моделей (Luvoice, Poppop, Speechgen), однако малоизучено, насколько эти модели воспроизводят фонетические особенности, характерные для носителей языка. Анализ коалесценции в синтезированной речи позволяет оценить фонетическую естественность нейросетевых голосов и выявить расхождения с произношением реальных носителей.
Yod coalescence (йод-коалесценция) — это фонетическое явление в английском языке, при котором последовательность альвеолярного смычного или фрикативного согласного /t/, /d/, /s/, /z/ перед палатальным согласным /j/ сливается в один аффрикат или шипящий звук [1].
Диалектные и возрастные различия (согласно исследованию Риз-Уайт, 2021) [4]: Диалектная принадлежность является ключевым фактором. YC наиболее характерен для Estuary English (EE), в то время как в Received Pronunciation (RP) он не рекомендуется. Возраст является значимым фактором: говорящие в возрасте до 49 лет используют YC значительно чаще, чем говорящие старше 70 лет.
В исследовании были использованы следующие нейросетевые модели: Luvoice [2], Poppop [3], Speechgen [5].
Исследование проводилось в два этапа:
Анализ естественной речи: для определения реальной частоты yod coalescence была проанализирована спонтанная речь 10 носителей британского английского с помощью платформы Youglish. Исследовались слова: duty, due, tube, Tuesday, tutor, duke.
Анализ синтезированной речи: были выбраны три общедоступные нейросетевые TTS-модели с поддержкой британского английского: Luvoice, Poppop, Speechgen. Этим моделям на вход подавались предложения, содержащие исследуемые слова, после чего аудиовывод анализировался на наличие или отсутствие коалесценции.
Результаты исследовани:
Феномен YC подтвержден в естественной речи, его распространенность варьируется в зависимости от слова. В данной выборке коалесценсия с переходом на звук /tʃ/ встречается почти в 1.7 раза чаще, чем с переходом на /dʒ/. Наиболее устойчивые случаи YC в выборке: Tuesday и tutor (по 80%). Общий средний показатель YC для всех шести исследуемых слов составляет ≈53.3%.
Speechgen проявил себя как наиболее продвинутая модель, применив коалесценцию в 50% случаях (tutor, due, Duke), что свидетельствует о лучшей адаптации к естественным фонетическим паттернам. Poppop продемонстрировал меньшую склонность к применению данного явления, реализовав его лишь в одном слове (tube). В то время как нейросеть Luvoice ни в одном слове не реализовала фонетическое явление.
По проведенному исследованию «Фонетическое явление yod coalescence в современном английском языке на примере произношения носителей британского варианта английского языка и нейросетевых моделей» были сделаны следующие выводы:
Yod coalescence представляет собой процесс слияния альвеолярных смычных или фрикативных согласных /t, d, s, z/ с палатальным согласным /j/ в постальвеолярные звуки ([tʃ], [dʒ], [ʃ], [ʒ]) в результате палатализации и ассимиляции.
Употребление Yod Coalescence в британском английском вариативно в зависимости от диалектных и возрастных факторов, демонстрируя наибольшую распространённость среди носителей Estuary English и молодых возрастных групп (до 49 лет).
TTS-модель Speechgen реализует фонетическое правило yod coalescence в половине соответствующих контекстов, в то время как модели Poppop и Luvoice демонстрируют значительно более низкие показатели (~16.7% и 0% соответственно), что снижает естественность синтезированной речи.
Текущие модели синтеза речи недостаточно передают живую фонетическую вариативность, что требует доработки алгоритмов для достижения полной фонетической естественности.
Список источников:
Linking [j] [w], дифтонгоиды [ɪj] [ʉw], Yod-dropping, Yod-coalescence // rutube URL: https://rutube.ru/video/5ad2a5843df729419e9a3e6983cede39/?utm_source=embed&utm_medium=referral&utm_campaign=title&utm_content=5ad2a5843df729419e9a3e6983cede39&utm_term=yastatic.net&t=1 (дата обращения: 07.11.2025).
Luvoice URL: https://luvvoice.com/ (дата обращения: 10.11.2025).
Poppop.ai URL: https://poppop.ai/ (дата обращения: 10.11.2025).
Rees-White, J. R. It’s /tʃuzdeɪ/, Innit?: Yod Coalescence in British English. : дис. Bachelor of Arts Linguistics наук: South Carolina, 2021. - 54 с.
Speechgen.io URL: https://speechgen.io/ (дата обращения: 10.11.2025).
Фонетика английского языка : введение : учебно-методическое пособие по дисциплине "Практическая фонетика английского языка" для 1 курса фак. иностр. яз. : доп. УМО вузов РФ / С. П. Хорошилова, Т. Л. Бородина ; Новосиб. гос. пед. ун-т. - 2-е изд., перераб. и доп. - Новосибирск : НГПУ, 2014. - 146 с. - Библиогр.: с. 143. - URL: https://lib.nspu.ru/views/library/60858/read.php (дата обращения: 07.11.2025) . - Подготовлено и издано в рамках реализации Программы стратегического развития ФГБОУ ВПО "НГПУ" на 2012-2016 гг. - Доступна эл. версия в ЭБС НГПУ. - ISBN 978-5-00023-649-9