ПРИМЕНЕНИЕ МЕТОДОВ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ И ТЕОРИИ ВЕРОЯТНОСТЕЙ В ЗАДАЧАХ МАТЕМАТИЧЕСКОЙ ЛИНГВИСТИКИ - Студенческий научный форум

VI Международная студенческая научная конференция Студенческий научный форум - 2014

ПРИМЕНЕНИЕ МЕТОДОВ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ И ТЕОРИИ ВЕРОЯТНОСТЕЙ В ЗАДАЧАХ МАТЕМАТИЧЕСКОЙ ЛИНГВИСТИКИ

Амантаева А.С. 1
1Государственный университет имени Шакарима города Семей, Семей, Казахстан
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Математическая лингвистика - математическая дисциплина, разрабатывающая формальный аппарат для описания строения естественных и некоторых искусственных языков. Первый человек, который изобразил синтаксис с помощью математики – английский ученый У. Сепир. Его книга под названием «Язык» вышла в 1921 году. В этой книге автор говорит: «Язык – качества свойственно только человеку, с помощью, которой он передает все чувства, мысли, и свой инстинкт». Также в этой сфере никак нельзя оставить без внимания труды кандидата физико-математических наук, доктора филологических наук, профессора К.Бектаева «Частотный словарь романа М.О.Ауэзова «Путь Абая» (в соавт. 1979), «Математические методы в языкознании» (1973-1974), «Краткий казахско-русский словарь» (1991) «Математическая лингвистика» (1977), «Большой казахско-русский словарь» (1995).

Целью моей работы является выявление и изучение статистических закономерностей стиля трех равных текстов (по 62 слов в каждом) казахского поэта Мукагали Макатаева (1931-1976) «Маған ыстық», русского поэта Сергей Николаевич Тургенева(1793—1834) «Что тебя я не люблю» и английского поэта William Blake (1757 -1827) « Love’s Secret » согласно звуковым характеристикам языка – ударению, сложности восприятия и темпу речи.

В первую очередь проведем анализ всех стихотворений.

Построим дискретный вариационный ряд.

МАҒАН ЫСТЫҚ

Жылуы жалыннан да өтімдірек,Көңілімді керген сайын бекіндіред.Шығарып махаббаттың асқарына Шыңдайды, сүюімді жетілдіред.

Қайғырса, қам көңілі қыстан жаман, Қуанса, лебі оттай алаулаған. Көңілімнің сүйетіні жалғыз-ақ жан, Кедір-бұдыр кейпі оның ыстық маған.

Көңілсіз кейде оның томсарғаны,Құдіретті көңілге ой салғаны.Еркелеп, шалқығаны кейде күліп,Мен үшін келер бақыт, бір зор үміт.

Жүрегімнің жұбайы - жалғыз-ақ жан, Ол маған оттан да ыстық лаулаған.

Вариационные ряды длин словоупотребления в фонемах:

5 8 2 9

9 6 5 10

7 11 8

8 7 10

8 3 6 6 5

6 4 5 9

10 8 8 3

5 5 5 4 5 5

8 5 4 10

9 7 2 7

7 9 5 5

3 4 5 5 3 3 4

10 6 8 3

2 5 5 2 5 8

Порядок следования чисел здесь повторяет порядок следования слов в стихотворении построчно. Теперь я построю дискретный вариационный ряд длины словоформ в фонемах в данном стихотворении:

Xi

2

3

4

5

6

7

8

9

10

11

Ni

4

6

5

17

5

5

9

5

5

1

N = 62 (так как текст состоит из 62 слов, как было указано выше)

Теперь вместо абсолютных частот укажу относительные частоты (частности) в процентах:

Xi

2

3

4

5

6

7

8

9

10

11

fi(%)

6,45

9.67

8.06

27.41

8.06

8.06

14.51

8.06

8.06

1.61

Самые распространённые слова в данном стихотворении имеют длину в 5 фонем(27,41%).

Теперь продедем анализ для «Что тебя я не люблю».

Что тебя я не люблю

Что тебя я не люблю -День и ночь себе твержу.Что не любишь ты меня -С тихой грустью вижу я.

Что же я ищу с тоской,Не любим ли кто тобой?Отчего по целым днямПредаюсь забытым снам?

Твой ли голос прозвенит -Сердце вспыхнет и дрожит.Ты близка ли - я томлюсьИ встречать тебя боюсь,

И боюсь и привлечен...Неужели я влюблен?..

Вариационные ряды длин словоупотребления в фонемах:

3 4 1 2 5

4 1 4 4 6

3 2 6 2 4

1 5 7 4 1

3 2 1 3 1 6

2 5 2 3 5

  1. 2 5 4

8 7 4

4 2 5 9

6 8 1 6

2 6 2 1 7

1 9 4 5

1 5 1 9

7 1 7

Дискретный вариационный ряд длины словоформ в фонемах в данном стихотворении будет таков:

Xi

1

2

3

4

5

6

7

8

9

Ni

12

10

5

10

8

7

5

2

3

N =62

В процентах:

Xi

1

2

3

4

5

6

7

8

9

fi(%)

19,35

16,12

8,06

16,12

12,90

11,29

8,06

3,22

4,83

Самые распространённые слова в данном стихотворении имеют длину в 1 фонем, то есть 19,35%.

« Love’s Secret »

Love’s Secret

Never seek to tell thy love,Love that never told can be;For the gentle wind does moveSilently, invisibly.I told my love, I told my love,I told her all my heart;Trembling, cold, in ghastly fears,Ah! she did depart!Soon as she was gone from me,A traveler came by,Silently, invisiblyHe took her with a sigh.

Вариационные ряды длин словоупотребления в фонемах:

4 3 2 3 3 3

3 3 4 4 3 2

2 2 6 4 3 3

9 9

2 4 3 3 2 4 3 3

2 4 2 2 3 3

6 5 2 6 4

2 2 3 5

3 2 2 3 3 4 2

1 6 3 3

9 9

2 4 2 3 1 3

Дискретный вариационный ряд длины словоформ в фонемах в данном стихотворении будет таков:

Xi

1

2

3

4

5

6

9

Ni

2

17

23

10

2

4

4

N =62

Xi

1

2

3

4

5

6

9

fi(%)

3.22

27.41

37.09

16.12

3.22

6.45

6.45

Различие между длинами словоформ в рассматриваемых стихотворениях состоит в том, что у английского автора преобладают слова в три фонемы (37,09%), у русского автора слова в один фонемы (19,35%) а у казахского поэта в пять фонемы (27,41%). Так же несложно заметить, что количество вариантов в стихотворении « Love’s Secret » значительно меньше, чем в двух остальных.

Ряды распределения дискретных случайных величин.

Для первого стихотворения:

Xi

2

3

4

5

6

7

8

9

10

11

pi

0.0645

0.0967

0.0806

0.2741

0.0806

0.0806

0.1451

0.0806

0.0806

0.0161

Для второго стихотворения:

Xi

1

2

3

4

5

6

7

8

9

pi

0,1935

0,1612

0,0806

0,1612

0,1290

0,1129

0,0806

0,0322

0,0483

Для третьего стихотворения:

Xi

1

2

3

4

5

6

9

pi

0.0322

0,2741

0,3709

0,1612

0,0322

0,0645

0.0645

где,

По определению, сумма вероятностей событий в каждом из стихотворений должна быть равна 1.

Сделаем проверку для первого стихотворения:

Для второго стихотворения:

И для третьего стихотворения:

Из данных результатов следует, что предыдущие исследования сделаны без ошибок.

Математическое ожидание дискретной случайной величины.

Для «Маған ыстық», M(X) = 5.0505

Для «Что тебя я не люблю» , M(X) = 3.9814

И для « Love’s Secret » M(X) = 3.4664

Соответственно, , из данного результата можно утверждать, что первое стихотворение сложнее для восприятия на слух, чем второе и третье, что немаловажно для анализа звучащей речи.

Дисперсия дискретной случайной величины.

этой формулой удобно позьзоваться для филологических исследований.

Дисперсия для первого стихотворения:

D(X) = 16.73695

Для второго стихотворения:

D(X) = 5,5033

Для третьего стихотворения:

D(X) = 3,381471

Энтропия дискретной случайной величины.

Для первого стихотворения:

H(x) = 3,0271... бит

Для второго стихотворения:

H(x) = 2,9856... бит

Для третьего стихотворения:

H(x) = 2,0411… бит

Из данных результатов несложно сделать вывод, что стиль и звучание «Маған ыстық» и «Что тебя я не люблю» намного сложнее стихотворения « Love’s Secret ». Они более вариативно и несколько труднее воспринимается на слух.

Вероятность появления гласных звуков в стихотворениях, сравнение.

Обозначим количество гласных звуков в первом стихотворении , во втором - и во третьем

По результатам подсчётов Yгл (1) = 156, Yгл(2) = 96, а Yгл(3) = 90 но это ещё не значит, что казахское стихотворение певучей русского и английского, для этого следует рассчитать вероятности , и по общей формуле .

,

Очевидно то, что в стихотворении Вильяма Блейка вероятность появления гласных звуков превышает соответствующую вероятность в стихотворениях М. Макатаева и С.Н.Тургенева , поэтому можно с полной уверенностью утверждать, что произведение «Love’s Secret » - певучая, плавная, спокойная.

Коэффициент темпа речи.

гдеnколичество знаменательных слов,

Р – количество подлежащих,

S – количество сказуемых,

Nколичество простых предложений,

Nколичество двусоставных предложений.

Для «Маған ыстық»:

Для второго стихотворения:

Для «Love’s Secret »:

Темп речи первого стихотворения значительно превышает соответствующий показатель в других двух, отсюда следует, что второе и третье стихотворений более спокойные, плавние.

Объединённый коэффициент синтаксической и ритмомелодической сложности.

где nколичество знаменательных слов,

T- количество безударных слогов,

l– количество строк,

N=62, как нам известно из предыдущих исследований.

Из данных подсчётов можно сделать вывод, что первое и второе стихотворений воспринимается на слух сложнее, чем стихотворение Вильяма Блейка.

Рассмотренное исследование наглядно иллюстрирует возможности методов математической статистики и теории вероятностей в задачах математической лингвистики. Чтобы понять какое нибудь стихотворение, недостаточно лишь один раз прочитать или же прослушать, для этого нужно особый взгляд и интуиция. Если все поэты возьмут все эти методы во внимание, то тогда появятся настоящие шедевры исскусства. Сравнив, «Маған ыстық» М. Макатаева, «Что тебя я не люблю» С.Н.Тургеневаи « Love’s Secret » William Blake-ка с помощью методов математической статистики и теории вероятностей, я пришла к выводу, что стили казахского и русского поэтов более разнообразный, сложный, а а стихотворение английского поэта – более плавное, спокойное, певучее, мелодичное, легко воспринимающееся на слух.

Список литературы:

  1. Тіл білімі терминдерінін түсіндірме сөздігі. А.: "Сөздік-Словарь", 2005.

  2. Р.Г.Пиотровский, К.Б. Бектаев, А.А.Пиотровская, Математическая статистика. М.: «Высшая школа», 1977

  3. http://kk.wikipedia.org/wiki/ Математическая лингвистика

  4. Б.Н. Головкин . Язык и статистика. М.: «Просвещение», 1971.

  5. Қ. Бектаев, Ықтималдар теориясы және математикалық статистика. А.: «Рауан», 1991.

Просмотров работы: 2183