Проверим данное утверждение, если у вас в коллективе хотя бы 23 человека, вероятность того, что у кого-то из них дни рождения совпадут, превышает 50%.
Сразу отметим, что рождения в определенные дни являются совместными, независимыми и равновероятными.
Введём обозначения:
n = 365 (високосный год тоже опускаем).
k — количество участников. Считаем , иначе тройное совпадение случится с вероятностью 1.
А — событие, состоящее в том, что в группе имеются три или более человека с одним и тем же днём рождения.
B = — событие, состоящее в том, что никакие три участника не имеют одинаковый день рождения.
Событие B будет выполнено тогда и только тогда, когда на некоторое количество m различных дней в году будет приходиться ровно по два участника, а на другие (k — 2m) дней будет приходиться ровно по одному человеку. Следовательно .
Обозначим — событие, состоящее в том, что на m различных дней в году приходится ровно по два участника, а на другие (k — 2m) дней — по одному.
Особенность совокупности событий {, m=0, ..., []} в том, что они несовместны и B = … B[].
Это даёт нам возможность вычислить вероятность события B через вероятности событий : P(B) = P() + P() + … + P(B[]).
Найдем вероятности событий .
Равновероятными элементарными исходами (событиями) будут являться наборы пар: {(i, ); i=1, ..., k}, каждая из которых означает, что человек номер i имеет в качестве дня рождения .
Количество всех элементарных исходов определяется, исходя из того, что у каждого участника есть n вариантов дня рождения:
Количество элементарных исходов, когда выполнено событие считается несколько сложнее:
Здесь мы сначала определяем количество способов, которыми могут быть выбраны m дней для двойных совпадений. Затем из оставшихся дней выбираем k — 2m, на которые приходится по одному человеку. В выбранные дни участники могут разместиться k! / 2m способами. Делим на 2m, так как нам не важен порядок внутри пар, которые имеют общий день рождения.
Поэтому:
P(Bm) = NBm/N = Cnm Cn-mk-2m k! / (2mnk).P(B) = k! (Cn0 Cn-0k-0 / 20 + Cn1 Cn-1k-2 / 21 + .. + Cnm Cn-mk-2m / 2m + .. + Cn[k/2] Cn-[k/2]k-2[k/2] / 2[k/2]) / nk .
Искомая вероятность будет равна:
P(A) = 1 — P(B) = 1 — k! (Cn0 Cn-0k-0 / 20 + Cn1 Cn-1k-2 / 21 + … + Cnm Cn-mk-2m / 2m + … + + Cn[k/2] Cn-[k/2]k-2[k/2] / 2[k/2]) / nk .
Программа на Java выдает следующие значения этой вероятности в зависимости от k:
k |
P(A) |
2 |
0 |
3 |
7.506E-6 |
5 |
7.475E-5 |
10 |
8.877E-4 |
20 |
0.00824 |
40 |
0.0669 |
60 |
0.207 |
70 |
0.306 |
80 |
0.418 |
87 |
0.499 |
88 |
0.511 |
100 |
0.646 |
110 |
0.746 |
120 |
0.828 |
150 |
0.965 |
200 |
0.999512 |
250 |
0.999999460 |
Итак, нужно как минимум 88 человек, чтобы вероятность тройного совпадения превышала 1/2.
Рассматриваемый парадокс дней рождения был представлен для одного «типа» людей. Можно обобщить задачу, введя несколько «типов», например, разделив людей на мужчин (m) и женщин (n). Подсчитаем вероятность того, что хотя бы у одной женщины и у одного мужчины совпадают дни рождения (совпадение дней рождения у двух женщин или у двух мужчин не учитываются):
p 0 = 1 − 1 d m + n ∑ i = 1 m ∑ j = 1 n S 2 ( m , i ) S 2 ( n , j ) ∏ k = 0 i + j − 1 ( d − k ) , где d = 365 и S2 — числа Стирлинга второго рода.
Интересно, что нет однозначного ответа на вопрос о величине n+m для заданной вероятности. Например, вероятность 0,5 даёт как набор из 16 мужчин и 16 женщин, так и набор из 43 мужчин и 6 женщин.
Другое обобщение парадокса дней рождения состоит в постановке задачи о том, сколько требуется человек для того, чтобы вероятность наличия в группе людей, дни рождения которых различаются не более чем на один день (или на два, три дня и так далее), превысила 50 %. При решении этой задачи используется принцип включения-исключения. Результат (опять-таки в предположении, что дни рождения распределены равномерно) получается следующим:
Максимальное различие дней рождения
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
23 |
14 |
11 |
9 |
8 |
8 |
7 |
7 |
Необходимое количество людей
Таким образом, вероятность того, что даже в группе из 7 человек дни рождения хотя бы у двух из них будут различаться не более чем на неделю, превышает 50 %.
Собственно, это и парадоксом назвать сложно, поскольку математический расчёт вероятности это неоспоримо доказывает. Но большинству людей трудно поверить в то, что группы из 23 людей достаточно для того, чтобы дни рождения у её участников совпали в половине случаев.
Литература:
Секей Г. Парадоксы в теории вероятностей и математической статистике. — М. – 2016. – 543с..
Ширяев А. Н. Вероятность-1. — МЦНМО. - 2017. — ISBN 978-5-94057-036-3.
Архангельская В.Д., Егорова Е.Г., Матвеева Т.А., Светличная В.Б., Зотова С.А. ПРИМЕНЕНИЕ ФОРМУЛЫ ПОЛНОЙ ВЕРОЯТНОСТИ К РЕШЕНИЮ ПРАКТИЧЕКСКИХ ЗАДАЧ // Материалы VIII Международной студенческой электронной научной конференции «Студенческий научный форум» URL: http://www.scienceforum.ru/2016/1762/22673
Мальцева А.И., Пискунова А.А., Матвеева Т.А., Зотова С.А., Светличная В.Б. ОПРЕДЕЛЕНИЕ ЧАСТОТЫ ПОЯВЛЕНИЯ ОПРЕДЕЛЕННОГО ПРИЗНАКА С ПОМОЩЬЮ ИНТЕРВАЛЬНОГО ВАРИАЦИОННОГО РЯДА // Материалы VIII Международной студенческой электронной научной конференции «Студенческий научный форум» URL: http://www.scienceforum.ru/2016/1762/22924