МАТЕМАТИЧЕСКИЙ АНАЛИЗ ПОКЕРА С ПРИМЕНЕНИЕМ КОМБИНАТОРИКИ, ТЕОРИИ ВЕРОЯТНОСТЕЙ И ТЕОРЕМЫ БАЙЕСА - Студенческий научный форум

V Международная студенческая научная конференция Студенческий научный форум - 2013

МАТЕМАТИЧЕСКИЙ АНАЛИЗ ПОКЕРА С ПРИМЕНЕНИЕМ КОМБИНАТОРИКИ, ТЕОРИИ ВЕРОЯТНОСТЕЙ И ТЕОРЕМЫ БАЙЕСА

Квашнин С.В. 1
1Нижегородский государственный архитектурно-строительный университет Нижний Новгород, Россия
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Прошу обратить Ваше внимание, что я никоим образом не рассматриваю в данной статье какие бы то ни было покерные стратегии, а хочу исключительно доказать, что даже в такой, казалось бы, на первый взгляд, игре на везение, как покер, есть свои математические элементы.

Многие считают, что покер - это игра на удачу: пришла удачная комбинация – выиграл, не пришла – проиграл. Противник сделал ставку, а у тебя ничего нет, то нужно сбрасывать. На самом же деле, если обладать небольшими познаниями в математике, в особенности в теории вероятностей, то можно максимизировать свой выигрыш, просто играя в математически правильную игру, а значит с положительным математическим ожиданием.

Для начала хотелось бы рассмотреть пример спора из реальной жизни, который произошел между двумя игроками в покер, причем оба обладали хорошими познаниями в математике:

Мне пришлось хлопнуть своего друга по плечу, чтобы он поднял голову, и в отчаянии покачал головой, указывая на $300 в фишках, лежащих по другую сторону стола. Его противник только что вскрыл J♥ J♦ 9♥ 7♦ 3♣., но так как они играли в лоуболл, я сразу заинтересовался происходящим.

"Что это было!" - спросил я у друга, когда он все-таки повернулся ко мне.

"Два красных валета. Я предложил ему $300 против $2, что он не сможет получить двух красных валетов до обмена".

"То есть, 150 против 1 ", - сказал я, стараясь, чтобы в голосе не прозвучало недоверие. - "Ты уверен в шансах?"

Он быстро прижал палец к губам, давая понять, что не стоит просвещать оппонента, который все еще возился со своим выигрышем.

"Пошли, надо поговорить", - сказал я.

Когда мы отошли от стола он начал жаловаться: "Он меня просто убивает. Вот уже две недели он у меня постоянно выигрывает на этом пари. Может, у него валет в рукаве?"

"Шансы 136,8 против 1", -сказал я ему.

"Что?" - переспросил он. Его мозг буквально закипел от напряжения. Это был математик высшего класса, и мы часто обменивались с ним покерной информацией. Но в этом случае он ошибался. - "Нет! Шансы 191 против 1. Я фаворит".

"Давай поспорим по-дружески", - предложил я. - "На сотню, что ты ошибаешься".

"Ладно, "Безумный Майк", - сказал он, подчеркивая слово "безумный". — "Ты блефуешь, но я согласен!". И он вытащил сотню из своего бумажника.

Мы пошли выпить по чашке кофе.

Он начал первым. "Существует 89 760 способов получить пару валетов", - сказал он, записывая цифры на салфетке для убедительности. "Мы выяснили это, когда составляли таблицы Распределения комбинаций. Согласен? Хорошо. Существует шесть пар-партнеров, которые образуют два валета: бубновый валет и трефовый валет, трефовый валет и пиковый валет и так далее. Одна из них и есть валет бубновый с валетом червовым. То есть одна шестая от 89 760. То есть 14 960". Он подчеркнул последний результат. "И мы разделим 2 869 685 – общее число возможных комбинаций, - на полученное число... и получим 191,8. То есть шансы 190,8 против 1, как я и сказал".

Теперь пришла моя очередь. "Ты упустил то, что лежит на поверхности. Твои расчеты правильны, когда у противника точно два валета. Но у него также может быть каре, фулл-хаус, сет или две пары, но все же в них может быть пара красных валетов. Вот самый простой способ получить верный ответ. В колоде у нас 53 карты, у тебя есть 5 карт, чтобы получить бубнового валета из 53. После этого у тебя есть четыре шанса из 52, что валет червей все еще в колоде. Один шанс из 10,6 для бубнового валета и один шанс из 13 для червового валета. Перемножив, мы получаем 137,8, то есть один против 136,8".

Он согласно кивнул головой и произнес: "Иногда человек слишком прочно привыкает думать по шаблону и допускает просто детсадовские ошибки вновь и вновь".

Данная статья, взятая из одного журнала, показывает, что человек, имея шансы на победу 136,8:1, принимает пари с шансами 150:1, тем самым, заведомо принимая решение с отрицательным математическим ожиданием.

В данной статье для простоты расчетов я буду рассматривать стандартную игру в техасский холдем с колодой на 52 карты. Вам сдается на руку 2 карты, после чего на стол выкладываются сперва 3 карты (флоп), потом 1 (терн) и после очередной торговли еще одна (ривер), последняя пятая карта.

Всего же при такой игре мы можем получить на руки 1326 возможных комбинаций из двух карт (52∙51=2652, но так как, к примеру, рука A♣K♥ равна руке К♥А♣, то данное число следует разделить на два: 2652/2=1326). При этом 2 конкретные карты образуют 1 комбинацию, непарные карты образуют 16 комбинаций, карманные пары образуют 6 комбинаций.

Таким образом, мы легко можем посчитать свои шансы получить ту или иную карманную руку. К примеру, карманную пару мы будем получать в 5,88% случаев:

, что мы её не получим и соответственно

100 - 94,12=5,88%, что получим, или же в долях 16 к 1, что мы не получим карманной пары.

Какую-то конкретную пару мы будем получать в 5,88/13=0,45% случаев или же с вероятностью 1 к 220 (6 к 1320). Как мы видим, не стоит удивляться, что пара тузов приходит столь редко.

С учетом того, что в покере масть карт не имеет значения, число стартовых рук можно еще сократить до 169 (13∙13=169), так как, например, поначалу рука 9♥6♦ абсолютно равна по силе руке 9♠6♥. Из этих 169 комбинаций парными являются 13, одномастными 78 и разномастными также 78. Число 78 является в данном случае вполне очевидным (169-13)/2=78, но оно также может быть получено путем вычисления суммы арифметической прогрессии: с тузом мы можем составить 12 комбинаций (АК, АQ, AJ и т.д.), с королем уже 11, т.к. одну комбинацию тузом мы уже учли, тогда общее число будет равным .

Ниже представлен рисунок, демонстрирующий возможные комбинации стартовых рук:

Рис.1 Возможные стартовые руки (s – одномастные, о – разномастные)

Теперь рассмотрим такой параметр игры, как шансы банка (pot odds). Шансы банка – это математическое выражение в долях (процентах), показывающее отношение возможного выигрыша банка к ставке, которую необходимо уравнять. К примеру, в банке находится 400 фишек и наш оппонент ставит 150, таким образом, мы получаем шансы банка 1 к 3,7 (мы должны доставить 150 фишек, чтобы получить банк в 550 (400 там уже находится, и плюс 150 поставил наш оппонент), то есть наши шансы 150 к 550). В процентном же выражении мы получаем: , т.е. мы должны уравнять ставку приблизительно в 27% банка, чтобы побороться за все его 100%.

Представленное выше математическое выражение поможет нам вычислять, насколько прибыльным или убыточным будет наше действие при розыгрыше той или иной руки.

Так же для расчетов нам понадобится еще такое понятие как ауты. Ауты – это те карты, которые могут улучшить нашу руку и сделать её выигрышной. В качестве примера скажем, что двустороннее стрит-дро имеет 8 аутов, флэш-дро – 9 аутов, возможность улучшиться с пары до сета – 2 аута. Теперь следует высчитать по теории вероятностей вероятность того, что нужные ауты нам придут. Для этого рассмотрим следующий пример:

Нам сдали руку 10♠J♣, вышел флоп: 5♠9♥Q♦. Посчитаем, какова наша вероятность улучшить конкретную руку до стрита (5 разномастных карт подряд). В данном случае нашу руку могут улучшить 8 карт (8♦, 8♥, 8♠, 8♣, К♦, К♥, К♠, К♣). Соответственно, по теории вероятностей мы получаем, что наша рука будет улучшаться в следующем количестве случаев:

В колоде осталось: 52 (карт в колоде) – 2 (карт в руке) – 3 (карт на столе) = 47.

Из 47 карт 8 улучшат нашу руку, а 39 нет. Значит, мы имеет шанс 8 к 39 или 1 к 4,88 на улучшение, или же . Следует отметить, что данная величина справедлива только при том, что мы увидим еще 1 карту. Впоследствии данная величина будет меняться. Допустим на терне пришла 2♠. Теперь наша вероятность будет уже иной: 38 к 8 или же 1 к 4,75, в процентах мы получим 17,39%. Тут следует учесть один важный момент, что вероятность того, что карта придет, если мы увидим и терн, и ривер ни в коем случае не равна сумме двух предыдущих вероятностей (17,02 + 17,39 = 34,41%). Правильным будет число 31,45%. Казалось бы, разница не велика, но, поверьте, на дистанции убыток при неправильных расчетах будет ощутимым. Рассмотрим, откуда взялась эта вероятность получить требующуюся нам карту, увидев при этом две карты:

Всего мы имеем способ выбрать 2 карты из оставшихся 47 карт. При наших 8 картах мы имеем такую арифметическую последовательность: 1 из 47; 2 из 47; 3 из 47 и т.д. Тогда получаем следующую вероятность:

.Таким образом, вычисляются вероятности для любого количества аутов, и, в целом, таблица вероятностей выглядит следующим образом:

Теперь, объединив представленные выше пункты, а именно шансы банка и ауты, мы можем понять, является наша игра прибыльной или нет. Для этого в покере существует такое понятие как эквити (EV от английского термина «expected value»), которое в математике называется математическим ожиданием. EV вычисляется путём суммирования произведений каждого возможного результата (выигрыша или проигрыша) на его вероятность. Поясню на примере:

Пример вычисления EV колла. У нас - К ♥10♥, а на флопе - А♥ 4 ♣2♥.

В банке 1000 фишек, и наш единственный противник идёт ва-банк на все свои 600 фишек. Мы предполагаем, что противник имеет на руках туза и сейчас у него топ пара. Позволит ли колл заработать нам фишки на дистанции?

Да. Вопрос мог бы быть сформулирован и таким образом: «Имеет ли колл положительный EV?» Давайте посчитаем EV колла. Будем исходить из того, что флэш (пять одномастных карт) мы соберём в 34,97% случаев (9 аутов).

Таким образом, в 65,03% мы проиграем, что будет стоить нам 600 фишек. В оставшихся 34,97% случаев вы выиграете 600 (ставка противника) плюс те 1000, которые уже находятся в банке, всего 1600.

Поэтому ожидание от нашего колла (в фишках) составляет:

Таким образом, коллом вы заработаете некоторое количество фишек на дистанции.

Из данного примера мы видим, что, даже имея проигрышную на данный момент руку, но при этом, принимая математически правильные решения, мы можем выигрывать на дистанции.

Но помимо EV колла существует, также фолд эквити (всегда равно 0) и EV рейза (повышения ставки противника). Рассмотрим пример для вычисления эквити рейза.

Не будем задаваться какими-то картами, просто представим, что на ривере наш соперник делает ставку размером 500 фишек в банк, составляющий 1000 фишек. Мы, блефуя, повышаем его ставку до 1700 фишек. Теперь у нас есть два варианта: либо противник нас заколлирует, и мы потеряем свои 1700 фишек, либо он сбросит, и тогда мы выиграем 1000 фишек банка плюс 500 фишек – ставка противника.

Давайте внесем следующие обозначения: колл или рейз мы будем обозначать как X, а фолд обозначим как Y. Так как соперник в любом случае выберет какое-либо из этих действий, то X+Y = 1. Таким образом, X=1-Y.

EV рейза в 1500 фишек составляет: (1500)∙(Y)+ (-1700)∙ (1-Y) = 3200∙(Y) - 1700

Таким образом, мы будем выигрывать фишки в том случае, если

3200Y-1700 > 0

3200Y >1700

Y > 0,53

В общем, если мы думаем, что соперник будет фолдить в более чем 53% случаев, то мы должны здесь делать блеф-рейз в 1700 фишек. При меньшем количестве фолдов мы будем иметь отрицательное математическое ожидание. Из представленного выше решения также видно, что чем выше величина нашего рейза, тем чаще противник должен сбрасывать, чтобы мы имели положительное EV.

Нижеприведенный график также показывает, что размер рейза должен быть не очень большим (примерно до 3 раз от первоначального банка), так как при больших значениях мы получаем довольно-таки плавную зависимость величины процента фолдов от рейза, и рейз в большое количество начальных банков становится нецелесообразным.

Рис.2 График зависимости процента фолда от величины рейза

Ниже также показан график, иллюстрирующий, смещение кривой зависимости, в зависимости от величины начальной ставки. Как видим, изменяется величина изгиба кривой, но в целом её форма остается прежней. Из графика можно сделать вывод, что при меньшей величине начальной ставки, оправдан рейз примерно до 2,5 банков (в данном конкретном примере это было бы до 2500 фишек), а при ставке величиной банк оправдан рейз уже примерно до 3,5 банков. В итоге получаем, что чем больше начальная ставка, тем больший рейз мы можем сделать, который был бы оправдан с точки зрения фолд эквити.

Рис.3 График зависимости процента фолда от величины рейза для различных первоначальных величин ставок (1 - первоначальная ставка в 20% размера банка, 2 – 50% размера банка, 3 – 100% размера банка)

В покере также можно столкнуться с теорией вероятностей умножения независимых событий: P(A∙B) = P(A)∙P(B). Эта ситуация называется раннер-раннер, т.е. когда и по терну, и по риверу должны упасть обе нужные для нас карты. К примеру, у нас на руках 10♣10♦, а у нашего соперника - 9♥9♠. На флоп выходит 10♠2♦6♥. У нас сет, но у противника есть шанс на победу, который равен:

во-первых, если придут еще две девятки, то наш оппонент соберет каре и выиграет; во-вторых, если придет сначала семерка, потом восьмерка (или наоборот), то наш оппонент соберет стрит и вновь выиграет. Рассчитаем вероятность этих событий:

1)для каре – сначала у нас 2 аута, потом 1 аут, тогда:

2)для стрита – сначала у нас 8 аутов, потом 4 аута, тогда:

Всего же имеем: P(A+ B) = P(A) + P(B) = 0,092 + 1,479 = 1,571% на победу.

Байесовские выводы и поиск информации.

Для начала давайте представим ситуацию, что мы покидаем свою квартиру, в спешке закрывая за собой дверь. Внезапно вы задаётесь вопросом: взяли ли вы с собой студенческий билет? Вы стоите на месте, думаете об этом несколько секунд, перед тем как решаете, что да — вы взяли студенческий, поскольку в 80% случаев он у вас действительно есть. Вы также определяете, что существует равный шанс, что он находится либо в правом, либо в левом кармане, а если его нет ни там, ни там, значит он остался дома. Запуская руку в правый карман, вы обнаруживаете, что там студенческого нет. Что сейчас вы должны подумать о вероятности нахождения своего студенческого в левом кармане?

С одной стороны, кажется, что ответ должен быть 40% — вы проверили в одном из своих двух карманов, и сейчас половина ваших шансов улетучилась. Может быть, вероятность по-прежнему должна составлять 80% — вы подумали, что эта вероятность существовала изначально, а вы ещё не завершили свою проверку, так что пока вы её не завершите, вероятность ниже не станет. Или, может быть, ответ лежит где-то посередине, но если так — каким же должно быть это число?

Для ответа на задачу проще всего представить, что после того, как закрылась дверь, мы могли бы оказаться в пяти различных мирах, имея 80% вероятность, что студенческий при нас и равную вероятность того, что он в одном из карманов. В двух из миров студенческий находится в левом кармане, еще в двух — в правом, и еще в одном мире, студенческий остался лежать на столе. Как только мы проверяем правый карман и не находим его там, остается только три потенциально возможных мира, в которых мы можем находиться: два, где мы найдём студенческий в левом кармане, и один, где он дома. Так получается, что в лучшем случае у нас сейчас есть шанс 2/3, что мы ушли со студенческим билетом.

Такой тип вероятностных рассуждений называется Байесовскими выводами.

Теорема Байеса (или формула Байеса) — одна из основных теорем теории вероятностей, которая позволяет определить вероятность того, что произошло какое-либо событие (гипотеза) при наличии лишь косвенных тому подтверждений (данных), которые могут быть неточны.

Формула Байеса выглядит следующим образом:

,

где

Р(А) – априорная вероятность гипотезы А;

Р(А│В) – вероятность гипотезы А при наступлении события В (апостериорная вероятность);

Р(В│А) – вероятность наступления события В при истинности гипотезы А;

Р(В) – полная вероятность наступления события В.

Формула Байеса позволяет «переставить причину и следствие»: по известному факту события вычислить вероятность того, что оно было вызвано данной причиной.

Теперь я хочу рассмотреть то, как профессиональные покерные игроки могут определять стоит ли делать 3 бет (повышать рейз соперника) на основе знаний комбинаторики и теоремы Байеса. 3 беты - важная вещь. Один из путей определения диапазона оппонента и решения, делать 3 бет или нет - это комбинаторика. Как было написано выше в холдеме всего 1326 комбинаций рук: по 6 комбинаций для каждой пары и по 16 для каждой непарной руки.

Допустим тайтовый игрок рейзит из позиции УТГ (с первой позиции) с топ 9,3% диапазона рук. Этот диапазон выглядит так (77+,ATs+,KJs+,QJs+,AJo+). Вообще говоря, не стоит 3 бетить тайта, который рейзит из УТГ. У них почти всегда будет сильная рука, но не будем углубляться. Комбинации его рук для этого диапазона выглядит так:

Премиум пары:

AA - 6

KK - 6

QQ – 6

JJ – 6

Средние пары:

TT - 6

99 - 6

88 – 6

77 – 6

Крупные непарные:

AK – 16

AQ – 16

AJ – 16

KQ – 16

Крупные одномастные:

ATs - 4

KJs – 4

QJs – 4

Всего комбинаций: 124.

Допустим, что оппонент выкинет все руки на 3 бет, кроме, конечно, (JJ+,AK). Количество таких премиум рук - 40. 40/124 - это около 32%. То есть, рейзер из УТГ выкинет 2/3 рук, с которыми он рейзил префлоп. На самом деле это довольно большая цифра.

Теперь представим, что оппонент делает префлоп рейз до 3,5 больших блайндов. Мы 3 бетим с баттона до 12бб. Мы рискуем 12бб, чтобы выиграть 5. Чтобы наш 3 бет был нулевым, нам нужно выигрывать 12бб/(12бб+5бб) = 70,5%. Считая, что наш оппонент будет коллировать только с премиум-руками и сбрасывать в 68% случаев, мы имеем отличные шансы для 3 бета, даже если тайт рейзит из УТГ.

Считая, что для того, чтобы наш 3 бет был нулевым, оппонент должен пасовать в 70,5% случаев, получаем диапазон его оупенрейза из УТГ равный 10,2%. Эта цифра получилась так: мы взяли диапазон колла 3 бета, 3%, и поделили на процент нулевого колла 3 бета, 100%-70.5%=29,5%.

. Таким образом, если оппонент рейзит 10,2% из УТГ и выкидывает все, кроме премиум-рук, вы можете 3 бетить его на любых двух картах с баттона, это будет нулевым решением.

Теперь используем теорему Байеса, написав её при этом в несколько другом виде:

,

В нашем случае:

А - как часто у вас премиум-рука, JJ+, AK

В - вы рейзите из УТГ.

Р(A|В) - то, что мы ищем. Это вероятность, что оппонент имеет премиум-руку, учитывая то, что он рейзил из УТГ.

Р(A) = 3,0% - вероятность, что оппонент имеет премиум-руку. 40 комбинаций JJ+, AK из 1326 комбинаций всего.

Р(В|A) = 100% - вероятность того, что оппонент будет рейзить из УТГ с премиум- рукой. Мы считаем, что он будет рейзить со всем диапазоном из УТГ.

Р(В|A’) = 6,5% - вероятность того, что оппонент будет рейзить не премиум-руку из УТГ.

Берем диапазон рейза из УТГ 9,3%, (9,3% - 3%)/(100%-3%)

Р(A’) = 97% вероятность того что опп имеет не премиум руку

100% - p(A)

Проведя расчеты получаем, Р(A|X) = 32%. Это значит, что премиум-руки составляют только 32% диапазона оупенрейза оппонента из УТГ. Мы получили такой же результат, как если бы мы использовали комбинаторику. И он также показывает, что рейзер будет выбрасывать огромное количество рук на агрессию.

На мой взгляд, теорема Байеса дает большую глубину проработки в отличие от простой комбинаторики.

Во-первых, мы можем использовать теорему Байеса для постройки графика зависимости диапазона колла оппонентом 3 бета от диапазона его начального рейза из УТГ.

Рис.4 график зависимости диапазона колла оппонентом 3 бета от диапазона его начального рейза из УТГ.

График наглядно показывает диапазон УТГ. Довольно очевидно, что если его диапазон опен рейза растет, значит, диапазон колла 3 бета падает. Как видно, это происходит довольно быстро. Колл 3 бета падает экспоненциально перед тем, как стать почти линейным где-то на отметке 8.5%.

Теорема Байеса тем и хороша, что диапазон на самом деле не имеет значения. Значение имеет только то, с каким процентом премиум-рук оппонент заколлирует 3 бет. Остальные руки могут быть любыми, главное то, что вы знаете процент опен рейза. Например, если он рейзит 5% рук, вы можете быстро посчитать, что премиум-руки составляют 60% его диапазона. Если он рейзит 12% рук, то премиумы будут у него только в 25% случаев.

На этом графике мы приняли, что премиум-руки, с которыми УТГ заколлит, — это (JJ+,AK). Если его диапазон будет еще тайтовее, линия сдвинется влево. На следующем графике у нас будут две линии, старая и новая, которые показывают, что было бы, если оппонент коллирует топ 2% рук, а не 3%.

Рис. 5 смещение графика при уменьшении его процента колла 3 бета.

Здесь видно, что линия смещается вниз, когда его диапазон более тайтовый, и поднимается, когда диапазон расширяется. Это действительно мощный инструмент для того, чтобы получить интуитивное чувство о диапазонах и распределении подмножеств внутри этих диапазонов. Применение этих графиков специально не буду расписывать, т.к. данная статья все же о математике, а не о стратегии игры в покер.

В конце хочется отметить гигантский вклад Джона Нэша в математику, а именно его теория игр. В покере используется чарт равновесий Нэша. На основании этого чарта игроки могут играть так, что их игра будет околонулевой. Этот чарт в основном используется игроками хэдз-ап турниров в поздних стадиях, а именно в стадии пуш-фолда (т.е. мы можем либо пойти олл-ин, либо сбросить карты). Чего некоторые люди не знают — так это того, что Равновесие Нэша, как концепция, не ограничено пуш-фолдом лишь в поздних стадиях игры. При любой глубине стеков чарт Нэша показывает то, что должны делать идеальные игроки в покер друг против друга, чтобы как минимум играть в ноль. Работа Джона Нэша, доказывающая это (хедз-ап покер — игра, которая отлично вписывается в параметры, которые он установил для доказательства своей теории для разных игр), помогла ему получить Нобелевскую Премию.

Том Дван не так давно с большой убежденностью заявил, что заключение Нэша ошибочно. Если Дван сможет доказать свою точку зрения, он, вероятно, станет первым покерным профессионалом, ставшим Нобелевским Лауреатом.

Просмотров работы: 11523