Принятие решения в условиях неопределенности – первая задача теории оптимальных решений. Для решения схожих вопросов разработаны особые математические методы, которые рассматриваются в теории игр.
В данной статье затронем и рассмотрим платежную матрицу,нижнюю и верхнюю цены игры, игру с седловой точкой и примеры матричных игр.
Игра есть математическая модель реальной конфликтной ситуации, анализ которой ведется по определенным правилам. Заинтересованные стороны игры называются игроками.
Конечная игра, в которой игрок A имеет m стратегий, а игрок B имеет n стратегий, называется игрой m на n и обозначается .Обозначим стратегии игрока A символами A1, A2, …, Am, а стратегии игрока B – B1, B2, …, Bn. Пусть игрок A выбрал стратегию Ai, а игрок B–стратегию Bj. Пара стратегий Ai и Bj(i=1, 2, …, m;j=1, 2, …, n) однозначно определит исход игры, а именно–выигрыш aij игрока A и проигрыш (-aij) игрока B. Причем число aijможет быть как положительным, так и отрицательным. Матрица P=(aij), называется платежной матрицей или матрицей игры. Строки платежной матрицы соответствуют стратегиям игрока A, а столбцы – стратегиям игрока B. Такие стратегии называют чистыми стратегиями. Матрица игры представлена в таблице 1.
Таблица 1
Матрица игры
… |
||||
… |
||||
… |
||||
… |
… |
… |
… |
… |
… |
Приведем пример простейшей задачи. Игрок А выбирает одну из сторон монеты, второй игрок В, не зная выбора первого игрока, так же выбирает сторону монеты. После того как выбор сделан, игрок А платит игроку В двеусловные единицы, если стороны совпали, и получает двеусловныеединицы в противоположном случае. Таким образом, можем представить данную задачу в виде матрицы игры (таблица 2).
Таблица 2
Пример матрицы игры
Стратегии игроков |
В1 – «орёл» |
В2- «решка» |
А1 – «орёл» |
-2 |
2 |
А2- «решка» |
2 |
-2 |
И в виде матрицы:
Р= |
-2 |
2 |
2 |
-2 |
Пусть задана игра с матрицей P=(aij), из которой мы выбираем наилучшую из стратегий A1, A2, …, Am..Если игрок A выбрал стратегию Ai, то он должен рассчитывать, что игрок B ответит на нее той из стратегий Bj, при которой выигрыш игрока A будет минимален.
Обозначим через наименьший из возможных выигрышей игрока A, если он выбрал стратегию Ai, то есть .Пусть . Число называют нижней ценой игры или максимальным выигрышем (максимином). Следовательно, является гарантированным выигрышем игрока A для любой стратегии игрока B. Обобщая формулы можно окончательно записать, что . Стратегия, соответствующая максимину, называется максиминной стратегией.
Аналогично, пусть , а .Число называют верхней ценой игры или минимаксным выигрышем (минимаксом). Гарантированным проигрышем игрока B является минимакс. Стратегию, соответствующую минимаксу называют минимаксной стратегией. Принципом минимакса называют принцип, заставляющий игроков выбирать минимаксную и максиминную стратегию. Этот принцип вытекает из предположения, что каждый участник игры стремится к цели, противоположной цели противника.
Если ,то число называют чистой ценой игры или просто ценой игры. Элемент матрицы, соответствующий , называют седловой точкой матрицы.Игру, в которой ,называют игрой с седловой точкой. Седловой точку соответствует пара минимаксных стратегий. Минимаксные стратегии,которые соответствуют цене игры, являются оптимальными стратегиями, а их совокупность – оптимальным решением или решением игры.
Свойство оптимального решения:если одна сторона придерживается своей оптимальной стратегии, а вторая отклоняется от своей стратегии, то для стороны, допустившей отклонение, это никогда не может быть выгодно.
Рассмотрим пример игры с седловой точкой.
Найти верхнюю и нижнюю цену игры с платёжной матрицей:
3 |
2 |
1 |
4 |
10 |
4 |
3 |
10 |
-2 |
4 |
1 |
2 |
Решение. В каждой строке платежной матрицы мы найдем наименьший элемент и запишем его справа от матрицы. В каждом столбце найдем наибольший элемент и запишем его внизу от матрицы:
3 |
2 |
1 |
4 |
1 |
10 |
4 |
3 |
10 |
3 |
-2 |
4 |
1 |
2 |
-2 |
10 |
4 |
3 |
10 |
Таким образом,
- нижняя цена игры: α=max{1,3,-2}=3;
- верхняя цена игры: β=min{10,4,3,10}=3;
- α=β= = 3.
Класс игр, имеющих седловую точку, дает интерес как с теоретической, так и с фактической точки зрения.
В теории игр доказывается, что, в частности, любая игра с полной информацией имеет седловую точку, и, следовательно, любая такая игра имеет заключение, т.е. есть пара хороших стратегий той и другой стороны, дающая средний выигрыш, равный цене игры. Если игра с полной информацией состоит лишь из личных ходов, то при использовании каждой стороной своей оптимальной стратегии она обязана постоянно заканчиваться вполне конкретным исходом, а именно, выигрышем в точности равным цене игры.
Могут встречаться и случаи, когда платежная матрица имеет несколько седловых точек, однако это никак не изменит характера рекомендуемых решений, поскольку все ситуации равновесия имеют одну и ту же цену и, следовательно, эквиваленты.
Теория матричных игр позволяет нам рассматривать и с легкостью решать задачи принятия решений в ситуациях с несколькими участниками, когда значение целевой функции для каждого зависит также и от решений, принимаемых остальными участниками. Поэтому важная роль в матричных играх отводится применению задач матричных игр на практике. В экономике игроки - это предприятия-производители, торговые компании, банки и другие организации. Рассмотрим матричную игру на примере швейного предприятия.
Швейное предприятие реализуется свою продукцию через магазин. Сбыт зависит от состояния погоды. В условиях теплой погоды предприятие реализует 500юбок и 1000пиджаков, а при прохладной погоде - 800юбок и 100пиджаков. Затраты на изготовление однойюбки равны 600, а платья –900 рублям, цена реализации соответственно равна 1200 рублей и 1800 рублей. Определить оптимальную стратегию швейного предприятия.
Составим математическую модель задачи. В связи с возможными состояниями спроса предприятие располагает двумя стратегиями.
1) А1 = (500, 1000) – реализует 500 юбок и 1000 пиджаков;
2)А2 = (800, 100) –реализует800 юбок и 100 пиджаков.
Природа располагает также двумя стратегиями:
1)В1–теплая погода;
2)В2–прохладная погода.
Если предприятие примет стратегию А1 и спрос действительно будет находиться в первом состоянии, то есть погода будет теплой (В1), то выпущенная продукция будет полностью реализована и доход составит:
Р11 =500*(1 200-600) + 1000*(1 800-900) =1 200 000.
Если предприятие примет стратегию А1, а спрос будет находиться в состоянии В2 (прохладнаяпогода), то пиджаки будут реализованы лишь частично, и предприятие будет нести убытки:
Р12 = 500*(1 200-600) + 100*(1 800-900) – (1 000-100)*900= - 420 000.
Аналогично, если предприятие выберет стратегию А2, а природа – стратегию В1 (т.е. теплаяпогода), то доход составит:
Р21 =500*(1 200-600) + 100*(1 800-900) – (800-500)*600= 210 000.
Если же природа выберет стратегию В2, то:
Р22 = 800*(1 200-600) + 100*(1 800-900) = 570 000.
Рассматривая предприятие и природу в качестве двух игроков, получим платежную матрицу игры:
Р= |
1 200 000 |
-420 000 |
210 000 |
570 000 |
Эта матрица будет служить игровой моделью задачи.
Поскольку максиминная стратегия игры составляет α = max (-420 000, 210 000) = 210 000, а минимаксная β = min (1 200 000, 570 000) = 570 000, то цена игры Vлежит в диапазоне от 210 000 до570 000 рублей.
Средний выигрыш первого игрока, если он использует оптимальную смешанную стратегиюx = (x1,x2), а второй игрок – чистую стратегию, соответствующую первому столбцу платежной матрицы, равен цене игры V:
1 200 000x1+ 210 000x2 = V.
Тот же средний выигрыш получает первый игрок, если второй игрок применяет стратегию, соответствующую второму столбцу платежной матрицы, тогда
-420 000x1 + 570 000x2 = V.
Учитывая, что х1 + х2 = 1 , получаем систему уравнений для определения оптимальной стратегии первого игрока и цены игры:
1 200 000x1+ 210 000 x2 = V;
-420 000 x1 + 570 000x2 = V;
х1 + х2 = 1.
Решая эту систему уравнений, находим:
х1 0,181818
х2 0,818182
V = 390 000
Оптимальная стратегия предприятия:
Таким образом, швейному предприятию оптимально произвести 745юбок и 263пиджака.
В экономике часто возникают моменты, когда необходимо принять оптимальное решение, а вариантов принятия решений несколько. Теория игр в экономике - это отличный инструмент прогнозирования. С помощью матричных игр можно определить оптимальный выпуск продукции для предприятия, оптимальную выплату страховых взносов и т. п.
Список литературы:
Основы теории игр: учебное пособие / Л.В. Колобашкина. — 3-е изд., испр. и доп. .— М. : БИНОМ. Лаборатория знаний, 2014.
Математическая теория игр и приложения / В.В. Мазалов. - М.: Лань, 2016. - 448 c.
Теория игр и исследование операций / Лемешко Б.Ю. - Новосиб.:НГТУ, 2013. - 167 с.
http://ru/wikipedia.org/