ТЕОРИЯ ИГР ВО ФЛОТЕ. - Студенческий научный форум

VI Международная студенческая научная конференция Студенческий научный форум - 2014

ТЕОРИЯ ИГР ВО ФЛОТЕ.

Джанкезов Ш.М. 1
1Финансовый университет при Правительстве РФ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Введение

Приложения теории игр состоят в описании конфликтных ситуаций на формальном языке и в использовании математических средств для выработки оптимальных решений в условиях конфликтов и неопределенности. Если исходить из формально-математического подхода к боевым действиям на море, прежде всего, возникает вопрос о том, поддаются ли они формализации, которая, не ограничиваясь рамками удобной системы обозначений, обеспечила бы более глубокое развитие военно-морской науки по сравнению с тем уровнем, который достигнут на ее нематематическом пути развития.

Однако для формального описания сложных явлений и процессов, протекающих в сфере вооруженной борьбы на море и имеющих в своей основе конфликтные закономерности, нельзя использовать классическую математику. Поэтому для их описания необходимо использовать новые разделы математики, и прежде всего теорию игр, прямо отражающую особенности конфликтных закономерностей объективной реальности.

Приложения теории игр применительно к боевым действиям на море можно условно разделить на оперативно-тактические и технические. Оперативно-тактические приложения связаны с обоснованиями оптимальных способов использования сил и методов боевого применения уже имеющихся боевых средств, а в технических приложениях речь идет о выборе рациональных параметров разрабатываемой боевой техники.1

В настоящей работе поставлена цель осветить основные вопросы, касающиеся оперативно-тактического применения теории игр для флота. Будут изложены основные понятия касательно антагонистических игр, а в практической части рассмотрен пример, взятый из истории морских сражений на Тихом океане в период второй мировой войны.

Теоретическая часть

При ведении боевых действий на море, применении в бою оружия или выборе систем вооружения обычно складываются конфликтные ситуации, в которых принимают участие две противоборствующие стороны, преследующие диаметрально противоположные цели. Противоположность сталкивающихся интересов в рассматриваемых конфликтных ситуациях состоит в том, что один противник осуществляет наступательные действия, а другой оборонительные, т.е. обороняется.

Наступающая сторона стремится к максимуму боевой эффективности своих мероприятий, а обороняющаяся сторона, принимая контрмеры, пытается свести эту эффективность к минимуму.

Характерным здесь является и то, что каждая сторона не располагает достаточными данными о мероприятиях, предпринятых противником. В результате складывается антагонистический конфликт, в котором стремлению одной стороны уничтожить другую противостоит стремление второй стороны избежать уничтожения. Поэтому потери (в самом широком смысле) одной из сторон в этом конфликте составляют выигрыш противной стороны, и наоборот.

Практически это означает четкое разграничение категории наступательного (на осуществляющего наступательные цели) и оборонительного (на препятствующего осуществлению наступательных целей), что, в свою очередь, позволяет выделить широкий класс боевых действий на море вида «наступление - оборона». Примеров таких столкновений более чем достаточно, и каждое из них имеет соответствующее значение в вооруженной борьбе на море, будь то проведение поисковой операции на океанских просторах или стрельба торпедами по ракетной подводной лодке, выбор типа системы самонаведения зенитной ракеты или распределение средств противовоздушной обороны соединения кораблей на переходе морем. По существу, в каждом таком столкновении отношение наступательного и оборонительного можно считать своеобразной конфликтной интерпретацией объективных причинно-следственных связей и строить соответствующие математические модели.

Математическими моделями принятия оптимальных решений в условиях конфликта двух сторон, преследующих прямо противоположные цели, являются антагонистические игры, т. е. игры двух лиц с нулевой суммой. Эти игры занимают одно из центральных мест во всей теории игр и составляют наиболее полно разработанную ее часть.

Из антагонистических игр, прежде всего, следует рассмотреть одноходовые конечные игры, адекватно отображающие некоторые типовые ситуации в военно-морском деле.

Одноходовая конечная антагонистическая игра является теоретико-игровой моделью конфликтной ситуации, в которой противники для достижения диаметрально противоположных целей делают по одному выбору (ходу) из конечного числа возможных способов действий. В соответствии с выбранными способами действий (стратегиями) определяется достигаемый результат. Функция выигрыша в такой игре задается матрицей (табл.1), поэтому эти игры называются матричными.

Таблица 1

Сторона А

Сторона В

Способы действий стороны В

В1

В2

Вj

 

Способы действий стороны А

A1

a11

a12

a1j

a1n

A2

a21

a22

a2j

a2n

 

 

Ai

ai1

ai2

aij

ain

 

 

Am

am1

am2

amj

amn

В матрице игры строки соответствуют стратегиям игрока, который стремится к максимизации критерия эффективности (игрок I), а столбцы - стратегиям игрока, который стремится к минимизации критерия эффективности (игрок II). Элементы матрицы, стоящие на пересечении строк и столбцов, соответствуют ситуациям игры и заполняются числами - значениями критерия эффективности, характеризующем выигрыш игрока I и соответственно проигрыш игрока II.

Обычно матрицу, имеющую m строк и n столбцов, обозначают следующим образом:

Игру, описываемую матрицей А, называют m*n игрой, игрой с матрицей выигрыша А или просто игрой ГА. В этой игре стратегии игрока I обозначают номерами соответствующих строк, а стратегии игрока II - номерами столбцов.

Процесс матричной игры, моделирующей бой или боевое действие, можно представить следующим образом. Игрок I выбирает некоторую строку i матрицы А, а игрок II - некоторый ее столбец j, создавая ситуацию (i, j), после чего игрок I получает выигрыш aij. Здесь очевидны следующие два допущения:

- каждый игрок знает альтернативы, имеющиеся у него и у его противника, а также знает, как исход конфликта зависит от этих выборов, т. е. знает матрицу игры;

- если исходом игры является случайное событие или случайная величина, то каждому игроку известны различные возможности и соответствующие им вероятности.

Третье допущение состоит в том, что значение функции выигрыша показывает, насколько в данной ситуации осуществляются интересы игроков. Поэтому целью игрока I является достижение такой ситуации, в которой значение функции выигрыша будет максимальным, а целью игрока II - достижение такой ситуации, в которой ее значение будет минимальным. Однако образование любой ситуации зависит от поведения каждого игрока. Необходимым признаком разумности поведения в таких условиях является осуществимость намерений и действий игрока. Следовательно, каждый игрок должен стремиться не вообще к ситуации, в которой значение функции выигрыша максимально или минимально, а прежде всего к такой ситуации, которая реально может сложиться в процессе игры. Поясним это на примере игры с матрицей выигрышей игрока I:

Рассмотрим игру ГА с точки зрения игрока I. Из матрицы игры видно, что ее максимальный элемент, равный 10, соответствует ситуации, которая может сложиться при выборе игроком I своей 1-й стратегии. Однако это будет в том случае, если игрок II выберет 2-ю стратегию, что вряд ли возможно. Скорее всего, игрок II выберет 1-ю стратегию, поэтому намерение достичь ситуации (1, 2) разумным считать нельзя. Следовательно, надо выбрать 2-ю стратегию и стремиться создать ситуацию (2, 1).

Повторим то же рассуждение, встав на точку зрения игрока II. Из матрицы игры видно, что минимальный элемент, равный 4, соответствует ситуации (1, 1), которая складывается при выборе игроками своих первых стратегий. Однако вряд ли игрок I выберет 1-ю стратегию, при которой его выигрыш будет минимальным. Поэтому данная ситуация является неосуществимой и надо стремиться создать ситуацию (2, 1).

Следовательно, для того чтобы ситуация могла быть осуществимой, в ней одновременно должны достигаться приемлемые результаты как для игрока I, так и для игрока II. Этим свойством обладают ситуации равновесия.

На основании интуитивных соображений, вытекающих из рассмотренного выше примера, дадим следующее формальное определение ситуации равновесия для антагонистической игры ГА.

Определение 1. Пусть дана игра ГА. Говорят, что ситуация (i0, jo) равновесна или что она является ситуацией равновесия, если для любого I = 1, ..., m и о = 1, ..., n имеет место двойное неравенство:

(1),

где H = Н1 = – H2 – функция выигрыша игрока I.

Очевидно, что выявление ситуаций равновесия имеет большое значение для анализа игры, так как именно они могут складываться в результате разумного выбора игроками своих стратегий.

Существование ситуации равновесия устанавливается путем анализа стратегий игроков с точки зрения наиболее неблагоприятных исходов. Для этого, прежде всего, в каждой строке матрицы игры отыскивается минимальное значение выигрыша. Обозначим его через , где знаком (минимум по j) обозначено минимальное из значений функции выигрыша при всех возможных j. Числа характеризуют минимальные выигрыши игрока I с учетом разумных действий игрока II. Поэтому игрок I должен выбирать свою стратегию так, чтобы максимизировать свой минимальный выигрыш, т. е. он должен остановиться на той стратегии, для которой число является максимальным. Обозначим максимальное значение через т. е. .

Величина называется нижним выигрышем игрока I, или нижним значением игры, или максимином, а соответствующая ему стратегия игрока I - максиминной.

Очевидно, что при выборе наиболее осторожной, максиминной стратегии игрок I обеспечивает себе независимо от поведения противника гарантированный выигрыш не менее .

Проанализируем каждую стратегию игрока II с точки зрения наиболее неблагоприятного для него исхода при выборе игроком I одной из своих стратегий. В результате этого найдем максимальные значения проигрыша, которые обозначим через , где знаком (максимум по i) обозначено максимальное из значений функции выигрыша при всех возможных i. Числа характеризуют максимальные проигрыши игрока II с учетом разумных действий игрока I. Поэтому игрок II должен выбрать свою стратегию так, чтобы минимизировать свой максимальный проигрыш. Для этого он должен остановиться на той стратегии, при которой число будет минимальным. Обозначим минимальное значение через , т. е. .

Величина называется верхним проигрышем игрока II, или верхним значением игры, или минимаксом, а соответствующая ему стратегия игрока II — минимаксной.

Очевидно, что при выборе наиболее осторожной, минимаксной стратегии игрок II не дает возможности игроку I ни при каких обстоятельствах выиграть больше .

Следовательно, если оба игрока ведут себя разумно, то выигрыш игрока I должен быть не меньше, чем максимин, и не больше, чем минимакс. Итак, интуитивно ясно (и это можно доказать), что нижний выигрыш игрока I не может превышать верхнего проигрыша игрока II, т. е. (2).

В некоторых играх нестрогое неравенство (2) превращается в равенство, т. е. при определенных условиях может достигаться равенство максимина и минимакса, а именно (3).

Необходимым и достаточным условием выполнения равенства (3) является существование седловой точки2 m*n-матрицы, т. е. существование пары целых чисел i0 и j0, для которых число отказывается одновременно минимальным в своей строке и максимальным в своем столбце. Поэтому игрок I, применяя максиминную стратегию i0, гарантирует себе выигрыш , а игрок II, применяя минимаксную стратегию j0, не даст ему выиграть больше . Если игрок I отклонится от стратегии i0, он может выиграть меньше , а если отклонится от стратегии j0 игрок II, он может проиграть больше . Из сказанного следует (и это можно доказать), что если достигается равенство максимина и минимакса, то выполняется неравенство (1) и пара стратегий (i0, jo) является ситуацией равновесия. В связи с этим ситуации равновесия в антагонистических играх называют седловыми точками.

Нахождение седловых точек матрицы А может быть произведено по следующей схеме:

Если выполняется равенство (3), то пара стратегий (i0, jo), для которой это равенство имеет место, является седловой точкой.

Существование в матричных играх ситуаций равновесия (седловых точек) означает, что нижний выигрыш игрока I в точности равен верхнему проигрышу игрока II. Общая величина этих двух чисел, равная , называется значением игры и обозначается через v. В этом случае максиминная стратегия является оптимальной для игрока I, так как не существует стратегии, которая дала бы ему гарантированный выигрыш больше v независимо от выбора игрока II. Соответственно минимаксная стратегия является оптимальной для игрока II, потому что не существует стратегии, которая обеспечила бы проигрыш меньше v независимо от выбора игрока I. Совокупность оптимальных стратегий (i0, jo) называется решением игры.

Заметим, что в качестве принципа оптимальности выступает здесь максиминный критерий, который означает стремление игрока I к максимизации своего выигрыша (а для игрока II минимизация своего проигрыша) в наименее благоприятных условиях. Именно такой подход приводит к неравенству (2), которое при определенных условиях становится равенством (3). Следовательно, в антагонистических играх принцип равновесия (осуществимости цели) превращается в принцип максимина, а ситуации равновесия становятся седловыми точками.

Решение матричной игры с седловой точкой обладает таким свойством, что если игроки придерживаются своих оптимальных стратегий, то выигрыш игрока I равен значению игры. Если один из игроков придерживается своей оптимальной стратегии, а другой отклоняется от нее, то последний только теряет и ни в коем случае не может увеличить свой выигрыш. При этом наличие у любого игрока сведений о том, что другой избрал свою оптимальную стратегию, не служит основанием для выбора какой-либо иной, кроме оптимальной (минимаксной или максиминной), стратегии.

В матричной игре может быть несколько ситуаций равновесия. Однако это не создает каких-либо затруднений с точки зрения выбора одной из них, та как если (i0, jo) и - ситуации равновесия, то и - также ситуации равновесия, а = = = . Действительно, пусть матричная игра имеет две ситуации равновесия (седловые точки), которые в матрице выигрышей выделены точками:

Допустим, что игрок I выбрал 2-ю стратегию, а игрок II — 4-ю стратегию. Тогда очевидно, что элемент a22 будет минимальным во 2-й строке, а элемент а44 - максимальным в 4-м столбце. Отсюда а24 = а22 = а44, ибо в противном случае указанные точки не являлись седловыми. Следовательно, ситуация (2, 4) также равновесна.

Практическая часть

Класс игр с седловыми точками имеет большое значение в военно-морском деле. В боевых ситуациях, моделями которых являются подобные игры, следует всегда действовать по вполне определенному плану, соответствующему оптимальной стратегии. Это положение можно проиллюстрировать примером, взятым из морских сражений на Тихом океане в период второй мировой войны.3

В боях за Новую Гвинею разведка американцев сообщила, что японцы планируют переход конвоя с войсками и провиантом из порта Ребаул на восточной оконечности Новой Британии в Лаэ, находящийся в Новой Гвинее. Маршрут конвоя мог проходить либо к северу от Новой Гвинеи (северный путь), где по прогнозу ожидалась плохая видимость, либо к югу (южный путь), где ожидалась ясная погода. Время перехода по этим маршрутам было одинаковым и составляло трое суток (рис.1).

Рисунок 1

Для обнаружения конвоя американцы могли сосредоточить основные силы разведывательной авиации либо на одном, либо на другом его маршруте. Сосредоточение разведывательной авиации на северном пути давало возможность обнаружить конвой независимо от выбора японцев на таком удалении от пункта прибытия, что американцы могли наносить по конвою бомбовые удары в течение двух дней. Если же противники выбирали южный путь, бомбовые удары по конвою могли наноситься в течение трех дней. Выбор японцами северного пути и сосредоточение разведывательной авиации на южном приводило к атакам конвоя в течение одного дня. Эти четыре оперативно-тактические ситуации для двух альтернатив, имеющихся у каждого из противников, представлены на рис.2 как элементы матрицы 2*2.

Рисунок 2

Из рис.2 видно, что американцы и японцы контролировали образование оперативно-тактических ситуаций, соответственно находящихся в строках и столбцах матрицы. При этом, однако, ни один из противников не мог сделать выбор, который полностью отвечал бы его целям (для американцев - максимальное, а для японцев - минимальное число дней на бомбардировку). Каждый из них, выбирая независимо свою стратегию, должен был сознательно учитывать возможный выбор противника. Для американцев оказалось (как это определил штаб генерала Кеннея - командующего объединенными военно-воздушными силами юго-западной части Тихого океана) целесообразным сосредоточить разведывательную авиацию на северном пути, что обеспечивало независимо от выбора японцев два дня для бомбардировки, тогда как в случае выбора южного пути существовала реальная опасность обнаружить конвой слишком поздно. Для японцев единственно приемлемым с точки зрения анализа оперативно-тактической обстановки также оказался северный путь (сосредоточение разведывательной авиации на южном пути обеспечивало только один день, а при движении этим путем - три дня для бомбардировки).

Анализ разобранной операции военно-воздушных сил США против конвоя японцев в боях за Новую Гвинею подобен анализу матричной игры, а фактические решения противоборствующих сторон идентичны решению этой игры. Действительно, матрица для рис.2 является не чем иным, как матрицей выигрыша игрока I (американцев), а ее оперативно-тактические ситуации – ситуациями следующей игры (табл.2).

Таблица 2

 

Стратегии японцев

 
 

Северный путь

Южный путь

Стратегии американцев

Северный путь

2 дня

2 дня

2 дня (максимин)

Южный путь

1 день

3 дня

 
 

2 дня (минимакс)

   

Из анализа этой матрицы видно, что она имеет седловую точку (северный путь, северный путь), которая определяет оптимальные стратегии с ожидаемым исходом - два дня для бомбардировки конвоя. Эти стратегии в действительности и были выбраны. Конвой был обнаружен через день после выхода на северном пути, и японцы понесли тяжелые потери. Несомненно, обстановка для японцев сложилась весьма неблагоприятная. Однако выбор северного пути обусловливал (в случае выбора американцами неоптимальной стратегии) уменьшение числа дней до одного, и потери в этом случае могли бы быть гораздо меньше.

Таким образом, обе стороны в соответствии с теорией игр, исходя из наличия в матрице игры седловой точки и единственных оптимальных стратегий, действовали наилучшими способами. Это показывает, что понятие игры как математической формализации конфликтов является общим, а конкретные интерпретации понятия игры встречаются в вооруженной борьбе на море всюду, когда ход боевых действий непосредственно зависит от принятых сторонами тех или иных решений. Поэтому военно-морское дело дает чрезвычайно широкие возможности для практических приложений теории игр.

Заключение

В данной работе рассматривалась тема применения теории игр для флота. В основной части работы были приведены сведения об антагонистических играх: постановка задачи (конфликтной ситуации) и пути ее решения. Здесь были применены основы теории игр. В практической части работы был разобран пример морского сражения второй мировой войны.

Таким образом, поставленная в начале работы цель была достигнута.

Список использованной литературы
  1. Лабскер Л.Г., Бабешко Л.О. Игровые методы в управлении экономикой и бизнесом: Учеб. пособие. – М.:Дело, 2001. – 464с.

  2. Суздаль В.Г. Теория игр для флота. М., Воениздат, 1976. – 317 с.

1 Суздаль В.Г. Теория игр для флота – с. 31.

2 Термин «седловая точка» заимствован из дифференциальной геометрии (по аналогии с поверхностью седла, которая искривляется вверх в одном направлении и вниз в другом). Однако следует иметь в виду, что понятие «седловая точка» в теории игр отличается от аналогичного понятия в геометрии двумя чертами. В геометрии седлообразность не зависит от системы координат и является локальной характеристикой этой точки. В теории игр, напротив, для того, чтобы точка была седловой, необходимо, чтобы она была максимумом именно по первой координате и минимумом по второй во всей области определения. Кроме того, так как максимум и минимум могут достигаться на границе области, обращение в нуль соответствующих производных не обязательно.

3 Суздаль В.Г. Теория игр для флота – с.54.

Просмотров работы: 1401