РАВНОВЕСИЕ В БЕСКОАЛИЦИОННЫХ ИГРАХ. ВКЛАД ДЖОНА НЭША. - Студенческий научный форум

VI Международная студенческая научная конференция Студенческий научный форум - 2014

РАВНОВЕСИЕ В БЕСКОАЛИЦИОННЫХ ИГРАХ. ВКЛАД ДЖОНА НЭША.

Карданова С.К. 1
1Финансовый университет при правительстве РФ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Введение

«Только с помощью математики можно понять сущность экономических явлений»

Леон Вальрас

«Если каждый будет стремиться к своей корысти, то «невидимая рука» провидения приведет к всеобщему благосостоянию» – примерно так определил Адам Смит действие конкурентного рынка и соответствующий ему телеологический механизм экономической координации. Этот принцип до начала XX века рассматривался как своеобразная аксиома экономики и ни разу не подвергался сомнению. Но в первой половине прошлого века была доказана теорема, говорившая об обратном, и она получила название теоремы Джона Нэша.

Актуальность моей темы заключается в том, что на сегодняшний день все большее значение принимает экономико-математическое моделирование, и необходимо знать какие постулаты мы можем считать истинными, а какие – нет. Исходя из актуальности выбранной темы, можно сформулировать цель работы: она заключается в выяснении теоретических особенностей такого явления, как равновесие в бескоалиционных играх и каким образом они могут применяться на практике. При выполнении работы будут выполнены следующие задачи:

  • Формирование теоретической базы

  • Выявление практической значимости темы

  • Анализ различных экспертных оценок по теме.

  1. Теоретическая часть

    1. Джон Нэш

Нэш Джон (Nash, John) (р.13.06.1928), - выдающийся американский математик и экономист. Это человек, разрушивший стереотип, господствовавший в мире 150 лет. Именно его исследования показали в полной мере, насколько важна роль математики в экономике, что многие проблемы решаемы только благодаря ей. Работы Дж. Нэша дают понять, что математическое моделирование – не просто теория, а, фактически, - указатель в бизнесе и экономике, направляющий на верный путь. Институтский преподаватель Нэша Ричард Даффин, не приукрасил действительность, снабдив его одним из самых лаконичных рекомендательных писем, состоящим из единственной фразы: «Этот человек - гений».

Изучив монографию Дж. Фон Неймана и О. Моргенштерна «Теория игр и экономическое поведение», Дж. Нэш с увлечением стал работать в области теории игр и уже в 20 лет создал основы научного метода, сыгравшего огромную роль в развитии мировой экономики. 21-летний ученый защитил в Принстонском университете докторскую диссертацию по теории игр. За полученные в диссертации результаты через 45 лет был удостоен Нобелевской премии по экономике «За фундаментальный анализ равновесия в теории некооперативных игр»1. Благодаря своим исследованиям в области теории игр Нэш стал одним из ведущих специалистов в области ведения «холодной войны». В июле 1958 г. Журнал Fortuneназвал Нэша восходящей звездой Америки в «новой математике».

Работы Нэша посвящены теории игр, теории равновесия, дифференциальной геометрии; он ввел различие между кооперативными играми (в которых достижение согласия возможно) и некооперативными, а также разработал концепцию равновесия для некооперативных игр (которая была названа Равновесием Нэша).

Анализируя как различные управленческие стратегии в экономике и бизнесе, так и стратегии поведенческие, Нэш отметил, что в условиях антагонизма эти стратегии всегда приводят к тому, что кто-то всегда выигрывает, а кто-то другой всегда проигрывает, т.е. всегда есть победители и проигравшие. Дж.Нэш задался вопросом: как найти равновесие, в котором нет победителей и побежденных – никто не выиграл, но никто не проиграл? Такие стратегии сделали бы революцию в переговорах, решении конфликтов и поиске других компромиссных решений.

Нэш разработал методы анализа, в которых все участники или выигрывают, или терпят поражение. Примером такой игры могут быть переговоры об увеличении заработной платы между профсоюзом и руководством компании. Эта ситуация может завершиться либо длительной забастовкой, в которой пострадают обе стороны, либо достижением выгодного для обеих сторон соглашения. Нэш смоделировал ситуацию, впоследствии получившую название «равновесие по Нэшу», или «некооперативное равновесие», при которой обе стороны используют оптимальную стратегию, что и приводит к созданию устойчивого равновесия. Игрокам выгодно сохранять это равновесие, так как любое изменение ухудшит их положение.

«Дж.Нэш показал, что классический подход А.Смита к экономическому развитию (двигатель развития – конкуренция, при которой «каждый сам за себя») – неоптимален. Более эффективными являются стратегии, когда каждый старается сделать лучше для себя, делая лучше для других. Так фактически, произошел переворот всего, на чем строилась экономическая теория на протяжении 150 лет»2.

  1.  
    1. Понятие равновесия в некооперативных играх.

Равновесие по Нэшу

Пусть

Г=I, Sii∈I, Hii∈I

  • бескоалиционная игра (причем I является множеством игроков, Si – множеством всех стратегий для каждого игрока i, а Hi – его функция выигрыша). В качестве основного руководящего принципа поведения игроков в такой игре естественно принять следующий принцип осуществимости цели: действия игроков считаются разумными, если ситуация, являющаяся целью их совместных усилий, осуществима, т.е. если ни один из игроков не заинтересован в нарушении этой ситуации.

Более формально принцип осуществимости цели выглядит следующим образом.

Если s – ситуация в игре Г, а si – произвольная стратегия игрока i, то через s∥si обозначается ситуация, получаемая из ситуации в результате замены в ней имеющейся стратегии игрока I на его стратегию si.

Ситуация s* в игре Г называется приемлемой для игрока i, если для любой его стратегии si имеет место неравенство His*∥si ≥Hi(s*). Ситуация называется равновесной, если она является приемлемой для каждого игрока.3

Равновесием по Нэшу называют такое состояние, когда у каждого рационально действующего игрока нет оснований для изменения собственного поведения при неизменном поведении других индивидуумов (Nash (1950), Нэш (1961))4. Таким образом, речь идет о ситуациях, в которых никакой индивидуум не может повысить свое благосостояние, если остальные участники придерживаются выбранной ими стратегии.

Нетрудно проверить, что если бескоалиционная игра Г оказывается антагонистической, то принцип осуществимости цели превращается в принцип максимина, а ситуации равновесия оказываются седловыми точками.

Формально ситуации равновесия выполняют в теории бескоалиционных игр ту же роль, что и седловые точки в играх антагонистических, но нормативное их значение существенно ниже. Знание игроком своих стратегий, входящих в ситуации равновесия, еще не обеспечивает ему возможности осуществлять оптимальный образ действий. Это понятно, так как неантагонистические игры, в общем, не исчерпываются своим стратегическим аспектом.5

Более сложными теоретико-игровыми моделями являются игры с переменной суммой выигрыша. Основным вопросом был следующий: когда существует равновесие в играх со смешанными стратегиями?

Определение 2. Приемлемые ситуации и ситуации равновесия в смешанном расширении Г бескоалиционной игры Г называются приемлемыми ситуациями и соответственно ситуациями равновесия исходной игры Г в смешанных стратегиях.

Дж.Нэшем было доказано существование ситуации равновесия в смешанных стратегиях для любой конечной бескоалиционной игры.

Теорема*. Для того, чтобы ситуация X*в игре Г была ситуацией равновесия этой игры (в смешанных стратегиях), необходимо и достаточно, чтобы для любого игрока i и любой его стратегии xi выполнялось неравенство:

Hi(X*∥xi)≤Hi(X*) (1)

Доказательство.

Необходимость очевидна, так как чистая стратегия является частным случаем смешанной и, таким образом, каждое из неравенств (1) есть частный случай соответствующего неравенства Hi(X*∥Xi)≤Hi(X*).

Для доказательства достаточности следует воспользоваться переходом к смешанным стратегиям.

Теорема Дж.Нэша. В каждой бескоалиционной игре

Г=I, xii∈I, Hii∈I

существует хотя бы одна ситуация равновесия (в смешанных стратегиях).

Доказательство.

Если игрок i имеет в игре Г miчистых стратегий, то множество Xi всех его смешанных стратегий, как уже неоднократно отмечалось, можно представлять как (mi-1)-мерный симплекс. Поэтому всякую ситуацию

X=(X1,…, Xn)(2)

в смешанных стратегиях можно рассматривать как точку в декартовом произведении X=X1×…×Xn симплексов смешанных стратегий. Это декартово произведение, очевидно, является выпуклым и компактным подмножеством евклидова пространства размерности m1+…+mn-n.

Положим теперь для произвольной ситуации X и любой чистой стратегии xi(j)∈xi игрока i

φix'ijX=φijX=max0, Hi, X∥xij- Hi(X) (3)

Очевидно, все вводимые таким образом функции φij принимают только неотрицательные значения.

Функция φij показывает увеличение выигрыша игрока i в ситуации Х, происходящее за счет замены его стратегии Xi, входящей в эту ситуацию некоторой чистой стратегией xi(j). Уменьшения же выигрыша функция φij не показывает, ибо в этом случае ее значение будет равно нулю. Составим теперь для всевозможных i = 1,…, n и j=1, …, mj числа вида

Xixij+ φij(X) 1+j=1miφij (X) (4)

Все эти дроби, очевидно, неотрицательны, а каждая сумма вида

j=1miXi(xij)+φij (X) 1+j=1miφij (X)

равна единице.

Следовательно, при фиксированных Х и i дроби (2) можно понимать как вероятности соответствующих чистых стратегий xi(j) игрока i. Тем самым каждый набор таких дробей для всех чистых стратегий xi(j)∈xi можно понимать как смешанную стратегию игрока i.

Так как дроби (4) составляют для каждого игрока i∈I, их совокупность определяет систему смешанных стратегий всех игроков, т.е. некоторую ситуацию в игре Г. Эта ситуация зависит от исходной ситуации Х, являясь ее функцией. Будем обозначать ее поэтому через ψ(X). Очевидно, что функция ψ осуществляет преобразование замкнутого выпуклого и ограниченного множества всех ситуаций Х в себя.

Кроме того, эта функция является непрерывной функцией ситуации. Действительно, каждая компонента ситуации, являющейся значением функции ψ , есть дробь вида (4). В числителе этой дроби первое слагаемое есть сама компонента исходной ситуации и поэтому зависит от нее непрерывно. Второе слагаемое, как видно из (3), есть комбинация из линейных функций Hi(X) и Hi(X∥xi(j)), постоянной 0 и операции взятия максимума (то, что функция max0,x является непрерывной, легко усмотреть ее из графика на рис.1, а так же Лемма6). Следовательно, φij(X) также является непрерывной функцией Х. Значит, числитель дроби (4) есть непрерывная функция Х. наконец, знаменатель этой дроби непрерывен и притом не может приближаться к нулю (его значения меньше единицы). Таким образом, функция ψ является непрерывной.

На основании сказанного мы находимся в условиях известной теоремы Брауэра о неподвижной точке, согласно которой непрерывное преобразование ψ выпуклого компактного подмножества конечномерного пространства в себя должно иметь хотя бы одну неподвижную точку, т.е. такую точку X0, для которой ψX0=X0. Пусть X0 – одна из таких неподвижных точек. Это значит, что для всех i и j

Xi0xij=Xi0xij+φij(X0)1+j=1miφij(X0) (5)

На основании леммы, для любого игрока i должна найтись такая его считая стратегия xi0, что Xi0xi0>0 и φi0=0. Для этой стратегии равенство (5) записывается как

Xi0xi0=Xi0xi0+φi0(X0)1+j=1miφij(X0)

откуда

Xi0xi0+Xi0xi0j=1miφij(X0)=Xi0xi0+φij(X0)

Отбрасывая равные слагаемые справа и слева и вспоминая, что второе слагаемое справа по самому выбору стратегии xi0 обращается в нуль, получаем

Xi0xi0j=1miφij(X0)=0

Но первый сомножитель слева, опять-таки по выбору стратегии xi0, отличен от нуля. Следовательно, j=1miφij(X0)=0. А так все числа φij(X0) неотрицательны, каждое из них должно обращаться в нуль: φijX0=0. Следовательно, в нашем случае в равенстве (3) под знаком максимума положительных чисел нет, т.е.:

Hi(X∥xi(j))≤Hi(X0) .

Так как это равенство справедливо для любого игрока i и любой его чистой стратегии xi(j), теорема* дает нам, что ситуация X0 является ситуацией равновесия.7

Практическая часть.

  1.  
    1. Решение биматричных задач

Пусть у игрока 1 имеется m чистых стратегий, i=1,m; у игрока 2 имеется n чистых стратегий, j=1,n. Выигрыши игроков 1 и 2 соответственно задаются матрицами:

A=a11…a1n………am1…amn; B=b11…b1n………bm1…bmn.

Будем считать смешанной стратегией игрока 1 полный набор вероятностей применения этим игроком своих чистых стратегий x=(x1,…, xm), и соответственно y=(y1,…, yn) – смешанной стратегией игрока 2. Тогда средние выигрыши игроков 1 и 2 определяются соответственно как:

U1A,x,y=i=1mj=1naijxiyjU2B,x,y=i=1mj=1nbijxiyj.

Следуя принципу равновесия Нэша, определим равновесную ситуацию, отклонение от которой уменьшает платежи игрока, при условии, что другие игроки придерживаются равновесной ситуации.

Данная игра является биматричной, следовательно, теорема Нэша в полной мере распространяется на нее.

Для игроков биматричной игры условие равновесия Нэша может быть сформулировано как:

U1A,x,y0≤U1(A,x0,y0)U2B,x0,y≤U2(B,x0,y0).

Условие равновесия для биматричной игры должно выполняться в том числе для любых чистых стратегий игроков (xi,yj). Тогда для оптимальных стратегий x0 и y0 игроков 1 и 2 соответственно должно выполняться следующее условие:

U1A,xi,y0≤U1A,x0,y0,U2B,x0,yj≤U2B,x0,y0.

Для определения ситуации равновесия необходимо решить указанную систему неравенств относительно неизвестных x0=(x10, …, xm0) и y0=(y10, …, yn0) при условиях

i=1mxi0=1, j=1nyj0=1, xi0≥0 (i=1,m), yj0≥0 (j=1,n).

В качестве примера рассмотрим случай, когда каждый игрок имеет 2 чистые стратегии. В этом случае их платежные матрицы имеют по четыре элемента:

A=a11a12a21a22, B=b11b12b21b22

а смешанные стратегии соответственно: x=(x1,x2) и y=(y1,y2).

Тогда условие равновесия будет выглядеть как:

U1A,x1,y0≤U1A,x0,y0U1A,x2,y0≤U1A,x0,y0 и U2B,x0,y1≤U2B,x0,y0U2B,x0,y2≤U2B,x0,y0.

Далее, для упрощения записи опустим индексы и обозначим первый элемент смешанной стратегии игрока 1 как x, а игрока 2 – какy. Тогда смешанные стратегии игроков 1 и 2 имеют вид

x, 1-x, y, 1-y;0≤x≤1;0≤y≤1;

а средние ожидаемые платежи равны:

U1A, x, y=a11-a12-a21+a22xy+a12-a22x+a21-a22y+a22,

U2B, x, y=b11-b12-b21+b22xy+b12-b22x+b21-b22y+b22.

Полагая х=1 (соответствует выбору первой чистой стратегии), получим

U1A, 1, y=a11-a12-a21+a22y+a12+a21-a22y.

В случае x=0 (соответствует выбору второй чистой стратегии) имеем

U1A, 0, y=a21-a22y+a22.

Допустим, что смешанные стратегии игроков x, 1-x и y, 1-y являются оптимальными. Рассмотрим разности U1A, x, y- U1A, 1, y и U1A, x, y-U1A, 0, y. В случае выполнения условия равновесия Нэша эти разности должны быть неотрицательными:

U1A, x, y- U1A, 1, y=a11-a12-a21+a22xy+a12-a22x-a11-a12-a21+a22y+ a22-a12≥0

U1A, x, y-U1A, 0, y= a11-a12-a21+a22xy+a12-a22x≥0

Введем обозначения C=a11-a12-a21+a22 и F = a12-a22. С учетом таких обозначений получаем

U1A, x, y- U1A, 1, y=Cxy-Fx-Cy+F=(x-1)(Cy-F)≥0;

U1A, x, y-U1A, 0, y=Cxy-Fx=x(Cy-F)≥0.

Таким образом, получаем систему неравенств:

(x-1)(Cy-F)≥0x(Cy-F)≥0.

Аналогично для B c учетом обозначений D=b11-b12-b21+b22 и G=b21-b22.

U2B, x, y-U2B, x, 1=y-1Dx-G;

U2B, x, y-U2B, x, 0=y(Dx-G)

В случае ситуации равновесия эти разности неотрицательны:

y-1Dx-G≥0y(Dx-G)≥0

Итак, для нахождения ситуации равновесия необходимо решить систему неравенств

(x-1)(Cy-F)≥0x(Cy-F)≥0y-1Dx-G≥0y(Dx-G)≥0

  1.  
    1. Задача «Борьба за рынки»

Фирма А намерена вложить средства (например, предложить партию товара), в рынки, контролируемые другой, более крупной компанией (Фирма В). Фирма В может воспрепятствовать этому, приняв предупредительные меры и затратив на это собственные средства. Не встречая противодействия, фирма А успешно реализует свой товар, при наличии препятствий – терпит убытки. Результаты определяются прибылью компаний согласно следующим принципам:

А=-1021-1, В=5-2-11.

Решение:

Как видим, в игре нет равновесия или доминирования в чистых стратегиях. Поэтому воспользуемся полученным выше условием. Для этого определяем константы.

С = a1=a11-a12-a21+a22=-10-2-1-1=-14

F = a12-a22=-3; D = 9; G =2.

Условие равновесия в игре определяется системой неравенств:

(x-1)(-14y+3)≥0x-14y+3≥0y-19x-2≥0y(9x-2)≥0. Рассмотрим вначале первые два неравенства:

x-1)(-14y+3)≥0x-14y+3≥0. Поскольку x∈0;1, возможны 3 случая: х=1, х=0, 0

Просмотров работы: 5303