Теория игр курс лекций. Смешанные стратегии и спорт

Бизнес идеи

Возникшая в сороковых годах XX века математическая теория игр чаще всего применяется именно в экономике. Но как с помощью концепции игр смоделировать поведение людей в обществе? Зачем экономисты изучают, в какой угол чаще бьют пенальти футболисты, и как выиграть в «Камень, ножницы, бумагу» в своей лекции рассказал старший преподаватель кафедры микроэкономического анализа ВШЭ Данил Федоровых.

Джон Нэш и блондинка в баре

Игра - это любая ситуация, в которой прибыль агента зависит не только от его собственных действий, но и от поведения остальных участников. Если вы раскладываете дома пасьянс, с точки зрения экономиста и теории игр, это не игра. Она подразумевает обязательное наличие столкновения интересов.

В фильме «Игры разума» о Джоне Нэше, нобелевском лауреате по экономике, есть сцена с блондинкой в баре. В ней показана идея, за которую ученый и получил премию, - это идея равновесия по Нэшу, которое он сам называл управляющей динамикой.

Игра - любая ситуация, в которой выигрыши агентов зависят друг от друга.

Стратегия - описание действий игрока во всех возможных ситуациях.

Исход - комбинация выбранных стратегий.

Итак, с точки зрения теории, игроками в этой ситуации являются только мужчины, то есть те, кто принимает решение. Их предпочтения просты: блондинка лучше брюнетки, а брюнетка лучше, чем ничего. Действовать можно двумя способами: пойти к блондинке или к «своей» брюнетке. Игра состоит из единственного хода, решения принимаются одновременно (то есть нельзя посмотреть, куда пошли остальные, и после походить самому). Если какая-то девушка отвергает мужчину, игра заканчивается: невозможно вернуться к ней или выбрать другую.

Каков вероятный финал этой игровой ситуации? То есть какова ее устойчивая конфигурация, из которой все поймут, что сделали лучший выбор? Во-первых, как правильно замечает Нэш, если все пойдут к блондинке, ничем хорошим это не кончится. Поэтому дальше ученый предполагает, что всем нужно пойти к брюнеткам. Но тогда, если известно, что все пойдут к брюнеткам, ему следует идти к блондинке, ведь она лучше.

В этом и заключается настоящее равновесие - исход, в котором один идет к блондинке, а остальные - к брюнеткам. Может показаться, что это несправедливо. Но в ситуации равновесия никто не может пожалеть о своем выборе: те, кто пойдут к брюнеткам, понимают, что от блондинки они все равно ничего б не получили. Таким образом, равновесие по Нэшу - это конфигурация, при которой никто по отдельности не хочет менять выбранную всеми стратегию. То есть, рефлексируя в конце игры, каждый участник понимает, что даже зная, как походят другие, он сделал бы то же самое. По-другому можно назвать это исходом, где каждый участник оптимальным образом отвечает на действия остальных.

«Камень, ножницы, бумага»

Рассмотрим другие игры на предмет равновесия. Например, в «Камне, ножницах, бумаге» нет равновесия по Нэшу: во всех ее вероятных исходах нет варианта, в котором оба участника были бы довольны своим выбором. Тем не менее, существует Чемпионат мира и World Rock Paper Scissors Society, собирающее игровую статистику. Очевидно, что вы можете повысить свои шансы на победу, если будете что-то знать об обычном поведении людей в этой игре.

Чистая стратегия в игре - это такая стратегия, при которой человек всегда играет одинаково, выбирая одни и те же ходы.

По данным World RPS Society, камень является самым часто выбираемым ходом (37,8%). Бумагу ставят 32,6%, ножницы - 29,6%. Теперь вы знаете, что нужно выбирать бумагу. Однако, если вы играете с тем, кто тоже это знает, вам уже не надо выбирать бумагу, потому что от вас ожидается то же самое. Есть знаменитый случай: в 2005 году два аукционных дома Sotheby“s и Christie”s решали, кому достанется очень крупный лот - коллекция Пикассо и Ван Гога со стартовой ценой в 20 миллионов долларов. Собственник предложил им сыграть в «Камень, ножницы, бумагу», и представители домов отправили ему свои варианты по электронной почте. Sotheby“s, как они позже рассказали, особо не задумываясь, выбрали бумагу. Выиграл Christie”s. Принимая решение, они обратились к эксперту - 11-летней дочери одного из топ-менеджеров. Она сказала: «Камень кажется самым сильным, поэтому большинство людей его выбирают. Но если мы играем не с совсем глупым новичком, он камень не выбросит, будет ожидать, что это сделаем мы, и сам выбросит бумагу. Но мы будем думать на ход вперед, и выбросим ножницы».

Таким образом, вы можете думать на ход вперед, но это не обязательно приведет вас к победе, ведь вы можете не знать о компетенции вашего соперника. Поэтому иногда вместо чистых стратегий правильнее выбирать смешанные, то есть принимать решения случайно. Так, в «Камне, ножницах, бумаге» равновесие, которое мы до этого не нашли, находится как раз в смешанных стратегиях: выбирать каждый из трех вариантов хода с вероятностью в одну третью. Если вы будете выбирать камень чаще, соперник скорректирует свой выбор. Зная это, вы скорректируете свой, и равновесия не выйдет. Но никто из вас не начнет менять поведение, если каждый просто будет выбирать камень, ножницы или бумагу с одинаковой вероятностью. Все потому что в смешанных стратегиях по предыдущим действиям невозможно предугадать ваш следующий ход.

Смешанные стратегии и спорт

Более серьезных примеров смешанных стратегий очень много. Например, куда подавать в теннисе или бить/принимать пенальти в футболе. Если вы ничего не знаете о вашем сопернике или просто постоянно играете против разных, лучшей стратегией будет поступать более-менее случайно. Профессор Лондонской школы экономики Игнасио Паласиос-Уэрта в 2003 году опубликовал в American Economic Review работу, суть которой заключалась в поиске равновесия по Нэшу в смешанных стратегиях. Предметом исследования Паласиос-Уэрта выбрал футбол и в связи с этим просмотрел более 1400 ударов пенальти. Разумеется, в спорте все устроено хитрее, чем в «Камне, ножницах, бумаге»: там учитывается сильная нога спортсмена, попадания в разные углы при ударе со всей силы и тому подобное. Равновесие по Нэшу здесь заключается в расчете вариантов, то есть, к примеру, определении углов ворот, в которые надо бить, чтобы выиграть с большей вероятностью, зная свои слабые и сильные стороны. Статистика по каждому футболисту и найденное в ней равновесие в смешанных стратегиях, показало, что футболисты поступают примерно так, как предсказывают экономисты. Вряд ли стоит утверждать, что люди, которые бьют пенальти, читали учебники по теории игр и занимались довольно непростой математикой. Скорее всего, есть разные способы научиться оптимально себя вести: можно быть гениальным футболистом, и чувствовать, что делать, а можно - экономистом, и искать равновесие в смешанных стратегиях.

В 2008 году профессор Игнасио Паласиос-Уэрта познакомился с Авраамом Грантом, тренером «Челси», который играл тогда в финале Лиги чемпионов в Москве. Ученый написал записку тренеру с рекомендациями по серии пенальти, которые касались поведения вратаря соперника - Эдвина ван дер Сара из «Манчестер Юнайтед». Например, по статистике, он почти всегда отбивал удары на среднем уровне и чаще бросался в естественную для пробивающего пенальти сторону. Как мы определили выше, правильнее все-таки рандомизировать свое поведение с учетом знаний о сопернике. Когда счет по пенальти был уже 6:5, Николя Анелька, нападающий «Челси», должен был забивать. Показывая перед ударом в правый угол, ван дер Сар будто спросил у Анелька, не собирается ли он бить туда.

Суть в том, что все предыдущие удары «Челси» были нанесены именно в правый от пробивающего угол. Мы не знаем точно почему, может быть, из-за консультации экономиста бить в неестественную для них сторону, ведь по статистике к этому менее готов ван дер Сар. Большинство футболистов «Челси» были правшами: ударяя в неестественный для себя правый угол, все они, кроме Терри, забивали. Видимо, стратегия была в том, чтобы Анелька пробил туда же. Но ван дер Сар, похоже, это понял. Он поступил гениально: показал в левый угол дескать «туда собрался бить?», от чего Анелька, наверное, пришел в ужас, ведь его разгадали. В последний момент он принял решение действовать по-другому, ударил в естественную для себя сторону, что и было нужно ван дер Сару, который взял этот удар и обеспечил «Манчестеру» победу. Эта ситуация учит случайному выбору, ведь в ином случае ваше решение может быть просчитано, и вы проиграете.

«Дилемма заключенного»

Наверное, самая известная игра, с которой начинаются университетские курсы о теории игр, - это «Дилемма заключенного». По легенде двух подозреваемых в серьезном преступлении поймали и заперли в разные камеры. Есть доказательство, что они хранили оружие, и это позволяет посадить их на какой-то небольшой срок. Однако доказательств, что они совершили это страшное преступление, нет. Каждому по отдельности следователь рассказывает об условиях игры. Если оба преступника сознаются, оба же сядут на три года. Если сознается один, а подельник будет молчать, сознавшийся выйдет сразу, а второго посадят на пять лет. Если, наоборот, первый не сознается, а второй его сдаст, первый сядет на пять лет, а второй выйдет сразу. Если же не сознается никто, оба сядут на год за хранение оружия.

Равновесие по Нэшу здесь заключается в первой комбинации, когда оба подозреваемых не молчат и оба садятся на три года. Рассуждения каждого таковы: «если я буду говорить, я сяду на три года, если молчать - на пять лет. Если второй будет молчать, мне тоже лучше говорить: не сесть лучше, чем сесть на год». Это доминирующая стратегия: говорить выгодно, независимо от того, что делает другой. Однако в ней есть проблема - наличие варианта получше, ведь сесть на три года хуже, чем сесть на год (если рассматривать историю только с точки зрения участников и не учитывать вопросы морали). Но сесть на год невозможно, ведь, как мы поняли выше, молчать обоим преступникам невыгодно.

Улучшение по Парето

Есть известная метафора про невидимую руку рынка, принадлежащая Адаму Смиту. Он говорил, что если мясник будет сам для себя стараться заработать деньги, от этого будет лучше всем: он сделает вкусное мясо, которое купит булочник на деньги от продажи булок, которые он, в свою очередь, тоже должен будет делать вкусными, чтобы они продавались. Но оказывается, эта невидимая рука не всегда работает, и таких ситуаций, когда каждый действует за себя, а всем плохо, очень много.

Поэтому иногда экономисты и специалисты по теории игр думают не об оптимальном поведении каждого игрока, то есть не о равновесии по Нэшу, а об исходе, при котором будет лучше всему обществу (в «Дилемме» общество состоит из двух преступников). С этой точки зрения, исход эффективен, когда в нем нет улучшения по Парето, то есть невозможно сделать кому-то лучше, не сделав при этом хуже другим. Если люди просто меняются товарами и услугами, это Парето-улучшение: они делают это добровольно, и вряд ли кому-то от этого плохо. Но иногда, если просто дать людям взаимодействовать и даже не вмешиваться, то, к чему они придут, не будет оптимальным по Парето. Это и происходит в «Дилемме заключенного». В ней, если мы даем каждому действовать так, как им выгодно, оказывается, что всем от этого плохо. Всем было бы лучше, если бы каждый действовал не оптимально для себя, то есть молчал.

Трагедия общины

«Дилемма заключенного» - это игрушечная стилизованная история. Вряд ли вы ожидаете оказаться в подобной ситуации, но похожие эффекты есть везде вокруг нас. Рассмотрим «Дилемму» с большим количеством игроков, ее иногда называют трагедией общины. Например, на дорогах - пробки, и я решаю, как ехать на работу: на машине или на автобусе. Это же делают остальные. Если я поеду на машине, и все решат сделать то же самое, будет пробка, но мы доедем с комфортом. Если я поеду на автобусе, пробка-то все равно будет, но ехать я буду некомфортно и не особо быстрее, поэтому такой исход еще хуже. Если же в среднем все ездят на автобусе, то я, сделав то же самое, довольно быстро доеду без пробки. Но если при таких условиях поехать на машине, я тоже доеду быстро, но еще и с комфортом. Итак, наличие пробки не зависит от моих действий. Равновесие по Нэшу здесь - в ситуации, когда все выбирают ехать на машине. Что бы не делали остальные, мне лучше выбрать машину, потому что будет там пробка или нет, неизвестно, но я в любом случае доеду с комфортом. Это доминирующая стратегия, поэтому в итоге все едут на машине, и мы имеем то, что имеем. Задача государства - сделать поездку на автобусе лучшим вариантом хотя бы для некоторых, поэтому появляются платные въезды в центр, парковки и так далее.

Другая классическая история - рациональное незнание избирателя. Представьте, что вы не знаете исход выборов заранее. Вы можете изучить программу всех кандидатов, послушать дебаты и после проголосовать за самого лучшего. Вторая стратегия - прийти на участок и проголосовать как попало или за того, кого чаще показывали по телевизору. Какое поведение оптимально, если от моего голоса никогда не зависит, кто выиграет (а в 140-миллионной стране один голос никогда ничего не решит)? Конечно, я хочу, чтобы в стране был хороший президент, но я же знаю, что никто больше не будет изучать программы кандидатов внимательно. Поэтому не тратить на это время - доминирующая стратегия поведения.

Когда вас призывают прийти на субботник, ни от кого в отдельности не будет зависеть, станет двор чистым или нет: если я выйду один, я не смогу убрать все, или, если выйдут все, то не выйду я, потому что все и без меня уберут. Другой пример - перевозка грузов в Китае, о котором я узнал в замечательной книге Стивена Ландсбурга «Экономист на диване». 100-150 лет назад в Китае был распространен способ перевозки грузов: все складывалось в большой кузов, который тащили семь человек. Заказчики платили, если груз доставлялся вовремя. Представьте, что вы - один из этих шести. Вы можете прилагать усилия, и тянуть изо всех сил, и если все будут так делать, груз доедет вовремя. Если кто-нибудь один так делать не будет, все тоже доедут вовремя. Каждый думает: «Если все остальные тянут как следует, зачем это делать мне, а если все остальные тянут не со всей силы, то я ничего не смогу изменить». В итоге, со временем доставки все было очень плохо, и сами грузчики нашли выход: они стали нанимать седьмого и платить ему деньги за то, чтобы он стегал лентяев плетью. Само наличие такого человека заставляло всех работать изо всех сил, потому что иначе все попадали в плохое равновесие, из которого никому в отдельности с выгодой не выйти.

Такой же пример можно наблюдать в природе. Дерево, растущее в саду, отличается от того, что растет в лесу, своей кроной. В первом случае она окружает весь ствол, во втором - находится только вверху. В лесу это является равновесием по Нэшу. Если бы все деревья договорились и выросли одинаково, они бы поровну распределили количество фотонов, и всем было бы лучше. Но никому в отдельности так делать невыгодно. Поэтому каждое дерево хочет вырасти немного выше окружающих.

Сommitment device

Во многих ситуациях одному из участников игры может понадобиться инструмент, который убедит остальных, что тот не блефует. Он называется commitment device. Например, закон некоторых стран запрещает платить выкуп похитителям людей, чтобы снизить мотивацию преступников. Однако это законодательство часто не работает. Если вашего родственника захватили, и у вас есть возможность спасти его, обойдя закон, вы это сделаете. Представим ситуацию, что закон можно обойти, но родственники оказались бедными и выкуп им платить нечем. У преступника в этой ситуации два пути: отпустить или убить жертву. Убивать он не любит, но тюрьму он не любит больше. Отпущенный пострадавший, в свою очередь, может либо дать показания, чтобы похититель был наказан, либо молчать. Самый лучший исход для преступника: отпустить жертву, которая его не сдаст. Жертва же хочет быть отпущенной и дать показания.

Равновесие здесь в том, что террорист не хочет быть пойманным, а значит, жертва погибает. Но это не равновесие по Парето, потому что существует вариант, при котором всем лучше - жертва на свободе хранит молчание. Но для этого надо сделать так, чтобы молчать ей было выгодно. Где-то я прочитал вариант, когда она может попросить террориста устроить эротическую фотосессию. Если преступника посадят, его подельники выложат фотографии в интернет. Теперь, если похититель останется на свободе - это плохо, но фотографии в открытом доступе - еще хуже, поэтому получается равновесие. Для жертвы это способ остаться в живых.

Другие примеры игр:

Модель Бертрана

Раз уж мы говорим об экономике, рассмотрим экономический пример. В модели Бертрана два магазина продают один и тот же товар, покупая его у производителя по одной цене. Если цены в магазинах одинаковы, то примерно одинакова и их прибыль, ведь тогда покупатели выбирают магазин случайно. Единственное равновесие по Нэшу здесь - продавать товар по себестоимости. Но магазины хотят зарабатывать. Поэтому если один поставит цену 10 рублей, второй снизит ее на копейку, увеличив тем самым свою выручку вдвое, так как к нему уйдут все покупатели. Поэтому участникам рынка выгодно снижать цены, распределяя тем самым прибыль между собой.

Разъезд на узкой дороге

Рассмотрим примеры выбора между двумя возможными равновесиями. Представьте, что Петя и Маша едут навстречу друг другу по узкой дороге. Дорога настолько узкая, что им обоим нужно съехать на обочину. Если они решат повернуть налево или направо от себя, они просто разъедутся. Если же один повернет направо, а другой налево от себя, или наоборот, случится авария. Как выбрать, куда съехать? Чтобы помогать искать равновесие в подобных играх, существуют, например, правила дорожного движения. В России каждому нужно повернуть направо.

В забаве Chiken, когда два человека едут на большой скорости навстречу друг другу, тоже есть два равновесия. Если оба сворачивают на обочину, возникает ситуация, которая называется Chiken out, если оба не сворачивают, то погибают в страшной аварии. Если я знаю, что мой соперник едет прямо, мне выгодно съехать, чтобы выжить. Если я знаю, что мой соперник съедет, то мне выгодно ехать прямо, чтобы после получить 100 долларов. Сложно предсказать, что случится на самом деле, однако, у каждого из игроков есть свой метод выиграть. Представьте, что я закрепил руль так, что его нельзя повернуть, и показал это своему сопернику. Зная, что у меня нет выбора, соперник отскочит.

QWERTY-эффект

Иногда бывает очень сложно перейти из одного равновесия в другое, даже если оно означает пользу для всех. Раскладка QWERTY была создана, чтобы замедлить скорость печати. Поскольку если бы все печатали слишком быстро, головки печатной машинки, которые бьют по бумаге, цеплялись бы друг за друга. Поэтому Кристофер Шоулз разместил часто стоящие рядом буквы на максимально далеком расстоянии. Если вы зайдете в настройки клавиатуры на своем компьютере, вы сможете выбрать там раскладку Dvorak и печатать гораздо быстрее, так как сейчас нет проблемы аналоговых печатных машин. Дворак рассчитывал, что мир перейдет на его клавиатуру, но мы по-прежнему живем с QWERTY. Конечно, если бы мы перешли на раскладку Дворака, будущее поколение было бы нам благодарно. Все мы приложили бы усилия и переучились, в результате вышло бы равновесие, в котором все печатают быстро. Сейчас мы тоже в равновесии - в плохом. Но никому не выгодно быть единственным, кто переучится, потому что за любым компьютером, кроме личного, работать будет неудобно.

1. Бузуверова Н.В., Дьяченко М.Е. Отечественная история: вопросы и ответы. Учебное пособие. Магнитогорск: ГОУ ВПО «МГТУ», 2006.

2. Мунчаев Ш.М., Устинов В.М. История России. Учебник для вузов. М., 2005.

3. История России с древнейших времен до конца XX в.: Учебное пособие для студентов вузов. М., 2007.

4. _______________________________________________________________________

5. _______________________________________________________________________

Уважаемые студенты.

Вам нужно прочитать лекции, разобраться в них и выполнить задания-примеры (стр. 17) в EXCEL. Это и будет Ваша контрольная работа. Результаты оформить как обычную контрольную с выводом рабочих листов на бумажный носитель (изменить размер и типы шрифта). Каждый будет защищать свою контрольную индивидуально. Можно сбросить программы с решением на флешку.

ЛЕКЦИИ ПО ТЕОРИИ ИГР

Теория игр в контексте теории принятия решений

Рассмотренные до сих пор задачи формулировались и решались, в основном, в предположении наличия полной информации. Их можно отнести к совокупности задач принятия решений в условиях определенности. В реальных экономических условиях, однако, часто приходится действовать при ограниченности, неточности исходной информации о самом объекте и внешней среде, в которой он функционирует.

При принятии управленческих решений, влияющих на функционирование и развитие экономического объекта, необходимо учитывать важнейшую характеристику внешней среды – неопределенность.

Под неопределенностью следует понимать отсутствие, неполноту, недостаточность информации об объекте, процессе, явлении или неуверенность в достоверности информации. В экономической сфере имеется множество источников возникновения неопределенности для систем самого различного уровня сложности и масштабов.

Неопределенность обуславливает появление ситуаций, не имеющих однозначного исхода (решения). Среди тех из них, с которыми в процессе производства сталкиваются предприятия, особое место занимают ситуации риска.

Ситуации риска сопутствуют три условия:

· наличие неопределенности;

· необходимость выбора альтернативы;

· возможность оценить вероятность осуществления выбираемых альтернатив.

Таким образом, ситуация риска характеризуется возможностью количественного и качественного определения степени вероятности того или иного варианта развития событий.

Экономический риск предстает в виде совокупности вероятных экономических, политических, нравственных и других последствий (как благоприятных, так и неблагоприятных), которые могут наступить при реализации выбранных решений.

Существуют различные виды неопределенности, в частности:

· количественная, обусловленная значительным числом объектов или элементов в ситуации;

· информационная, вызванная недостатком информации или ее неточностью по техническим, социальным и другим причинам;

· стоимостная из-за слишком дорогой или недоступной платы за определенность;

· профессиональная как следствие недостаточного профессионализма ЛПР (не учитывается, например, требуемое количество влияющих факторов);

· ограничительная (вызванная ограничениями в ситуации принятия решений, например ограничения по времени и др.);

· внешней среды, связанная с поведением среды или реакцией конкурента на процесс принятия решения.

Природа риска в рыночной экономике обусловлена следующими факторами:

· ограниченной сферой государственного регулирования хозяйственной деятельности;

· усилением роли случайных факторов во взаимодействии предприятия с внешней средой;

· частной (и ее видами) собственностью предпринимателя, ее владением, пользованием, распоряжением;

· конкурентной борьбой товаропроизводителей и других хозяйствующих субъектов;

· всеобъемлющим характером риска, распространяющимся на сферы общественной жизни, как производственную, так и непроизводственную. Он имеет место на этапах производства, продажи, закупки и др.

Рыночные отношения порождают различные виды рисковых ситуаций, более того, в работе предприятий риск становится необходимым и обязательным компонентом.

Для иллюстрации различия между ситуациями, когда приходится принимать решения в условиях риска или в условиях неопределенности, рассмотрим задачу оптимального выбора ассортимента выпускаемой продукции. В условиях риска доход от реализации единицы продукции не является фиксированной величиной. Это – случайная величина, точное численное значение которой неизвестно, но описывается с помощью известной функции распределения .

В условиях неопределенности функция распределения неизвестна. Вообще говоря, неопределенность не означает полного отсутствия информации о задаче. Например, может принимать некоторое число определенных значений, но вероятности этих значений неизвестны.

Таким образом, с точки зрения полноты исходных данных определенность и неопределенность представляют два крайних случая, а риск определяет промежуточную ситуацию.

Уровень имеющейся информации о проблеме определяет, каким образом может быть формализована и решена задача принятия решения.

При решении задач в условиях неопределенности внешней среды наиболее часто возникают две ситуации. При первой сама система препятствует принятию решений (задачи “природной неопределенности” – например, задача производства сельскохозяйственной продукции на некоторой территории, когда неизвестны погодные условия предстоящего сезона). В этой ситуации природа может рассматриваться как доброжелательный противник, в том смысле, что она не преследует целей, противоположных целям человека.

Во второй ситуации возможно наличие конкуренции, когда два или более участника находятся в конфликте, и каждый стремится, как можно больше, выиграть у конкурента (конкурентов). В этом случае лицу, принимающему решения, противостоит мыслящий противник. Для ситуаций этого типа (называемых конфликтными) характерно, что эффективность решений, принимаемой каждой из сторон, существенно зависит от действий другой стороны. При этом ни одна из сторон не может полностью контролировать положение. Например, при определении объема выпуска продукции на одном предприятии нельзя не учитывать размеров выпуска аналогичной продукции на других предприятиях. В реальных условиях часто также возникают ситуации, в которых антагонизм отсутствует, но необходимо учитывать противоположные тенденции. Например, для нормального функционирования производства, с одной стороны, необходимо наличие запасов разнообразных ресурсов, но с другой, их хранение вызывает появление дополнительных расходов.

Раздел математики, изучающий конфликтные ситуации на основе их математических моделей, называется теорией игр . Можно также сказать, что теория игр - математическая теория конфликтных ситуаций, разрабатывающая рекомендации по наиболее рациональному образу действий каждого из участников в ходе конфликтной ситуации, т.е. таких действий, которые обеспечивали бы ему наилучший результат.

Игровые схемы можно применять во многих экономических ситуациях. Выигрышем могут при этом выступать величина прибыли, себестоимость, эффективность использования дефицитных ресурсов, производственных фондов, и т.д.

Существенным обстоятельством является то, что методы и рекомендации теории игр разработаны применительно к таким конфликтным ситуациям, которые обладают свойством многократной повторяемости. Если конфликтная ситуация реализуется однократно или ограниченное число раз, то рекомендации теории игр становятся малоэффективными.

Анализ реальной конфликтной ситуации требует ее существенного (иногда радикального) упрощения – учета лишь наиболее существенных для конфликта факторов. В связи с этим, можно рассматривать игру как упрощенную математическую модель конфликтной ситуации, характеризующуюся наличием определенных правил. Эти правила устанавливают:

· выбор образа действия игроков на каждом этапе игры;

· информацию, которой обладает каждый игрок при осуществлении таких выборов;

· плату для каждого игрока после завершения любого этапа игры.

Стратегией игры называется совокупность правил, определяющих поведение игрока на протяжении всей игры. Стратегии каждого игрока определяют результаты или платежи в игре; при этом каждый игрок имеет некоторое множество (конечное или бесконечное) возможных стратегий.

К числу определяющих характеристик игр можно отнести следующие:

· имеется конфликтующих сторон (игроков), принимающих решения, интересы которых не совпадают;

· сформулированы правила выбора допустимых стратегий, известные игрокам;

· определен набор возможных конечных состояний игры (например, выигрыш, проигрыш, ничья);

· всем участникам игры (игрокам) заранее известны платежи, соответствующие каждому возможному конечному состоянию.

Конфликтные ситуации, встречающиеся в практике, порождают различные виды игр. Классификация игр возможна по разным признакам.

А) По количеству игроков. В игре может принимать участие любое конечное число игроков. Если игроков всего двое, или игроки объединяются в две группы, преследующие противоположные цели, то имеет место парная игра. В зависимости от количества стратегий в игре они делятся на конечные и бесконечные.

Б) В зависимости от взаимоотношений участников различают бескоалиционные (участники не имеют права заключать соглашения) и коалиционные игры (иногда используются синонимы – некооперативные и кооперативные игры соответственно).

В) По характеру выигрышей игры делятся на игры с нулевой суммой и ненулевой суммой. В играх с нулевой суммой общий капитал игроков не меняется, а лишь перераспределяется в ходе игры, в связи с чем сумма выигрышей равна нулю (при этом проигрыш рассматривается как отрицательный выигрыш). В играх с ненулевой суммой сумма выигрышей отлична от нуля.

Г) По виду функции выигрыша игры делятся на матричные, биматричные и др. В матричных играх (при двух участниках) выигрыши первого игрока задаются матрицей, в биматричных – выигрыши каждого игрока задаются своей матрицей.

Д) По количеству ходов игры делятся на одноходовые (выигрыш распределяется после одного хода каждого игрока) и многоходовые (выигрыш распределяется после нескольких ходов).

Стратегия игрока называется оптимальной, если она обеспечивает данному игроку при многократном повторении игры максимально возможный средний выигрыш или минимально возможный средний проигрыш, независимо от поведения противника.

В дальнейшем мы ограничимся рассмотрением парных матричных игр с нулевой суммой. Задание стратегий двух игроков в парной игре такого типа полностью определяет ее исход, т.е. выигрыш одного или проигрыш другого. Как уже отмечалось, результаты конечной парной игры с нулевой суммой можно задавать матрицей, строки и столбцы которой соответствуют различным стратегиям 1-го и 2-го игроков соответственно, а ее элементы - выигрышам одной стороны (равные проигрышам другой). Эта матрица называется платежной матрицей или матрицей игры.

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение

Костромской государственный университет имени Н.А. Некрасова

Скаржинская Е.М., Илюхина А.С., Метелькова К.С.

Теория игр для экономистов

Кострома

Скаржинская Е.М., Илюхина А.С., Метелькова К.С. Теория игр: конспект лекций с методическими указаниями: Учебное пособие. – Кострома. 2008. –90с.

Рецензенты:

Землякова И.В., доктор технических наук, профессор

Цуриков В.И., доктор экономических наук, профессор

Настоящее учебное пособие разработано доктором экономических наук, профессором Скаржинской Е.М. и сотрудниками кафедры «Математические методы в экономике». Пособие предназначено для аспирантов и студентов экономических специальностей.

Глава 1. Введение.

§1.1. Предмет теории игр 4

§1.2. Формальное описание игры. 10

§1.3. Классификация игр 11

Глава 2. Бескоалиционные игры

§2.1. Антагонистические игры

§2.1.1. Понятие антагонистической игры. Матричная игра 13

§2.1.2. Доминирование стратегий. Редукция игры. 14

Решение игры в доминирующих стратегиях

§2.1.3. Решение игры в чистых стратегиях 16

§2.1.4. Смешанное расширение игры 22

§2.1.5. Решение игры в смешанных стратегиях 28

§2.1.6. Игра против природы 31

§2.1.7. Критерии оптимальности решения в

условиях неопределённости 32

§2.1.8 Критерий Лапласа 33

§2.1.9. Критерий Вальда (максиминный критерий) 34

§2.1.10. Критерий Гурвица (критерий взвешенного

оптимизма /пессимизма) 35

§2.1.11. Критерий Сэвиджа (критерий наименьших

сожалений) 36

§2.1.12. Решение игры против природы в смешанных

стратегиях 37

§ 2.2 Неантагонистические игры

§2.2.1. Понятие неантагонистической игры 40

§2.2.2. Биматричные игры 42

§2.2.3. Равновесие Нэша 44

§2.2.4. Эффективность по Парето 48

§2.2.5. Повторяющиеся игры. Применение к микроэкономике 49

§2.2.6. Последовательные игры 54

Глава 3. Кооперативные решения

§3.1. Понятие коалиционной игры 62

§3.2. Определение решения игры 65

§3.3. Эффективность обмена. Ящик Эджворта 66

§3.4. Арбитражное решение 72

Практикум 79

Литература 93

Введение

§1.1. Предмет теории игр

Любой процесс в экономике происходит при активном взаимодействии людей, стремящихся реализовать собственные цели, имеющих собственные интересы, оценивающих результаты процесса с точки зрения своих интересов. Интересы участников экономического взаимодействия часто не совпадают. Результаты, которые выгодны одним участникам, могут быть не выгодны другим. Так, например, продавцы заинтересованы в увеличении выручки, а покупатели заинтересованы в понижении цены; наемные работники заинтересованы в повышении заработной платы, что снижает прибыль нанимателей. Перечисленные ситуации имеют общее свойство – наблюдается конфликт интересов участников, т.е. лиц, от которых зависит конечный результат экономического процесса.

Конфликт присутствует в принятии решений даже в том случае, когда решение принимает одно лицо. Например, человек собирается купить квартиру и руководствуется четырьмя критериями: квартира должна быть недорогой, удобно расположенной, иметь хорошее качество, быть удачно спланированной. При выборе из множества предлагаемых вариантов покупатель видит, что одни варианты лучше других по критерию цены, но уступают по критерию расположения, и т.д. В данном случае выбор варианта осложняется конфликтом целей , которые ставит покупатель при покупке жилья.

Принятие решений еще более усложняется, если результат, который получает некоторое лицо, зависит не только от принимаемого им решения, но и от решений, которые принимают другие лица. Например, цена товара на рынке, где предложение поступает от нескольких продавцов, зависит от того, какую рыночную стратегию (объем предложения и назначенная цена) выберет каждый продавец. Таким образом, каждый участник, выбирая те или иные действия (т.е. выбирая свою стратегию ), воздействует на конечный результат, т.е. на цену и объем реализации, и в конечном итоге на выручку всех продавцов.

Многообразие ситуаций принятия решений в экономике и в других сферах имеет три общие черты, которые можно сформулировать в виде трех принципов:

1. Конечный результат зависит от выбора решений несколькими лицами (которых мы будем называть участниками игры ). Этот принцип носит название «совместность действий» .

2. Принцип, согласно которому возникает конфликт между участниками какого-либо общего процесса из-за несовпадения их интересов, носит название «конфликт интересов» .

3. Участник экономического процесса стоит перед выбором решения, которое в наибольшей степени должно соответствовать его интересам Для выбора разумного (т.е. рационального) решения, участник должен осознавать, что другие участники имеют собственные интересы, а значит, будут выбирать решения, которые выгодны им. Принцип, согласно которому каждый участник конфликта принимает наиболее эффективные для достижения своих интересов решения, учитывая возиможные действия других участников, называется принципом рациональности .

Легко заметить, что эти три принципа характерны для любой конфликтной ситуации не только в экономике. Примерами конфликтов служат спортивные состязания, политическая борьба, карточные игры, трудовые отношения, рыночное ценообразование, конкуренция, цена акций и т.п. Все эти разнообразные конфликтные ситуации допускают общие формализованные описания и анализ с помощью математических методов. Формализованное описание конфликта (т.е. его математическая модель) называется игрой (The Game ). Теория игр является разделом математики, в котором изучаются математические модели конфликтов.

Конфликты и возможности математического анализа вариантов их разрешения, предсказания их исходов давно привлекают внимание математиков. Зарождение теории игр как математической дисциплины можно отнести к письму Б. Паскаля к П. Ферма от 29 июля 1654 года, которое принято считать началом математической теории вероятностей. В дальнейшем отдельные математические вопросы, которые можно отнести к теоретико-игровым, рассматривались многими учеными. Объектом изучения вначале были азартные и карточные игры. Вальдеграв нашел оптимальные смешанные стратегии в игре «проходящий туз» (1712 год), Д. Бернулли проанализировал «петербургскую игру» (1732 год), П. Лаплас рассмотрел принципы оптимальности (1814 год), Ж. Бертран представил теоретико-игровой подход к игре в баккара (1888 год), в 1911 году Э. Цермело описал теоретико-игровой подход к шахматной игре.

Систематическое изучение матричных игр началось с работы Э. Бореля (1921 г.), содержащей доказательство существования оптимальных смешанных стратегий для некоторых случаев игры..

В XX веке теория игр получила энергичное развитие, вызванное не только теоретическим интересом математиков, но и запросами прикладных задач экономики и техники. По сути, математическая теория игр была детально разработана американскими учеными Дж. Нейманом и О. Моргенштерном в известной работе «Теория игр и экономическое поведение» (1944 год) как средство математического подхода к явлениям конкурентной экономики.

Вторая половина XX века отмечена важнейшими результатами в теории игр и ее применением в самых разнообразных сферах, прежде всего в экономике, политике и военном деле. Понятие равновесия , имеющее центральное значение в теории игр, сформулировано выдающимся математиком и экономистом Дж. Нэшем, им же доказана теорема существования равновесия в бескоалиционной игре (теорема Нэша ). Дж. Нейман и О. Моргенштерн получили первое из решений для коалиционных игр, Н-М решение . Современная теория коалиционных игр, на основе которых моделируются политические и экономические процессы, сложилась благодаря работам Л.С. Шепли. Р. Аумана, А.И. Соболева. Общее определение игры и исчерпывающую классификацию игр впервые дал выдающийся российский математик Н.Н. Воробьев. Значительный вклад в развитие теории игр внесли российские Е.Б. Яновская, Ю.Б. Гермейер, Э. Вилкас, Г.Н. Дюбин и В.Г. Суздаль.

В ходе своего развития теория игр превратилась в общую математическую теорию конфликтов . В рамках теории игр поддаются математическому описанию военные и правовые конфликты, спортивные состязания, а также явления, связанные с биологической борьбой за существование. Теория игр позволяет формализовать некоторые важные аспекты принятия решений в технике, сельском хозяйстве, медицине и социологии. Проблемы управления, планирования и прогнозирования также часто решаются с помощью сценарного подхода, разрабатываемого с применением теории игр.

Как всякая математическая модель, игра создается с определенными целями, для того, чтобы ответить на определенные вопросы. Формулировка некоторых вопросов, на которые должен ответить анализ игры, очевидна – например, как должен действовать участник игры, стремящийся получить наибольший выигрыш? Или – как должен действовать игрок, стремящийся обезопасить себя от наибольших потерь? На языке теории игр вопросы подобного рода формулируются следующим образом. И чем (каким исходом) закончится игра, если все участники выберут свои оптимальные стратегии? Имеют ли игроки оптимальные стратегии? Существуют ли в данной игре исходы, которые выгодны всем игрокам? Будут ли все участники стремиться именно к этим исходам?

Заметим, что анализ игры способен дать ответы далеко не на все вопросы. Так, например, часто нет ответа на «детский» вопрос – чем закончится данная игра, или кто будет победителем? Дело в том, что, во-первых, исход игры может зависеть от случайных факторов, во-вторых, некоторые игры имеют несколько решений, в-третьих, реальные участники игры могут действовать не вполне рационально, т.е. не принимать оптимальные решения.

Каждый этюд начинается с понятной непрофессионалу проблемы. В одних случаях это просто "детская игра", в других - формализованное жизненное наблюдение, в третьих - обобщённая социальная закономерность. Сюжет затем разворачивается, исходя из логики содержащегося в нём конфликта, и сам порождает тот или иной принцип разрешения конфликта, который окончательно строго формализуется в виде решения игры.

Этюдов всего рассмотрено чуть более десяти, и они в совокупности покрывают основные формальные конструкции базовой теории игр.

В нескольких отступлениях приведены формулировки теорем существования игровых решений с набросками доказательств.

Информационные ресурсы

Захаров А.В.
Теория игр в общественных науках. М.: препринт НИУ ВШЭ, 2014
Данилов В.И., Лекции по теории игр. М.: препринт РЭШ, 2002
Петросян Л.А., Зенкевич Н.А., Шевкопляс Е.В.
Теория игр, Санкт-Петербург (БВХ-Петербург) 2012 г.
Мазалов В.
Математическая теория игр и приложения, Санкт-Петербург, Лань, 2010 г.
Меньшиков И. Лекции по теории игр и экономическому моделированию, М.: Контакт Плюс 2010 г.
Губко М., Новиков Д.
Теория игр в управлении организационными системами, М: Синтег, 2002 г.

Требования

Курс построен так, что будет по плечу даже тем, кто изучал математику последний раз только в школе. Однако, для понимания всех утверждений курса рекомендуется знать линейную алгебру и математический анализ в рамках базовых университетских курсов. Также полезно будет знать теорию вероятностей.

Программа курса

1. Позиционные игры
Дерево игры. Выигрышные и проигрышные позиции. Существование выигрышной стратегии у одного из игроков. Игра «ним» и выигрышные стратегии в ней.

2. Статические игры
Статические игры: игроки, стратегии, платежи. Примеры игр: «дилемма заключённого», «семейный спор», «пенальти». Доминирующие и доминируемые стратегии. Решение игр по доминированию. Понятие равновесия Нэша. Несоответствие равновесия и оптимума. Смешанные стратегии. Смешанное равновесие Нэша. Равновесие в игре «пионеры и вожатый». Приложения равновесий Нэша в экономике. Модели олигополий Курно и Бертрана. Статические игры с неполной информацией. Равновесие Байеса-Нэша.

3. Динамические игры
Динамические игры с полной информацией. Равновесие Нэша, совершенное на подыграх, и его соотношение с обычным равновесием. Теорема Куна. Динамические игры с неполной информацией. Информационные множества. Условие совершенной памяти. Равновесие Байеса. Игры сигнализирования. Смешивающее и разделяющее равновесия. Повторяющиеся игры.

4. Кооперативные игры
Кооперативные игры с трансферабельной полезностью. Определение игры, доступные дележи, ядро и вектор Шепли. Игра «Аэропорт». Устойчивые паросочетания. Алгоритм Гейла-Шепли.

5. Приложения теории игр
Механизмы голосования. Требования к ним. Теорема Эрроу о невозможности построения неманипулируемой системы выборов. Концепция рекуррентной устойчивости. Модель Асемоглу-Егорова-Сонина внутренней устойчивости авторитарных систем. Элементы теории аукционов. Равновесные стратегии в аукционах первой и второй цены.

Результаты обучения

В результате изучения дисциплины студент должен:

знать:
- классификацию игр;
- основы моделирования розыгрышей игр;
- основные принципы решения игр;
уметь:
- применять имеющиеся знания для решения практических задач
- применять новые технологии анализа экономических систем;
иметь представление:
- о формировании стратегий, платежах, цене игры;
- об основах рационального поведения, правилах справедливого дележа;
- о взаимосвязи дисциплины с другими смежными дисциплинами;

Формируемые компетенции

способность к восприятию, обобщению, анализу информации, постановке цели и выбору путей её достижения (ОК-6)
способность использовать основные законы естественнонаучных дисциплин в профессиональной деятельности, применять методы математического анализа и моделирования, теоретического и экспериментального исследования (ОК-11)
способность использовать основные положения и методы гуманитарных и социально-экономических наук при решении профессиональных задач (ПК-12)