Решение нэша онлайн. Равновесие по нэшу в чистых и смешанных стратегиях

Возникшая в сороковых годах XX века математическая теория игр чаще всего применяется именно в экономике. Но как с помощью концепции игр смоделировать поведение людей в обществе? Зачем экономисты изучают, в какой угол чаще бьют пенальти футболисты, и как выиграть в «Камень, ножницы, бумагу» в своей лекции рассказал старший преподаватель кафедры микроэкономического анализа ВШЭ Данил Федоровых.

Джон Нэш и блондинка в баре

Игра - это любая ситуация, в которой прибыль агента зависит не только от его собственных действий, но и от поведения остальных участников. Если вы раскладываете дома пасьянс, с точки зрения экономиста и теории игр, это не игра. Она подразумевает обязательное наличие столкновения интересов.

В фильме «Игры разума» о Джоне Нэше, нобелевском лауреате по экономике, есть сцена с блондинкой в баре. В ней показана идея, за которую ученый и получил премию, - это идея равновесия по Нэшу, которое он сам называл управляющей динамикой.

Игра - любая ситуация, в которой выигрыши агентов зависят друг от друга.

Стратегия - описание действий игрока во всех возможных ситуациях.

Исход - комбинация выбранных стратегий.

Итак, с точки зрения теории, игроками в этой ситуации являются только мужчины, то есть те, кто принимает решение. Их предпочтения просты: блондинка лучше брюнетки, а брюнетка лучше, чем ничего. Действовать можно двумя способами: пойти к блондинке или к «своей» брюнетке. Игра состоит из единственного хода, решения принимаются одновременно (то есть нельзя посмотреть, куда пошли остальные, и после походить самому). Если какая-то девушка отвергает мужчину, игра заканчивается: невозможно вернуться к ней или выбрать другую.

Каков вероятный финал этой игровой ситуации? То есть какова ее устойчивая конфигурация, из которой все поймут, что сделали лучший выбор? Во-первых, как правильно замечает Нэш, если все пойдут к блондинке, ничем хорошим это не кончится. Поэтому дальше ученый предполагает, что всем нужно пойти к брюнеткам. Но тогда, если известно, что все пойдут к брюнеткам, ему следует идти к блондинке, ведь она лучше.

В этом и заключается настоящее равновесие - исход, в котором один идет к блондинке, а остальные - к брюнеткам. Может показаться, что это несправедливо. Но в ситуации равновесия никто не может пожалеть о своем выборе: те, кто пойдут к брюнеткам, понимают, что от блондинки они все равно ничего б не получили. Таким образом, равновесие по Нэшу - это конфигурация, при которой никто по отдельности не хочет менять выбранную всеми стратегию. То есть, рефлексируя в конце игры, каждый участник понимает, что даже зная, как походят другие, он сделал бы то же самое. По-другому можно назвать это исходом, где каждый участник оптимальным образом отвечает на действия остальных.

«Камень, ножницы, бумага»

Рассмотрим другие игры на предмет равновесия. Например, в «Камне, ножницах, бумаге» нет равновесия по Нэшу: во всех ее вероятных исходах нет варианта, в котором оба участника были бы довольны своим выбором. Тем не менее, существует Чемпионат мира и World Rock Paper Scissors Society, собирающее игровую статистику. Очевидно, что вы можете повысить свои шансы на победу, если будете что-то знать об обычном поведении людей в этой игре.

Чистая стратегия в игре - это такая стратегия, при которой человек всегда играет одинаково, выбирая одни и те же ходы.

По данным World RPS Society, камень является самым часто выбираемым ходом (37,8%). Бумагу ставят 32,6%, ножницы - 29,6%. Теперь вы знаете, что нужно выбирать бумагу. Однако, если вы играете с тем, кто тоже это знает, вам уже не надо выбирать бумагу, потому что от вас ожидается то же самое. Есть знаменитый случай: в 2005 году два аукционных дома Sotheby“s и Christie”s решали, кому достанется очень крупный лот - коллекция Пикассо и Ван Гога со стартовой ценой в 20 миллионов долларов. Собственник предложил им сыграть в «Камень, ножницы, бумагу», и представители домов отправили ему свои варианты по электронной почте. Sotheby“s, как они позже рассказали, особо не задумываясь, выбрали бумагу. Выиграл Christie”s. Принимая решение, они обратились к эксперту - 11-летней дочери одного из топ-менеджеров. Она сказала: «Камень кажется самым сильным, поэтому большинство людей его выбирают. Но если мы играем не с совсем глупым новичком, он камень не выбросит, будет ожидать, что это сделаем мы, и сам выбросит бумагу. Но мы будем думать на ход вперед, и выбросим ножницы».

Таким образом, вы можете думать на ход вперед, но это не обязательно приведет вас к победе, ведь вы можете не знать о компетенции вашего соперника. Поэтому иногда вместо чистых стратегий правильнее выбирать смешанные, то есть принимать решения случайно. Так, в «Камне, ножницах, бумаге» равновесие, которое мы до этого не нашли, находится как раз в смешанных стратегиях: выбирать каждый из трех вариантов хода с вероятностью в одну третью. Если вы будете выбирать камень чаще, соперник скорректирует свой выбор. Зная это, вы скорректируете свой, и равновесия не выйдет. Но никто из вас не начнет менять поведение, если каждый просто будет выбирать камень, ножницы или бумагу с одинаковой вероятностью. Все потому что в смешанных стратегиях по предыдущим действиям невозможно предугадать ваш следующий ход.

Смешанные стратегии и спорт

Более серьезных примеров смешанных стратегий очень много. Например, куда подавать в теннисе или бить/принимать пенальти в футболе. Если вы ничего не знаете о вашем сопернике или просто постоянно играете против разных, лучшей стратегией будет поступать более-менее случайно. Профессор Лондонской школы экономики Игнасио Паласиос-Уэрта в 2003 году опубликовал в American Economic Review работу, суть которой заключалась в поиске равновесия по Нэшу в смешанных стратегиях. Предметом исследования Паласиос-Уэрта выбрал футбол и в связи с этим просмотрел более 1400 ударов пенальти. Разумеется, в спорте все устроено хитрее, чем в «Камне, ножницах, бумаге»: там учитывается сильная нога спортсмена, попадания в разные углы при ударе со всей силы и тому подобное. Равновесие по Нэшу здесь заключается в расчете вариантов, то есть, к примеру, определении углов ворот, в которые надо бить, чтобы выиграть с большей вероятностью, зная свои слабые и сильные стороны. Статистика по каждому футболисту и найденное в ней равновесие в смешанных стратегиях, показало, что футболисты поступают примерно так, как предсказывают экономисты. Вряд ли стоит утверждать, что люди, которые бьют пенальти, читали учебники по теории игр и занимались довольно непростой математикой. Скорее всего, есть разные способы научиться оптимально себя вести: можно быть гениальным футболистом, и чувствовать, что делать, а можно - экономистом, и искать равновесие в смешанных стратегиях.

В 2008 году профессор Игнасио Паласиос-Уэрта познакомился с Авраамом Грантом, тренером «Челси», который играл тогда в финале Лиги чемпионов в Москве. Ученый написал записку тренеру с рекомендациями по серии пенальти, которые касались поведения вратаря соперника - Эдвина ван дер Сара из «Манчестер Юнайтед». Например, по статистике, он почти всегда отбивал удары на среднем уровне и чаще бросался в естественную для пробивающего пенальти сторону. Как мы определили выше, правильнее все-таки рандомизировать свое поведение с учетом знаний о сопернике. Когда счет по пенальти был уже 6:5, Николя Анелька, нападающий «Челси», должен был забивать. Показывая перед ударом в правый угол, ван дер Сар будто спросил у Анелька, не собирается ли он бить туда.

Суть в том, что все предыдущие удары «Челси» были нанесены именно в правый от пробивающего угол. Мы не знаем точно почему, может быть, из-за консультации экономиста бить в неестественную для них сторону, ведь по статистике к этому менее готов ван дер Сар. Большинство футболистов «Челси» были правшами: ударяя в неестественный для себя правый угол, все они, кроме Терри, забивали. Видимо, стратегия была в том, чтобы Анелька пробил туда же. Но ван дер Сар, похоже, это понял. Он поступил гениально: показал в левый угол дескать «туда собрался бить?», от чего Анелька, наверное, пришел в ужас, ведь его разгадали. В последний момент он принял решение действовать по-другому, ударил в естественную для себя сторону, что и было нужно ван дер Сару, который взял этот удар и обеспечил «Манчестеру» победу. Эта ситуация учит случайному выбору, ведь в ином случае ваше решение может быть просчитано, и вы проиграете.

«Дилемма заключенного»

Наверное, самая известная игра, с которой начинаются университетские курсы о теории игр, - это «Дилемма заключенного». По легенде двух подозреваемых в серьезном преступлении поймали и заперли в разные камеры. Есть доказательство, что они хранили оружие, и это позволяет посадить их на какой-то небольшой срок. Однако доказательств, что они совершили это страшное преступление, нет. Каждому по отдельности следователь рассказывает об условиях игры. Если оба преступника сознаются, оба же сядут на три года. Если сознается один, а подельник будет молчать, сознавшийся выйдет сразу, а второго посадят на пять лет. Если, наоборот, первый не сознается, а второй его сдаст, первый сядет на пять лет, а второй выйдет сразу. Если же не сознается никто, оба сядут на год за хранение оружия.

Равновесие по Нэшу здесь заключается в первой комбинации, когда оба подозреваемых не молчат и оба садятся на три года. Рассуждения каждого таковы: «если я буду говорить, я сяду на три года, если молчать - на пять лет. Если второй будет молчать, мне тоже лучше говорить: не сесть лучше, чем сесть на год». Это доминирующая стратегия: говорить выгодно, независимо от того, что делает другой. Однако в ней есть проблема - наличие варианта получше, ведь сесть на три года хуже, чем сесть на год (если рассматривать историю только с точки зрения участников и не учитывать вопросы морали). Но сесть на год невозможно, ведь, как мы поняли выше, молчать обоим преступникам невыгодно.

Улучшение по Парето

Есть известная метафора про невидимую руку рынка, принадлежащая Адаму Смиту. Он говорил, что если мясник будет сам для себя стараться заработать деньги, от этого будет лучше всем: он сделает вкусное мясо, которое купит булочник на деньги от продажи булок, которые он, в свою очередь, тоже должен будет делать вкусными, чтобы они продавались. Но оказывается, эта невидимая рука не всегда работает, и таких ситуаций, когда каждый действует за себя, а всем плохо, очень много.

Поэтому иногда экономисты и специалисты по теории игр думают не об оптимальном поведении каждого игрока, то есть не о равновесии по Нэшу, а об исходе, при котором будет лучше всему обществу (в «Дилемме» общество состоит из двух преступников). С этой точки зрения, исход эффективен, когда в нем нет улучшения по Парето, то есть невозможно сделать кому-то лучше, не сделав при этом хуже другим. Если люди просто меняются товарами и услугами, это Парето-улучшение: они делают это добровольно, и вряд ли кому-то от этого плохо. Но иногда, если просто дать людям взаимодействовать и даже не вмешиваться, то, к чему они придут, не будет оптимальным по Парето. Это и происходит в «Дилемме заключенного». В ней, если мы даем каждому действовать так, как им выгодно, оказывается, что всем от этого плохо. Всем было бы лучше, если бы каждый действовал не оптимально для себя, то есть молчал.

Трагедия общины

«Дилемма заключенного» - это игрушечная стилизованная история. Вряд ли вы ожидаете оказаться в подобной ситуации, но похожие эффекты есть везде вокруг нас. Рассмотрим «Дилемму» с большим количеством игроков, ее иногда называют трагедией общины. Например, на дорогах - пробки, и я решаю, как ехать на работу: на машине или на автобусе. Это же делают остальные. Если я поеду на машине, и все решат сделать то же самое, будет пробка, но мы доедем с комфортом. Если я поеду на автобусе, пробка-то все равно будет, но ехать я буду некомфортно и не особо быстрее, поэтому такой исход еще хуже. Если же в среднем все ездят на автобусе, то я, сделав то же самое, довольно быстро доеду без пробки. Но если при таких условиях поехать на машине, я тоже доеду быстро, но еще и с комфортом. Итак, наличие пробки не зависит от моих действий. Равновесие по Нэшу здесь - в ситуации, когда все выбирают ехать на машине. Что бы не делали остальные, мне лучше выбрать машину, потому что будет там пробка или нет, неизвестно, но я в любом случае доеду с комфортом. Это доминирующая стратегия, поэтому в итоге все едут на машине, и мы имеем то, что имеем. Задача государства - сделать поездку на автобусе лучшим вариантом хотя бы для некоторых, поэтому появляются платные въезды в центр, парковки и так далее.

Другая классическая история - рациональное незнание избирателя. Представьте, что вы не знаете исход выборов заранее. Вы можете изучить программу всех кандидатов, послушать дебаты и после проголосовать за самого лучшего. Вторая стратегия - прийти на участок и проголосовать как попало или за того, кого чаще показывали по телевизору. Какое поведение оптимально, если от моего голоса никогда не зависит, кто выиграет (а в 140-миллионной стране один голос никогда ничего не решит)? Конечно, я хочу, чтобы в стране был хороший президент, но я же знаю, что никто больше не будет изучать программы кандидатов внимательно. Поэтому не тратить на это время - доминирующая стратегия поведения.

Когда вас призывают прийти на субботник, ни от кого в отдельности не будет зависеть, станет двор чистым или нет: если я выйду один, я не смогу убрать все, или, если выйдут все, то не выйду я, потому что все и без меня уберут. Другой пример - перевозка грузов в Китае, о котором я узнал в замечательной книге Стивена Ландсбурга «Экономист на диване». 100-150 лет назад в Китае был распространен способ перевозки грузов: все складывалось в большой кузов, который тащили семь человек. Заказчики платили, если груз доставлялся вовремя. Представьте, что вы - один из этих шести. Вы можете прилагать усилия, и тянуть изо всех сил, и если все будут так делать, груз доедет вовремя. Если кто-нибудь один так делать не будет, все тоже доедут вовремя. Каждый думает: «Если все остальные тянут как следует, зачем это делать мне, а если все остальные тянут не со всей силы, то я ничего не смогу изменить». В итоге, со временем доставки все было очень плохо, и сами грузчики нашли выход: они стали нанимать седьмого и платить ему деньги за то, чтобы он стегал лентяев плетью. Само наличие такого человека заставляло всех работать изо всех сил, потому что иначе все попадали в плохое равновесие, из которого никому в отдельности с выгодой не выйти.

Такой же пример можно наблюдать в природе. Дерево, растущее в саду, отличается от того, что растет в лесу, своей кроной. В первом случае она окружает весь ствол, во втором - находится только вверху. В лесу это является равновесием по Нэшу. Если бы все деревья договорились и выросли одинаково, они бы поровну распределили количество фотонов, и всем было бы лучше. Но никому в отдельности так делать невыгодно. Поэтому каждое дерево хочет вырасти немного выше окружающих.

Сommitment device

Во многих ситуациях одному из участников игры может понадобиться инструмент, который убедит остальных, что тот не блефует. Он называется commitment device. Например, закон некоторых стран запрещает платить выкуп похитителям людей, чтобы снизить мотивацию преступников. Однако это законодательство часто не работает. Если вашего родственника захватили, и у вас есть возможность спасти его, обойдя закон, вы это сделаете. Представим ситуацию, что закон можно обойти, но родственники оказались бедными и выкуп им платить нечем. У преступника в этой ситуации два пути: отпустить или убить жертву. Убивать он не любит, но тюрьму он не любит больше. Отпущенный пострадавший, в свою очередь, может либо дать показания, чтобы похититель был наказан, либо молчать. Самый лучший исход для преступника: отпустить жертву, которая его не сдаст. Жертва же хочет быть отпущенной и дать показания.

Равновесие здесь в том, что террорист не хочет быть пойманным, а значит, жертва погибает. Но это не равновесие по Парето, потому что существует вариант, при котором всем лучше - жертва на свободе хранит молчание. Но для этого надо сделать так, чтобы молчать ей было выгодно. Где-то я прочитал вариант, когда она может попросить террориста устроить эротическую фотосессию. Если преступника посадят, его подельники выложат фотографии в интернет. Теперь, если похититель останется на свободе - это плохо, но фотографии в открытом доступе - еще хуже, поэтому получается равновесие. Для жертвы это способ остаться в живых.

Другие примеры игр:

Модель Бертрана

Раз уж мы говорим об экономике, рассмотрим экономический пример. В модели Бертрана два магазина продают один и тот же товар, покупая его у производителя по одной цене. Если цены в магазинах одинаковы, то примерно одинакова и их прибыль, ведь тогда покупатели выбирают магазин случайно. Единственное равновесие по Нэшу здесь - продавать товар по себестоимости. Но магазины хотят зарабатывать. Поэтому если один поставит цену 10 рублей, второй снизит ее на копейку, увеличив тем самым свою выручку вдвое, так как к нему уйдут все покупатели. Поэтому участникам рынка выгодно снижать цены, распределяя тем самым прибыль между собой.

Разъезд на узкой дороге

Рассмотрим примеры выбора между двумя возможными равновесиями. Представьте, что Петя и Маша едут навстречу друг другу по узкой дороге. Дорога настолько узкая, что им обоим нужно съехать на обочину. Если они решат повернуть налево или направо от себя, они просто разъедутся. Если же один повернет направо, а другой налево от себя, или наоборот, случится авария. Как выбрать, куда съехать? Чтобы помогать искать равновесие в подобных играх, существуют, например, правила дорожного движения. В России каждому нужно повернуть направо.

В забаве Chiken, когда два человека едут на большой скорости навстречу друг другу, тоже есть два равновесия. Если оба сворачивают на обочину, возникает ситуация, которая называется Chiken out, если оба не сворачивают, то погибают в страшной аварии. Если я знаю, что мой соперник едет прямо, мне выгодно съехать, чтобы выжить. Если я знаю, что мой соперник съедет, то мне выгодно ехать прямо, чтобы после получить 100 долларов. Сложно предсказать, что случится на самом деле, однако, у каждого из игроков есть свой метод выиграть. Представьте, что я закрепил руль так, что его нельзя повернуть, и показал это своему сопернику. Зная, что у меня нет выбора, соперник отскочит.

QWERTY-эффект

Иногда бывает очень сложно перейти из одного равновесия в другое, даже если оно означает пользу для всех. Раскладка QWERTY была создана, чтобы замедлить скорость печати. Поскольку если бы все печатали слишком быстро, головки печатной машинки, которые бьют по бумаге, цеплялись бы друг за друга. Поэтому Кристофер Шоулз разместил часто стоящие рядом буквы на максимально далеком расстоянии. Если вы зайдете в настройки клавиатуры на своем компьютере, вы сможете выбрать там раскладку Dvorak и печатать гораздо быстрее, так как сейчас нет проблемы аналоговых печатных машин. Дворак рассчитывал, что мир перейдет на его клавиатуру, но мы по-прежнему живем с QWERTY. Конечно, если бы мы перешли на раскладку Дворака, будущее поколение было бы нам благодарно. Все мы приложили бы усилия и переучились, в результате вышло бы равновесие, в котором все печатают быстро. Сейчас мы тоже в равновесии - в плохом. Но никому не выгодно быть единственным, кто переучится, потому что за любым компьютером, кроме личного, работать будет неудобно.

На протяжении всей жизни человек вынужден принимать определённые решения по самым разнообразным вопросам, начиная от бытовых споров - кто будет убирать комнаты в доме или как благоустроить свой город, и заканчивая международными переговорами, многомиллионными аукционами и даже военными действиями. И во всех этих ситуациях человек стремится максимизировать свой собственный выигрыш. Но при этом ему всегда приходится выбирать: сотрудничать с другими людьми или думать только о своей выгоде, не заботясь о выгоде других. Классическим примером, который показывает, что в погоне за личной выгодой не всегда можно достичь лучшего результата, выступает «Дилемма заключённого».

Двое заключённых А и Б подозреваются в совершении преступления, за которое им грозит до 10 лет лишения свободы. Но прямых улик пока нет. Поэтому следствие предлагает каждому из заключённых пойти на сделку - признаться в содеянном и свалить инициативу преступления на другого. Если один признается, а другой заключённый будет хранить молчание, то первому уменьшат срок заключения до трёх лет за содействие следствию, а второго посадят на 10 лет.

Если оба пойдут на сделку со следствием и сознаются в содеянном, то каждый получит по 5 лет. Однако, если оба будут молчать, то за отсутствием улик, их выпустят на свободу. Заключённые находятся в разных камерах, чтобы они не могли сговориться друг с другом и согласовать своё поведение на допросе. Ни один из них не знает точно, что сделает другой. Какое решение примет каждый из них? Что произойдёт?

У каждого заключённого есть выбор: молчать или признаться. Это и есть дилемма заключённого: должен ли он оговорить другого или должен попытать удачу и не признаваться, сильно при этом рискуя? В зависимости от выбора заключённых в этой ситуации возможны четыре исхода.

Рассмотрим их:

1. Если оба заключённых дают признательные показания, каждый из них получает по пять лет тюрьмы;

2. Если заключённый А будет хранить молчание, а заключённый Б даст показания против него, то первый сядет на 10 лет, а второй - на три года;

3. И наоборот, если заключённый А признается, а заключённый Б будет хранить молчание, то первый сядет на три года, а второй - на 10 лет;

4. А если оба будут молчать, то за отсутствием улик из выпустят на свободу.

Какой из этих исходов наиболее реален? Чтобы ответить на этот вопрос, нужно знать, как рассуждает каждый из них. Вот как рассуждает заключённый А:

« Допустим, что заключённый Б признается. Если я тоже признаюсь, то получу 5 лет. Если же буду молчать - получу 10 лет. Значит, если заключённый Б признается, мне тоже лучше признаться в содеянном.

Если же заключённый Б будет хранить молчание, как следует поступить мне? Если признаюсь - получу 3 года. А если тоже буду молчать, то выйду на свободу. Это, конечно, идеальный вариант, но я не уверен, что заключённый Б будет молчать, я ему не доверяю. Поэтому мне лучше дать показания.

Значит, что бы ни делал заключённый Б, мне лучше признаться».

Ход рассуждений заключённого Б аналогичный, и он также приходит к выводу, что для него выгоднее признаться, независимо от того, что будет делать заключённый А.

Что же получается? Каждый из заключённых выбрал стратегию, которая, хотя и не приводит к самому лучшему результату (выходу на свободу), но является наилучшей для каждого из них при любом поведении соперника. Так как цель каждого заключённого - минимизировать свой срок заключения, не заботясь о другом заключённом, то признаться и оговорить другого - наиболее выгодная стратегия для каждого из них. Проще говоря, не важно, что сделает другой, каждый выиграет больше, если предаст. Поэтому заключённые выберут стратегию «Признаться» и получат по 5 лет тюрьмы.

Итак, на этом примере мы увидели, что решение, принимаемое одним игроком, влияет на решение другого (и наоборот) и в итоге влияет на конечный исход игры.

Другими примерами игр, в которых участвуют люди с несовпадающими (противоположными) целями, когда результат зависит от решений всех участников, могут послужить игра в покер, шахматы, пенальти в футболе и многие другие игры.

Но, наряду с традиционными играми, между людьми существуют и такие серьёзные отношения как рыночная конкуренция, гонка вооружений, загрязнение окружающей среды, выборы, торговля и др. Например, компании, конкурирующие на рынке, при принятии решений должны оглядываться на действия конкурентов. Или другой показательный пример - гонка вооружений между Советским Союзом и США в 1950-1990-х годах. В течение почти полувека две великие страны тратили много денег на вооружение, не отставая друг от друга. Если бы между ними было доверие, они бы не тратили столько средств на вооружение, а потратили бы их с бо льшей пользой (на образование, здравоохранение, пенсии и т. п.) и обе стороны выиграли бы от этого. Но вместо этого каждая страна, не доверяя другой, продолжала производить оружие и никто от этого не выигрывал.

Все эти серьёзные отношения тоже называют играми, поскольку в них, как и в обычных играх, результат зависит от решений (стратегий) всех участников. А наука, которая изучает эти серьёзные отношения, называется теорией игр. Поэтому слово «игра» в данном случае не должно вводить вас в смятение. Это понятие в теории игр трактуется шире, чем в повседневной жизни.

Равновесие Нэша

Итак, в «Дилемме заключённого» ситуация складывается таким образом, что, поступая по отдельности рационально и разумно, в итоге заключённые получают по пять лет тюрьмы. Однако, как мы уже отметили, это не самый оптимальный исход. Есть вариант и получше: выйти на свободу, если оба будут молчать.

Наверняка каждый из заключённых, когда принимал решение, рассуждал так: «Если мы оба будем молчать, то выйдем на свободу. Конечно, это лучше, чем сесть на пять лет. Но где гарантия, что второй тоже будет молчать? Ведь если я буду молчать, а другой даст показания, то я сяду на целых 10 лет! Нет, уж лучше я признаюсь в содеянном».

Очевидно, что взаимное недоверие друг к другу не позволяет реализоваться ситуации, когда каждый выйдет на свободу. К тому же заключённые сидят в разных камерах и каждый принимает решение, не зная о решении другого и у каждого есть соблазн дать показания против другого и получить 3 года вместо 5 или 10 лет. Получается, что самый лучший исход - выйти на свободу - является ненадёжным и нестабильным. Именно поэтому заключённые выбрали такие стратегии, которые привели пусть не к самому лучшему исходу, но зато надёжному и исключающему риск обмана и предательства. Такой исход называется равновесием Нэша.

Равновесие Нэша (Nash equilibrium ) - это такая комбинация стратегий игроков и их выигрышей, при которой ни один из игроков не может увеличить свой выигрыш, изменив свою стратегию, если при этом другие участники своих стратегий не меняют. Примечание: равновесие Нэша существует в играх, в которых игроки действуют независимо друг от друга и не могут объединяться и координировать свои действия.

Простыми словами, равновесие Нэша - это такая ситуация, когда стратегия каждого игрока является наилучшей реакцией на стратегии других игроков и ни одному игроку невыгодно в отдельности менять свою стратегию.

Равновесие Нэша - это не самый лучший исход из всех возможных, но в ситуации, когда каждый играет сам за себя, это оптимальный исход для каждого игрока, потому что сводятся к нулю риски и потери каждого игрока, которые могли бы быть, если другой игрок решит его обмануть или предать.

Равновесие Нэша - это устойчивое равновесие, потому что игрокам выгодно его сохранять, так как любое изменение ухудшит их положение. Но если в отношениях между игроками появляется сотрудничество, равновесие Нэша перестаёт быть равновесным, потому что появляется возможность достичь более лучшего результата. Например, если бы в «Дилемме заключённого» у игроков была возможность договориться о сотрудничестве, а именно - вдвоём хранить молчание, либо, если бы у них не было сомнений в том, что другой не предаст и тоже будет молчать, то ситуация могла бы закончиться для обоих с более лучшим исходом - выходом на свободу.

Вывод: Равновесие Нэша показывает, что каждый игрок может выиграть больше, если между игроками будут существовать сотрудничество, доверие и честность, и каждый игрок, делая лучше для других, сделает лучше для себя.

Иллюстрация с сайта postnauka.com

February 10th, 2015

Давайте быстро поделим 100$. Вы и я решаем, сколько из сотни мы требуем и одновременно озвучиваем суммы. Если наша общая сумма меньше ста, каждый получает то, что хотел. Если общее количество больше ста, тот, кто попросил наименьшее количество, получает желаемую сумму, а более жадный человек получает то, что осталось. Если мы просим одинаковую сумму, каждый получает 50 $. Сколько вы попросите? Как вы разделите деньги?

Существует единственный выигрышный ход.

Для начала по научному:

Равновесие Нэша (англ. Nash equilibrium ) названо в честь Джона Форбса Нэша - так в теории игр называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения. Такая совокупность стратегий выбранных участниками и их выигрыши называются равновесием Нэша.

Концепция равновесия Нэша (РН) впервые использована не Нэшем; Антуан Огюст Курно показал, как найти то, что мы называем равновесием Нэша, в игре Курно. Соответственно, некоторые авторы называют его равновесием Нэша-Курно . Однако Нэш первым показал в своей диссертации по некооперативным играм в 1950-м году, что подобные равновесия должны существовать для всех конечных игр с любым числом игроков. До Нэша это было доказано только для игр с 2 участниками с нулевой суммой Джоном фон Нейманом и Оскаром Моргенштерном (1947).

А теперь решение задачки, которая была представлена в начале поста:

Требование 51 $ даст вам максимальную сумму независимо от того, что выберет ваш противник. Если он попросит больше, вы получите 51 $. Если он попросит 50 $ или 51 $, вы получите 50 $. И если он попросит меньше 50 $, вы получите 51 $. В любом случае нет никакого другого варианта, который принесет вам больше денег, чем этот. Равновесие Нэша - ситуация, в которой мы оба выбираем 51 $.

А теперь немного об этом человеке:

Джон Нэш родился 13 июня 1928 г. в Блюфилде, штат Вирджиния, в строгой протестантской семье. Отец работал инженером в компании Appalachian Electric Power, мама до замужества успела 10 лет проработать школьной учительницей. В школе учился средне, а математику вообще не любил - в школе ее преподавали скучно. Когда Нэшу было 14, к нему в руки попала книга Эрика Т. Белла «Великие математики». «Прочитав эту книгу, я сумел сам, без посторонней помощи, доказать малую теорему Ферма» - пишет Нэш в своей автобиографии. Так его математический гений заявил о себе.

Учёба

Затем последовала учёба в Политехническом институте Карнеги (ныне частный Университет Карнеги-Меллона), где Нэш пробовал изучать химию, прослушал курс международной экономики и потом окончательно утвердился в решении заняться математикой. В 1948 году, окончив институт с двумя дипломами - бакалавра и магистра, - он поступил в Принстонский университет. Институтский преподаватель Нэша Ричард Даффин снабдил его одним из самых лаконичных рекомендательных писем. В нем была единственная строчка: «Этот человек - гений!»

Работы

В Принстоне Джон Нэш услышал о теории игр, в ту пору только представленной Джоном фон Нейманом и Оскаром Моргенштейном. Теория игр поразила его воображение, да так, что в 20 лет Джон Нэш сумел создать основы научного метода, сыгравшего огромную роль в развитии мировой экономики. В 1949 году 21-летний ученый написал диссертацию о теории игр. Сорок пять лет спустя он получил за эту работу Нобелевскую премию по экономике. Вклад Нэша описали так: зафундаментальный анализ равновесия в теории некооперативных игр.

Нейман и Моргенштейн занимались так называемыми играми с нулевой суммой, в которых победа одной стороны неизбежно означает поражение другой. В 1950 - 1953 гг. Нэш опубликовал четыре без преувеличения революционные работы, в которых представил глубокий анализ «игр с ненулевой суммой» - особого класса игр, в которых все участники или выигрывают, или терпят поражение. Примером такой игры могут стать переговоры об увеличении зарплаты между профсоюзом и руководством компании. Эта ситуация может завершиться либо длительной забастовкой, в которой пострадают обе стороны, либо достижением взаимовыгодного соглашения. Нэш сумел разглядеть новое лицо конкуренции, смоделировав ситуацию, впоследствии получившую название «равновесие по Нэшу» или «некооперативное равновесие», при которой обе стороны используют идеальную стратегию, что и приводит к созданию устойчивого равновесия. Игрокам выгодно сохранять это равновесие, так как любое изменение только ухудшит их положение.

В 1951 году Джон Нэш стал работать в Массачусетском Технологическом институте (MIT) в Кэмбридже. Коллеги его особенно не любили, т. к. он был очень эгоистичен, однако относились к нему терпеливо, ведь его математические способности были блестящими. Там у Джона завязались близкие отношения с Элеанор Стиэр, которая вскоре уже ждала от него ребёнка. Так Нэш стал отцом, однако он отказался дать свое имя ребенку для записи в свидетельство о рождении, а также отказался оказывать какую-либо финансовую поддержку. В 1950-х гг. Нэш был знаменит. Он сотрудничал с корпорацией RAND, занимающейся аналитическими и стратегическими разработками, в которой работали ведущие американские ученые. Там, опять-таки благодаря своим исследованиям в области теории игр, Нэш стал одним из ведущих специалистов в области ведения «холодной войны». Кроме этого, работая в MIT Нэш написал ряд статей по вещественной алгебраической геометрии и теории римановых многообразий, высоко оценённые современниками.

Болезнь

Вскоре Джон Нэш встретил Алисию Лард и в 1957 г. они поженились. В июле 1958 г. журнал Fortune назвал Нэшавосходящей звездой Америки в «новой математике». Вскоре жена Нэша забеременела, но это совпало с болезнью Нэша - онзаболел шизофренией. В это время Джону было 30 лет, а Алисии - всего 26. В начале Алисия пыталась скрыть все происходящее от друзей и коллег, желая спасти карьеру Нэша. Однако спустя несколько месяцев безумного поведения, Алисия насильно поместила мужа в частную психиатрическую клинику в пригороде Бостона, McLean Hospital, где ему поставили диагноз «параноидальная шизофрения». После выписки он внезапно решил уехать в Европу. Алисия оставила новорожденного сына своей матери и последовала за мужем. Она вернула своего мужа в Америку. По возвращении они обосновались в Принстоне, где Алисия нашла работу. Но болезнь Нэша прогрессировала: он постоянно чего-то боялся, говорил о себе в третьем лице, писал бессмысленные почтовые карточки, звонил бывшим коллегам. Они терпеливо выслушивали его бесконечные рассуждения о нумерологии и состоянии политических дел в мире.

Ухудшение состояния мужа все сильнее угнетало Алисию. В 1959 г. он лишился работы. В январе 1961 года полностью подавленная Алисия, мать Джона и его сестра Марта приняли трудное решение: поместить Джона в Trenton State Hospital в Нью Джерси, где Джон прошел курс инсулиновой терапии - жесткое и рискованное лечение, 5 дней в неделю в течении полутора месяцев. После выписки коллеги Нэша из Принстона решили ему помочь, предложив ему работу в качестве исследователя, однако Джон опять отправился в Европу, но на этот раз один. Домой он отправлял только загадочные письма. В 1962 году, после 3 лет смятения, Алисия развелась с Джоном. При помощи матери она вырастила сына сама. Позднее оказалось, что у него тоже шизофрения.

Несмотря на развод с Алисией коллеги-математики продолжали помогать Нэшу - они дали ему работу в Университете и устроили встречу с психиатром, которой выписал анти-психотические лекарства. Состояние Нэша улучшилось, и он стал проводить время с Элеонорой и своим первым сыном Джоном Дэвидом. «Это было очень обнадёживающее время, - вспоминает сестра Джона Марта. - Это был достаточно долгий период. Но затем все стало меняться». Джон перестал принимать лекарства, опасаясь, что они могут оказать подавляющие влияние на мыслительную активность и симптомы шизофрении опять проявились.

В 1970 г. Алисия Нэш, будучи уверенной, что она совершила ошибку, предав мужа, приняла его вновь, и теперь уже как пансионера, это возможно и спасло его от состояния бездомности. В последующие годы Нэш продолжал ходить в Принстон, записывая на досках странные формулы. Студенты Принстона прозвали его «Фантом». Затем в 1980 гг. Нэшу стало заметно лучше - симптомы отступили и он стал более вовлеченным в окружающую жизнь. Болезнь, к удивлению врачей, стала отступать. Точнее, Нэш стал учиться не обращать на нее внимания и вновь занялся математикой. «Сейчас я мыслю вполне здраво, как всякий ученый, - пишет Нэш в своей автобиографии. - Не скажу, что это вызывает у меня радость, какую испытывает всякий выздоравливающий от физического недуга. Здравое мышление ограничивает представления человека о его связи с космосом».

Признание

В 1994, в возрасте 66 лет, Джон Нэш получил Нобелевскую Премию за свою работу по теории игр. Однако он был лишен возможности прочитать традиционную Нобелевскую лекцию в Стокгольмском университете, так как организаторы опасались за его состояние. Вместо этого был организован семинар (с его участием), на котором обсуждался его вклад в теорию игр. После этого Нэш был приглашен прочитать лекцию в университете Уппсалы, раз уж ему не предоставилось такой возможности в Стокгольме. По словам приглашавшего его профессора Математического института университета Уппсалы Кристера Кисельмана, лекция была посвящена космологии.

В 2001 году, через 38 лет после развода, Джон и Алисия вновь поженились. Нэш вернулся в свой офис в Принстоне, где продолжает познавать математику и познавать этот мир - мир, в котором вначале он был так успешен; мир, который заставил его пройти через очень сложное заболевание; и всё-таки этот мир принял его вновь.

«Игры разума»

В 1998 году американская журналистка (и профессор экономики Колумбийского университета Сильвия Назар) написала биографию Нэша под названием «A Beautiful Mind: The Life of Mathematical Genius and Nobel Laureate John Nash» (Прекрасный ум: Жизнь гения математики и нобелевского лауреата Джона Нэша). Книга мгновенно стала бестселлером.

В 2001 году под руководством Рона Ховарда по мотивам книги был снят фильм «A Beautiful Mind», в русском прокате «Игры разума». Фильм получил четыре «Оскара» (за лучшие адаптированный сценарий, режиссуру, актрису второго плана и, наконец, лучший фильм), награду «Золотой глобус» и был отмечен несколькими призами Bafta (британская премия за кинематографические достижения).

Как видим, фильм практически правда. Конечно, с некоторыми «литературными» искажениями.

  • На роль режиссёра фильма был предложен Роберт Редфорд, но его не устроило расписание съёмок.
  • На роль Джона Нэша пробовался Том Круз, а на роль Алисии - Сальма Хайек. Любопытно, что она родилась в том же городке Эль Сальвадор, что и её несостоявшаяся героиня.
  • Когда Нэш впервые видит Паркера, он обращается к нему как к «большому брату» (намёк на роман Оруэлла «1984»). Ещё одна отсылка к Оруэллу происходит позднее, когда мы видим номер на двери кабинета Нэша - 101.
  • В роли рукописи, которую молодой Джон Нэш показывает своему куратору, профессору Хелинджеру, выступает подлинная копия статьи, напечатанной в журнале Econometrica под заголовком «Задача совершения сделки».
  • Сценарист фильма Акива Голдсман имел немалый опыт общения с душевнобольными людьми: в свою бытность врачом он лично разрабатывал методики восстановления душевного здоровья детей и взрослых.
  • Куратором фильма по математической части стал профессор Барнардского колледжа Дэйв Байер - именно его рукойРасселл Кроу «выводит» на доске мудрёные формулы.
  • «Мудрёные формулы» при внимательном рассмотрении представляют собой просто бессмысленный набор греческих букв, стрелок и математических знаков.
  • В отличие от своего экранного двойника, отличавшегося редкой преданностью своей «половинке», реальный Джон Нэш в своей жизни несколько раз был женат, а в двадцать с небольшим лет усыновил внебрачного ребенка.
  • В части фильма, относящейся к периоду вручения Нобелевской Премии (1994 г.), Нэш говорит о том, что якобы принимает антипсихотики нового типа, однако в действительности Джон Нэш отказался от них еще в 1970 году, и его ремиссия не была связана с приемом нейролептиков.

Где же сегодня применяются открытия Нэша?


Пережив бум в семидесятых-восьмидесятых, теория игр заняла прочные позиции в некоторых отраслях социального знания. Эксперименты, в которых команда Нэша в свое время фиксировала особенности поведения игроков, в начале пятидесятых были расценены как провал. Сегодня они легли в основание «экспериментальной экономики». «Равновесие Нэша» активно используется в анализе олигополий: поведении небольшого количества конкурентов в отдельном секторе рынка.

Кроме того, на Западе теория игр активно используется при выдаче лицензий на вещание или связь: выдающий орган математически высчитывает наиболее оптимальный вариант распределения частот.

Точно так же успешный аукционист сам определяет, какую информацию о лотах можно предоставлять конкретным покупателям, чтобы получить оптимальный доход. С теорией игр успешно работают в юриспруденции, социальной психологии, спорте и политике. Для последней характерным примером существования «равновесия Нэша» является институционализация понятия «оппозиция».

Однако теория игр нашла свое применение не только в социальных науках. Современная эволюционная теория была бы невозможна без представления о «равновесии Нэша», которое математически объясняет, почему волки никогда не съедают всех зайцев (потому что иначе они через поколение умрут от голода) и почему животные с дефектами делают свой вклад в генофонд своего вида (потому что в таком случае вид может приобрести новые полезные характеристики).

Сейчас от Нэша не ждут грандиозных открытий. Кажется, это уже неважно, поскольку он успел сделать две самые важные вещи в жизни: стал признанным гением в молодости и победил неизлечимую болезнь в старости.

И еще немного научных теорий: вот вам например , а вот . Вспомним еще про , и . А ведь есть еще и Оригинал статьи находится на сайте ИнфоГлаз.рф Ссылка на статью, с которой сделана эта копия -

В результате освоения данной главы студент должен:

знать

  • определение равновесия по Нэшу (как в чистых, так и в смешанных стратегиях);
  • основные свойства равновесия по Нэшу;
  • теоремы, формулирующие условия существования равновесия по Нэшу в стратегических играх;
  • определение понятия "равновесие дрожащей руки";

уметь

Решать задачу нахождения равновесия по Нэшу в биматричных играх (в том числе графическим методом для игр);

владеть

  • простейшими методами анализа свойств биматричных игр 2 х 2 с использованием результатов их графического решения;
  • системой представлений как о возможностях, так и об объективных проблемах практического применения понятия равновесия по Нэшу;
  • терминологическим аппаратом, позволяющим самостоятельно осваивать научную и профессиональную литературу, использующую понятие равновесия но Нэшу и его свойства.

В данной главе мы рассмотрим основной объект исследования теории бескоалиционных игр, получивший название равновесия по Нэшу. Данное понятие было предложено выдающимся американским математиком Джоном Нэшем (John Forbes Nash) сначала в его диссертации, а затем в серии работ, вышедших в 1950-1953 гг. .

^ Ситуацию s* в игре Г = (I, {} i Î I , {(s)} i Î I) будем называть равновесием но Нэшу (в чистых стратегиях), если для любого игрока i Î I

Другими словами, ситуация равновесия по Нэшу - это такая ситуация в игре, от которой ни одному из игроков невыгодно отклоняться поодиночке (при условии что остальные участники игры придерживаются своих стратегий, образующих равновесие по Нэшу).

Рассмотрим отображения, которые для каждого игрока i Î I для каждой возможной подситуации Î ставят в соответствие некоторую стратегию , являющуюся его наилучшим ответом для данной подситуации:

Отображения возвращающие наилучшие ответы на подситуации, также называют отображениями отклика игрока. Из неравенства (3.1) следует, что ситуация равновесия по Нэшу образуется стратегиями, которые возвращаются отображениями отклика всех игроков, т.е. ситуация равновесия по Нэшу - это ситуация, образуемая наилучшими ответами каждого игрока на наилучшие ответы остальных:

В свою очередь, из условия (3.3) вытекают следующие свойства.

  • 1. Строго доминируемые стратегии и НЛО-стратегии не могут входить в равновесие по Нэшу.
  • 2. Стратегии, образующие равновесие по Нэшу, не могут быть исключены в процессе удаления строго доминируемых стратегий и рационализации игры.

Одновременно следует подчеркнуть, что слабо доминируемые стратегии перечисленными свойствами не обладают. Несложно сконструировать пример равновесия по Нэшу, в котором будут присутствовать одна или несколько слабодоминируемых стратегий.

Для рассмотрения свойств равновесия по Нэшу вернемся к игре "дилемма заключенного" (см. табл. 2.1).

Как нетрудно заметить, данная игра имеет единственное состояние равновесия по Нэшу. Это ситуация (С, С), в которой оба игрока сознаются и получают по пять лет тюремного наказания. Фундаментальным качеством ситуации (С, С) является именно то, что от нее действительно никому невыгодно отклоняться поодиночке. Если один из заключенных попытается сменить стратегию с "сознаться" на "молчать", то

этим он только ухудшит свое положение - вместо пяти лет наказания получит десять - и улучшит положение другого игрока, которого отпустят.

Нельзя не признать, что ситуация равновесия в данном примере является неэффективным исходом для заключенных. Ведь в ситуации (М, М) - оба молчат - их полезности выше (срок наказания составляет один год против пяти). Однако ситуация (М, М) обладает тем недостатком, что она неустойчива. В ней каждому из игроков выгодно сменить стратегию "молчать" на "сознаться", при условии что другой игрок продолжает придерживаться стратегии "молчать". В этом случае наказание для предавшего становится нулевым, правда, резко возрастает для преданного: с года до десяти.

Таким образом, дилемма заключенного достаточно ярко отражает тот факт, что

равновесие по Нэшу - необязательно "самая выгодная" ситуация для игроков, это устойчивая ситуация.

Также на примере дилеммы заключенного достаточно наглядно может быть продемонстрировано соотношение равновесия по Нэшу с таким фундаментальным понятием экономики, как оптимальность по Парето . Напомним, что

распределение называют оптимальным но Парето (Парето-оптимальным), когда полезность (благосостояние) ни одного из участников этого распределения не может быть увеличена без уменьшения полезности какого-либо другого участника.

Нетрудно заметить, что в дилемме заключенного ситуация равновесия но Нэшу является единственной Парето-неоптимальной: полезность участников "безболезненно для каждого из них" можно улучшить, перейдя от ситуации (С, С) к ситуации (М, М), но последняя не является равновесием по Нэшу в силу своей неустойчивости. С этой точки зрения дилемма заключенного является классическим примером, демонстрирующим различия между понятиями "равновесие по Нэшу" и "оптимальность по Парето".

Продемонстрируем возможности практического использования концепции равновесия по Нэшу на примере сюжетов из литературного приложения.

  • За свой вклад в теорию некооперативных игр Дж. Нэш в 1994 г. получил Нобелевскую премию по экономике
  • Введено итальянским экономистом и социологом Вильфредо Парето (1848-1923)

Ученые вот уже почти шестьдесят лет используют теорию игр для расширения анализа стратегических решений, которые принимают фирмы, в частности для того, чтобы ответить на вопрос: почему на некоторых рынках фирмы стремятся сговориться, тогда как на других агрессивно конкурируют; использующие фирмы, чтобы не допустить вторжения потенциальных конкурентов; как должны приниматься решения о цене, когда меняются условия спроса или издержек или когда новые конкуренты вторгаются на рынок и т.

Первыми провели исследование в области теории игр Дж.-Ф. Нейман и О. Моргенштерн и описали результаты в книге "Теория игр и экономическое поведение" (1944). Они распространили математические категории этой теории на экономическую жизнь общества, введя понятие оптимальных стратегий, максимизации ожидаемой полезности, доминирование в игре (на рийку), коалиционных соглашений и тому подобное.

Ученые стремились сформулировать основополагающие критерии рационального поведения участника на рынке с целью достижения благоприятных результатов. Они различали две основные категории игр. Первая - "игра с нулевой суммой", предусматривающий такой выигрыш, который состоит исключительно из проигрыша других игроков. В связи с этим пользу одних непременно должна образовываться за счет потерь других игроков, так что общая сумма пользы и потерь всегда равна нулю. Вторая категория - "игра с плюсовой суммой", когда индивидуальные игроки соревнуются за выигрыш, состоящий из их же ставок. Иногда он образуется за счет наличия "выходного" (термин из карточной игры в бридж, который означает одного из игроков, который, делая ставку, не участвует в игре), совсем пассивного и часто является служащим объектом эксплуатации. В обоих случаях игра неизбежно сопряжена с риском, поскольку каждый из ее участников, как считали исследователи, "стремится максимально повысить функцию, переменные которой ним не контролируются". Если все игроки являются умелыми, то решающим фактором становится случайность. Но так бывает редко. Почти всегда важную роль в игре играет хитрость, с помощью которой делаются попытки раскрыть замыслы противников и завуалировать свои намерения, а затем занять выгодные позиции, которые заставили бы этих противников действовать в ущерб самим себе. Многое зависит и от "контрхитрости".

Большое значение во время игры имеет рациональное поведение игрока, т.е. продуманные выбор и осуществление оптимальной стратегии. Важный вклад в разработку формализованного (в виде моделей) описания конфликтных ситуаций, особенно в определении "формулы равновесия", т.е. устойчивости решений противников в игре, внес американский ученый Дж.-Ф. Нэш.

Нэш Джон Форбс родился в 1928 г.. (Г.. Влуефилд, США). Учился в университете Карнеги-Меллона по специальности инженера-химика, освоил курс "международная экономика". Получил диплом бакалавра и одновременно магистра математики.

В 1950 г.. В ИИриястонському университете защитил докторскую диссертацию на тему "некооперативных игры". Начиная с 1951г. И на протяжении почти восьми лет Нэш работал преподавателем Массачусетского технологического института, проводя одновременно активную научно-исследовательскую деятельность.

С весны 1959 ученый заболел и потерял работоспособность. В 70-е годы он смог вернуться к своим математических увлечений, однако производить научные результаты ему было трудно. Нобелевский комитет в 1994 фактически наградил труд, написанная в 1949

Член Национальной академии наук США, Бконометричного общества и Американской академии искусств и академии наук.

Досконально изучив различные игры, создав серию новых математических игр и наблюдая за действиями участников в различных игровых ситуациях, Нэш пытался глубже понять, как функционирует рынок, как компании принимают связаны с риском решения, почему покупатели действуют именно определенным образом. В экономике, как и в игре, руководители фирм должны учитывать не только последний, но и предыдущие шаги конкурентов, а также обстановку на всем экономическом (игровом, например, шахматном) поле и многие другие важные факторы.

Субъекты экономической жизни - активно действующие его участники, которые на рынке в условиях конкуренции идут на риск, и он должен быть оправдан. Поэтому каждый из них, как игрок, должен иметь свою стратегию. Именно это имел в виду Нэш, когда разрабатывал метод, который впоследствии назвали его именем (равновесие Нэша).

Свое понимание стратегии как основного понятия теории игр Дж.-Ф. Нэш разъясняет на основе "игры с нулевой суммой" (он называет это "симметричной игрой"), когда каждый участник имеет определенное число стратегий. Выигрыш каждого игрока зависит от того, какие стратегии выбрал и он, и его противник. На основании этого строится матрица для нахождения оптимальной стратегии, которая за многократного повторения игры обеспечивает этому игроку максимально возможный средний выигрыш (или максимально возможный средний проигрыш). Поскольку игроку неизвестно, какую стратегию выберет противник, ему самому лучше (рационально) выбрать стратегию, которая рассчитана на худшую для него поведение противнике (принцип так называемого "гарантированного результата"). Действуя осторожно и считая противника сильным конкурентом, наш игрок выберет для каждой своей стратегии минимально возможный выигрыш. Затем из всех минимально выигрышных стратегий он выберет такую, которая обеспечит максимальный из всех минимальных выигрыш - максимин.

Но и противник, вероятно, подумает аналогично. Он найдет для себя наибольшие проигрыши во всех стратегиях игрока, а затем из этих максимальных проигрышей выберет минимальный - минимакс. В случае равенства максимина мини Максу решения игроков будут устойчивыми, а игра будет иметь равновесие. Устойчивость (равновесие) решений (стратегий) состоит в том, что отходить от выбранных стратегий будет невыгодно для обоих участников игры. В случае, когда максимин не равна минимакса, решения (стратегии) обоих игроков, если они сколько-нибудь угадали выбор стратегии противника, оказываются неустойчивыми, невривно-важен.

Общее краткое определение равновесия Нэша - результат, в котором стратегия каждого из игроков является лучшей среди других, принятых остальными участниками игры стратегий. Это определение основывается на том, что ни один из игроков изменением собственной роли не может достичь наибольшей пользы (максимизации функции полезности), если остальные участники твердо придерживаются своей линии поведения.

Свою формулу равновесия Дж.-Ф. Нэш многократно усилил, включив в нее как незаменимый фактор для выработки стратегий показатель оптимального объема информации. Этот показатель оптимальности он вывел из анализа ситуаций (1) с полным информированием игрока о своих противников и (2) с неполным информированием о них. Переведя этот постулат с математического языка на язык экономической, Нэш ввел неуправляемые переменные рыночных отношений как важный информационный элемент знания условий внешней среды. После этого равновесие Нэша стала методом, используется практически во всех отраслях экономической науки для лучшего понимания сложных взаимосвязей, - отметил в октябре 1994 во время объявления новых лауреатов Нобелевской премии по экономике А. Линдбек, член Шведской королевской академии и председатель Нобелевского комитета по экономике.

Применение равновесия Нэша стало важным шагом в микроэкономике. ее использование способствовало углубленному пониманию развития и функционирования рынков, обоснованию стратегических решений, принимаемых менеджерами различных фирм. Равновесием Нэша можно пользоваться при изучении процесса ведения политических переговоров и экономического поведения, в том числе на олигополистических рынках.

По пионерной анализ равновесия в некооперативных играх Нобелевская премия по экономике 1994 года было присуждена Дж.-Ф. Нэш в, Р. Селтену и Дж. Харшани. Начиная с классического труда Дж. Неймана и О. Моргенштер-на "Теория игр и экономическое поведение", неотъемлемой частью экономического анализа стало исследование стратегии взаимодействия экономических субъектов в условиях, когда для выработки собственной линии поведения необходимо учитывать действия другого суб " объекта (как это происходит, в частности, в шахматах, преферансе и других играх). Эти трое Нобелевских лауреатов внесли большой вклад в ответвление теории игр - теорию некооперативных игр (то есть игр, когда достигнута договоренность между участниками). Принципиальным моментом этой теории является концепция равновесия, используется для предсказания результатов взаимодействия.

Равновесие Нэша стала фундаментальным понятием теории игр.

Анализ дискретного выбора

К последней четверти ХХ в. доминировало мнение, что основную роль в поведении потребителей играют здравый смысл и расчет. Именно с учетом прежде всего здравого смысла потребителей сформулированы либеральные экономические теории. Экономисты этого научного направления считают, что рынок как система отношений между экономическими субъектами способен саморегулироваться и устанавливать справедливые цены на товары и услуги на основе здравого смысла.

Хотя либеральная экономическая школа дала миру больше научных достижений, чем конкурентная консервативна, однако ее теории имеют ограниченное применение, что признают и ее сторонники. Например, монетарнсты (они же либералы) пока не сумели аргументированно объяснить поведение инвесторов на международных финансовых рынках и огромные колебания цен на мировые сырьевые ресурсы.

Либеральный рыночный подход оказался слишком упрощенным для надежного прогнозирования потребительского спроса на услуги и товары в условиях, когда потребители имеют огромный выбор подобных товаров и при этом не ограничены в объемах закупок, поскольку сейчас в развитых странах чрезвычайно распространен потребительский кредит. Кроме того, либеральная теория не может объяснить, например, покупку американской семьей (или английском семьей) американского (или английского) автомобиля, в то время как корейский стоит дешевле. То есть эта теория не принимает во внимание национальные и другие особенности поведения потребителей, которые с точки зрения здравого смысла трудно объяснить.

Поэтому в последнее время ученые-екоярмисты все чаще говорят о появлении новой экономической теории, сложившейся непосредственно на основе данных о поведении потребителей, которую надо изучать с помощью статистических методов. Эта теория предлагает описание способа измерения полезности. Несмотря на то, что подобные оценки носят субъективный характер, именно субъективность определяет их ценность для реализации экономической политики. Многие экономисты даже прогнозируют, что именно теория поведения потребителей (известный автор - Д. - Л. Мак-Федден) будет в XXI в. основой для определения экономической и политической стратегии развитых государств.

Мак-Федден ДаниельЛитл родился в 1937г. (г.. Ралейг, штатГОвн.Каролина, США). Учился и работал в Миннесотского университете. В 1962 г.. Защитил докторскую диссертацию, работал ассистентом профессора экономики в Питсбургском университете, затем профессором экономики в Калифорнийском университете, где с 1991 г.. Руководит эконометрической лабораторией.

Опубликовал в соавторстве такие труды: "Очерки об экономическом поведении в условиях нестабильности" (1974), "Спрос на городское передвижения: поведенческий анализ" (1976), "Экономика производства: двойной подход к теории и практики" (1978), "Структурный анализ дискретных данных с економетричяимы приложениями "(1981)," Мик-роекономичне моделирования и численный анализ: исследование спроса в коммунальном хозяйстве "(1984)," Справочник по эконометрики "(т.4,1994), а также много научных статей.

В течение 1983-1984 гг. Был вице-президентом, а в 1985 г.. - Президентом Эконометрического общества. У1994 г.. Избирался вице-президентом Американской экономической ассоциации. Член Национальной академии наук США, Американских эконометрического общества и академий искусств и наук, Американская экономическая ассоциация наградила его медалью Дж.-Б. Кларка, Эконометрическое общество - медалью Р. Фриша.

Известно, что довольно часто микроданные отражают дискретные выборы - выборы среди конечного множества альтернативных решений. В экономической теории традиционный анализ спроса предусматривал, что индивидуальный выбор должен быть представлен непрерывной переменной, но такая трактовка не соответствует изучению поведения дискретного выбора. Предыдущими достижениями многих ученых эмпирические исследования таких выборов не были обоснованными в экономической теории.

Методология анализа дискретного выбора Д.-л. Мак-Феддена коренится в микроэкономической теории, согласно которой каждый индивид выбирает определенную альтернативу, которая максимизирует его полезность. Функции полезности - это способы описания потребительского выбора: если выбран набор услуг X при том, что набор услуг В доступен, то X должен иметь большую полезность, чем В. Изучая выбор, сделанный потребителями, можно вывести оценочную функцию полезности, адекватно описывала бы их поведение. Очевидно, что невозможно исследовать весь комплекс фактов влияния на выбор индивида, но анализ динамики изменений среди личностей с примерно одинаковыми характеристиками позволяет сделать достаточно объективные выводы.

Д.-л. Мак-Федден в сотрудничестве с Т, Домеником изучил поведение потребителей относительно регулярных транспортных поиздок1. В большинстве крупных городов у лиц, осуществляющих регулярные транспортные поездки, есть выбор: пользоваться общественным транспортом или ездить на работу автомобилем. Каждую из этих альтернатив можно рассматривать как набор различных характеристик: время нахождения в пути, время ожидания, имеющихся расходов, комфорта, удобства и тому подобное. Таким образом, можно обозначить продолжительность времени нахождения в пути для каждого рода поездки через х {, продолжительность времени ожидания для каждого вида поездки через х 2 и т. Д.

Если (хх, х2, Хя) представляет значение п различных характеристик автомобильных поездок, а (y1, y2 ... .. y п) - значения характеристик поездок на автобусе, то можно рассмотреть модель, в которой потребитель принимает решение о том, поехать ему автомобилем или автобусом, исходя из предпочтения одного набора указанных характеристик другому. Конкретнее можно предположить, что преимущества среднего потребителя в отношении указанных характеристик могут быть представлены функцией полезности вида:

где коэффициенты b и, b 2 i т. Д - неизвестные параметры. Любое монотонное преобразование этой функции полезности может описать потребительский выбор, однако с точки зрения статистики работать с линейной функцией значительно легче.

Предположим, что существует группа похожих по характеристикам потребителей, которые выбирают, поехать автомобилем или автобусом, основываясь при этом на конкретных данных о продолжительности времени поездок, о расходах и другие характеристики поездок, с которыми они сталкиваются. В статистике есть технические приемы, которые можно использовать для поиска значений коэффициентов Д, при и - 1, п, наиболее подходящие для исследовательской структуры выбора, осуществленного данной множественностью потребителей. Эти технические приемы статистики позволяют вывести оценочную функцию полезности для различных способов транспортного передвижения.

Мак-Федден и Доменик предложили функцию полезности вида:

где ТW - общее время ходьбы до автобуса или автомобиля или от него; ТТ - общее время поездки в минутах; С - общая стоимость поездки в долларах.

С помощью оценочной функции полезности удалось правильно описать выбор между автомобильным и автобусным транспортом для 93% домохозяйств взятой авторами выборки. Коэффициенты при переменных в изложенном уравнении показывают предельную полезность каждой такой характеристики. Отношение одного коэффициента к другому показывает предельную норму замещения одной характеристики другой. Например, отношение предельной полезности времени ходьбы пешком к предельной полезности общей продолжительности поездки указывает не то, что рядовой потребитель считает время ходьбы пешком примерно в 3 раза медленнее, чем время поездки. То есть потребитель был бы готов затратить 3 дополнительных минуты на поездку, чтобы сэкономить 1 минуту ходьбы пешком. Аналогично отношение стоимости поездки в общей продолжительности поездки указывает на выбор рядового потребителя относительно этих двух переменных. В исследовании рядовой пассажир оценивал минуту времени поездки на транспорте в 0,0411 х х 2,24 = 0,0183 долл. за минуту, что составляет 1,10 долл. в час. (Для сравнения - часовая зарплата среднего пассажира в 1967 г.. Составляла в сена 2,85 долл. В час.)

Такие оценочные функции полезности могут быть ценными для определения того, следует осуществлять какие-то изменения в системе общественного транспорта. Например, в приведенной выше функции полезности одним из важных факторов, объясняющих, чем руководствуются потребители в своем выборе, является продолжительность поездки. Городское управление транспортом могло бы при небольших затратах увеличить количество автобусов, чтобы сократить эту общую продолжительность поездки, но необходимо выяснить дополнительное количество пассажиров оправдает рост затрат.

Оперируя функцией полезности и выборке потребителей, можно сделать прогноз относительно того, какие потребители захотят совершать поездки автомобилем, а какие предпочтут автобуса. Это позволит получить некоторое представление о том, будет ли выручка достаточной для покрытия дополнительных расходов. Кроме того, можно использовать предельную норму замещения для формирования представления об оценке каждым потребителем сокращения времени поездок. По результатам исследования Мак-Феддена и Доменика рядовой пассажир в 1967 оценивал время поездки по ставке 1,10 долл. в час, он готов был заплатить 37 центов, чтобы сократить время поездки на 20 минут. Это число показывает степень выигрыша в долларах от более своевременного предоставления автобусных услуг. Наличие количественной меры выигрыша, безусловно, способствует принятию рациональных решений в сфере транспортной политики.

Еще один весомый вклад Мак-Феддена - это развитие в 1974 так называемого анализа условного логит. Модель предполагает, что каждый человек в жизни находится перед рядом альтернатив. Обозначим как X характеристики, связанные с каждой альтернативой, и как 2 характеристики лиц, исследователь может наблюдать с помощью имеющихся данных. Например, для изучения выбора способа путешествий, где альтернативой может быть автомобиль, автобус или метро, X может включать информацию относительно времени и расходов, тогда как X мог бы включать данные относительно возраста, дохода и образования. Но различия между индивидами и альтернативы папке, как между Х \%, хотя они незаметны исследователю, но именно они определяют индивидуальный максимально полезный выбор. Такие характеристики представлены случайными векторами ошибок. Мак-Федден предположил, что эти случайные ошибки имеют определенную статистическую дистрибуцию (распределение) среди населения, назвав ее дистрибуцией экстремального значения. В этих условиях (плюс некоторые технические предсказания) он продемонстрировал, что вероятность того, что лицо и выберет альтернативу /, может быть записана в виде многочленов логит-модели:

где e - основание натурального логарифма; b и b - параметры (векторы). В своей базе данных исследователь может наблюдать переменные X и Z фактически так, как индивид выбирает альтернативу. В результате ученый способен оценить параметры р и <5, использовав известные статистические методы. Мак-Федденивське дифференцировки логит-модели осталось новацией и признается фундаментальным достижением.

Модели обычно используются в исследованиях спроса на городские перевозки. Они также могут применяться на транспорте, когда планируется изучить эффективность политических мер, а также социальных реформ или изменений окружающей среды. Например * эти модели могут объяснить, как изменения в цене товаров улучшают их доступность, влияют они на демографическую ситуацию, на объемы путешествия, используя альтернативные способы передвижения. Модели также приемлемые для многих других сфер, в частности, в исследованиях выбора жилого помещения, места жительства или образования. Мак-Федден использовал разработанные методы для анализа многих социальных проблем, таких как спрос на бытовую энергию, телефонные услуги и обеспечение жильем людей пожилого возраста и тому подобное.

В результате своих исследований ученый пришел к выводу, что условные логит-модели имеют определенную особенность относительно вероятности выбора между двумя альтернативами, например путешествия автобусом или поездом, независимыми от цены других вариантов передвижения. Эта особенность, названная независимостью несвязанных альтернатив (ННА), нереалистично для статистического потребления. Д.-л. Мак-Федден изобрел не только статистические тесты для установления соответствия ННА, но и предложил общие модели, названные заключенным логит-моделями, которые предусматривают, что выборы индивидов могут быть сделаны в определенной последовательности. Например, при исследовании решений, касающихся места жительства и типа жилья, принято, что гражданин сначала выбирает микрорайон, а затем - тип жилого помещения.

Даже с этими обобщениями модели весьма чувствительны к определенным предсказаний относительно дистрибуции ненаблюдаемых характеристик среди населения. В течение последнего десятилетия Д.-л. Мак-Федден разработал имитационные модели (методы моделируемых моментов) для статистической оценки дискретного выбора моделей, которые допускают гораздо более основных предположений. Мощные компьютеры расширили практическую приспособленность этих численных методов. В результате дискретные выборы индивидов теперь могут быть описаны более реалистично, а их решения - предусмотрены точнее. На основе своей новой теории Мак-Федден разработал микроеконометрични модели, которые могут использоваться, например, для предсказания намерений той части населения, которая будет выбирать различные альтернативы. За развитие методики формального обработки индивидуальных статистических и экономических данных Мак-Феддена отмечено Нобелевской премией.

Д.-л. Мак-Федден в 60-е годы также изобрел эконометрические методы оценки производственной технологии и исследовал факторы, косвенно влияют на потребность фирмы в капитале и в рабочей силе. В течение 90-х лет талантливый ученый научно развил экономику природопользования, обогатил методическую литературу по оценке стоимости природных богатств, в частности исследовал потери общественного богатства вследствие нанесенных в 1989 г.. Убытков окружающей среде нефтяным пятном, движущейся от пострадавшего в аварии танкера "Exxon Valdez * вдоль побережья Аляски.

Лейтмотивом исследований профессора Д.-л. Мак-Феддена е попытки объединить экономическую теорию, статистические и эмпирические методы для решения с их помощью социальных проблем. Его научные разработки также помогают социологам и политикам оценить выбор голосующих, исходя из змьн в их доходах и др.

Мак-Федден первым предложил методологию анализа дискретного выбора, согласно которой каждый индивид выбирает определенную альтернативу, которая максимизирует его полезность. Функции полезности представляют собой способы описания потребительского выбора. Изучая выбор, сделанный потребителями, можно вывести оценочную функцию полезности, адекватно описывала бы их поведение.