Критерий равных возможностей. Критерий вальда, или как получить лучший гарантированный результат

Тренинги

Выбор наилучшего решения в условиях неопределенности существенно зависит от того, какова степень этой неопределенности, т.е. от того, какой информацией располагает ЛПР.

Предположения субъективны, поэтому и степени неопределенности со стороны ЛПР должны различаться. Практикуются два основных подхода к принятию решения в условиях неопределенности. Лицо, принимающее решение, может использовать имеющуюся у него информацию и свои собственные личные суждения, а также опыт для идентификации и определения субъективных вероятностей возможных внешних условий, оценки возможных последствий альтернатив в различных условиях внешней среды. Это, в сущности, делает условия неопределенности аналогичными условиям риска, а процедура принятия решения, обсуждавшаяся ранее для условий риска, выполняется и в этом случае.

Если степень неопределенности слишком высока, то ЛПР предпочитает не делать допущений относительно вероятностей различных внешних условий, т.е. это лицо может или не учитывать вероятности, или рассматривать их как равные, что практически одно и то же. Если применяется данный подход, то для оценки предполагаемых стратегий имеются четыре критерия решения:

1) критерий решения Вальда, называемый также максимином;
2) альфа-критерий решения Гурвица;
3) критерий решений Сэвиджа, называемый также критерием отказа от минимакса;
4) критерий решений Лапласа, называемый также критерием решения Бэйеса.

Пожалуй, наиболее трудная задача для ЛПР заключается в выборе конкретного критерия, наиболее подходящего для решения предложенной задачи. Выбор критерия должен быть логичным при данных обстоятельствах. Кроме того, при выборе критерия должны учитываться философия, темперамент и взгляды нынешнего руководства фирмы (оптимистические или пессимистические, консервативные или прогрессивные).

Рассмотрим эти утверждения на конкретном примере. Элементами модели выбора альтернатив в условиях неопределенности являются матрица принятия решений |А i, Sj| и целевая функция Е {A i, w (S j)} (рис. 6.9).

Рис. 6.9.

А i, – альтернативы действий; Sj – состояние внешней среды; w (S j) – вероятности наступления состояния S j, причем Σmj= 1w(S j) = 1; e ij – результат, который будет достигнут, если выбрана альтернатива А i и наступит состояние внешней среды S j

В качестве иллюстрационного примера возьмем матрицу решений (рис. 6.10), включающую в себя пять альтернатив (A i; i = 1, ..., 5) и четыре состояния внешней среды (S j; j = 1,4). Последствия принимаемых решений приведены на пересечении строк и столбцов (e ij).

Рис. 6.10.

В условиях определенности, т.е. когда принятие решений происходит после наступления событий во внешней среде (апостериори), должно приниматься решение, максимизирующее целевую функцию (рис. 6.11). Так, при наступлении события S 1 необходимо принимать альтернативу A2, при S2 → A4, при S3 → A5, при S4 → A1.

Рис. 6.11.

В условиях риска необходимо принимать решение (выбирать альтернативу Ai) до наступления события Sj во внешней среде (априори), что требует учета вероятности w (Sj) наступления этого события. Это можно сделать путем умножения вероятности наступления этого события w (S j) на результат e ij, получаемый от принятия того или иного решения, и выбрать наибольшее значение Ai (рис. 6.12).

Рис. 6.12.

В случае если степень неопределенности слишком высока, то ЛПР может присваивать значениям вероятности свои субъективные значения, сводя задачу к принятию решений в условиях риска, либо не делать допущений относительно вероятностей различных внешних условий, т.е. может или не учитывать вероятности, или рассматривать их как равные, применяя различные критерии для выбора.

Критерий решения Вальда

Критерием Вальда "рассчитывай на худшее" (критерий крайнего пессимизма, или максимин) называют критерий, предписывающий обеспечить значение параметра эффекта, равного а:

Этот критерий ориентирует ЛПР на наихудшие условия и рекомендует выбрать ту стратегию, для которой выигрыш максимален. В других, более благоприятных условиях использование этого критерия приводит к потере эффективности системы или операции.

В рассматриваемом случае (рис. 6.13) в соответствии с критерием "крайнего пессимизма" наилучшей альтернативой будет A1.

Другим предельным случаем критерия Вальда является критерий "необузданного оптимизма", или максимакс:

В соответствии с этим критерием необходимо выбрать альтернативу А 2.

Рис. 6.13.

Альфа-критерий решения Гурвица

Этот критерий рекомендует при выборе решения в условиях неопределенности не руководствоваться крайним пессимизмом (всегда "рассчитывай на худшее", α = 0) или крайним оптимизмом ("все будет наилучшим образом", а = 1). Рекомендуется некое среднее решение (0 ≤ α ≤ 1). Этот критерий имеет следующий вид:

где α – некий коэффициент, выбираемый экспериментально из интервала между 0 и 1.

Использование этого коэффициента вносит дополнительный субъективизм в принятие решений с использованием критерия Гурвица.

В рассматриваемом примере (рис. 6.14) для случая а = 0,7 предпочтительной альтернативой становится А3.

Рис. 6.14.

Здесь приняты следующие обозначения:

Критерий решения Сэвиджа

В соответствии с этим минимаксным критерием, если требуется в любых условиях избежать большого риска, то оптимальным будет то решение, для которого риск, максимальный при различных вариантах условий, окажется минимальным.

При использовании критерия Сэвиджа обеспечивается наименьшее значение максимальной величины риска:

где риск r ij определяется выражением r ij = β – e ij, β – максимально возможный выигрыш.

Критерий Сэвиджа, как и критерий Вальда, – это критерий крайнего пессимизма, но только пессимизм здесь проявляется в том, что минимизируется максимальная потеря в выигрыше по сравнению с тем, чего можно было бы достичь в данных условиях.

Для рассматриваемого примера результаты выбора альтернативы приведены на рис. 6.15.

Рис. 6.15.

В рассматриваемом примере альтернатива А 4 минимизирует максимальное "наказание" за неверно определенное состояние внешней среды.

Критерий решения Лапласа

Критерий Лапласа, или байесов критерий, гласит, что если вероятности состояния среды неизвестны, то они должны приниматься как равные. В этом случае выбирается стратегия, характеризующаяся самой предполагаемой стоимостью при условии равных вероятностей. Критерий Лапласа позволяет сводить условие неопределенности к условиям риска. Критерий Лапласа называют критерием рациональности, и он подходит для стратегических долгосрочных решений, как и все названные выше критерии.

В рассматриваемом примере наилучшей альтернативой по критерию Лапласа (рис. 6.16) является А 5.

Рис. 6.16.

Кроме названных выше четырех критериев для принятия решений в условиях неопределенности существуют неколичественные методы, такие как приобретение дополнительной информации, хеджирование, гибкое инвестирование и др.

Критерий Сэвиджа один из критериев принятия решений в условиях неопределённости. Условиями неопределённости считается ситуация, когда последствия принимаемых решений неизвестны, и можно лишь приблизительно их оценить. Для принятия решения… … Википедия

Критерий согласия Колмогорова - или Критерий согласия Колмогорова Смирнова статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели.… … Википедия

Вальда критерий - , другое написание критерий Уолда см. Максимин … Экономико-математический словарь

Критерий согласия Пирсона - Критерий Пирсона, или критерий χ² (Хи квадрат) наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая… … Википедия

Критерий Краскела - Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона Манна Уитни. Критерий Краскела Уоллиса является ранговым, поэтому он инвариантен по отношению к любому… … Википедия

Критерий Кохрена - Критерий Кохрена используют при сравнении трёх и более выборок одинакового объёма. Расхождение между дисперсиями считается случайным при выбранном уровне значимости, если: где квантиль случайной величины при числе суммируемых… … Википедия

Критерий Лиллиефорса - статистический критерий, названный по имени Хьюберта Лиллиефорса, профессора статистики Университета Джорджа Вашингтона, являющийся модификацией критерия Колмогорова–Смирнова. Используется для проверки нулевой гипотезы о том, что выборка… … Википедия

Критерий Уилкоксона - Для улучшения этой статьи желательно?: Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное. Добавить иллюстрации. Т Крит … Википедия

Последовательный статистический критерий - Последовательный статистический критерий последовательная статистическая процедура, используемая для проверки статистических гипотез в последовательном анализе. Пусть наблюдению в статистическом эксперименте доступна случайная величина с… … Википедия

Тест Вальда - (англ. Wald test) статистический тест, используемый для проверки ограничений на параметры статистических моделей, оцененных на основе выборочных данных. Является одним из трех базовых тестов проверки ограничений наряду с тестом… … Википедия

Книги

Теория вероятностей и математическая статистика в задачах: Более 360 задач и упражнений , Борзых Д.. В предлагаемом пособии содержатся задачи различного уровня сложности. Однако основной акцент сделан на задачах средней сложности. Это сделано намеренно с тем, чтобы побудить студентов к… Купить за 443 руб
Теория вероятностей и математическая статистика в задачах. Более 360 задач и упражнений , Борзых Д.А.. В предлагаемом пособии содержатся задачи различного уровня сложности. Однако основной акцент сделан на задачах средней сложности. Это сделано намеренно с тем, чтобы побудить студентов к…

Критерий сожаления. Критерий математического ожидания . Психология поведения ЛИР в ситуациях риска и неопределенности. Использование теории полезности для выбора оптимального варианта решения. Интуитивный выбор оптимального варианта.

КРИТЕРИЙ ВАЛЬДА (критерий максимина")

Как видно из приведенной таблицы, оптимальная альтернатива рискового решения в условиях неопределенности по критерию Вальда (критерию "максимина") находится в затененном поле и соответствует 140 усл. ден. ед. (это значение эффективности является максимальным из всех минимальных ее значений при наихудших вариантах ситуаций).

Критерием Вальда (критерием "максимина") руководствуется при выборе рисковых решений в условиях неопределенности , как правило, субъект, не склонный к риску или рассматривающий возможные ситуации как пессимист.

Величина W - это такое значение показателя W(x, у), которое мы можем гарантировать себе при наихудшем для нас поведении природы (гарантированный результат). Если мы применим управление х е X, отличное от найденного в сформулированной задаче, природа -может наказать нас за легкомыслие, выбрав наихудшее значение параметра у, при котором мы получим показатель W, меньший W. Этот критерий выбора решения иногда называют также критерием Вальда.

Максиминная оценка по критерию Вальда является единственной абсолютно надежной при принятии решения в условиях неопределенности.

Стратегия S называется максиминной, т.е. при любом из условий конъюнктуры рынка результат будет не хуже, чем W = 49310,03 тыс. руб. Поэтому эту величину называют нижней ценой игры , или максимином, а также принципом наибольшего гарантированного результата на основе критерия Вальда, в соответствии с которым оптимальной стратегией при любом состоянии среды, позволяющем получить максимальный выигрыш в наихудших условиях, является максиминная стратегия.

Критерий Вальда представляет собой критерий крайнего пессимизма и ориентирует лицо, принимающее решение, на наихудшие условия реализации проекта.

Максиминный критерий Вальда. Здесь выбирается решение торговой организации, при котором гарантируется максимальный выигрыш в наихудших условиях внешней среды (состояния природы)

Стратегия, соответствующая максимальному значению среди минимумов строк, называется максиминной стратегией . Соответствующий критерий (критерий Вальда) записывается так

Другими словами, оптимальной по критерию Вальда будет та стратегия, при которой наименьший выигрыш является наибольшим среди наименьших выигрышей всех стратеги и. Величину W(, i = 1...m назовем показателем оптимальности стратегии А по критерию Вальда. Значит,

Один из методов заключается в выборе наилучшей из худших возможностей (критерий Вальда). При этом для каждой из стратегий выбирается худший результат, а затем из них - лучший. 108

Если при этом получаются стратегии с одинаковыми критериями Вальда, то из них выбирают стратегию, которая имеет наименьшую чувствительность ко внешним условиям "

Его также называют максиминным критерием Вальда. Сущность данного критерия заключается в следующем. ЛПР располагает множеством стратегий (вариантов, альтернатив) решения проблемы

Поэтому возникает необходимость определения возможных отклонений полученных результатов от их оптимальных значений. Здесь находит применение критерий Сэвиджа . Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей Е, а матрицей рисков R, построенной по формуле (2.2.2).

Наибольшая осторожность Ег = max min е i j Критерий гарантированного результата (Вальда)

А. Вальд также доказал, что его критерий существенно выгоднее (по среднему числу наблюдений), чем наилучший из классических критериев - критерий Неймана-Пирсона.

В частности, максиминный критерий Вальда обеспечивает максимизацию минимального выигрыша или, что то же самое, минимизацию максимальных потерь , которые могут быть при реализации одной из стратегий. Данный критерий прост и четок, но консервативен в том смысле, что ориентирует принимающего решение на слишком осторожную линию поведения. Величина, соответствующая максиминному критерию, называется нижней ценой игры , под которой следует подразумевать максимальный выигрыш, гарантируемый в игре с данным противником выбором одной из своих стратегий при минимальных результатах.

Критерий Вальда (или критерий "максимина") предполагает, что из всех возможных вариантов "матрицы решений " выбирается та альтернатива, которая из всех самых неблагоприятных ситуаций развития события (минимизирующих значение эффективности) имеет наибольшее из минимальных значений (т.е. значение эффективности, луч-

Максиминный критерий Вальда используется в случаях, когда требуется гарантия, чтобы выигрыш в любых условиях оказывался не менее чем наибольший из возможных в худших условиях. критерии Гурвица . Его значение находится в пределах 0

В формуле этого критерия присутствует коэффициент а, значение которого устанавливается в зависимости от степени уверенности лица, принимающего решение, в правильности своего выбора, какому сценарию реализации проекта следует отдать предпочтение). Значение а выбирается в интервале от 0 до 1. При ос=0 критерий Гурвица превращается в критерий крайнего оптимизма при ос=1 - в критерий Вальда. При 0, тем большее желание "подстраховаться", тем ближе к 1 выбирается коэффициент.

Критерий правдоподобия является несмещенным и состоятельным, при больших выборках -2-log X имеет распределение хи-квадрат (hi-squared distribution) с г степенями свободы , где / - число параметров р, конкретные значения которых определяет Н0. Критерий правдоподобия (LK) эквивалентен критерию Вальда (W) и критерию множителя Лагранжа (LM) при асимптотическом приближении, однако при малых выборках W>LR>LM.

MAXIMIN- ориентирован на получение гарантированного выигрыша при наихудшем состоянии внешней среды (подход пессимиста, критерий Вальда). В соответствии с ним в качестве оптимальной выбирается альтернатива, имеющая максимальное значение ожидаемого результата в наименее благоприятном состоянии среды. Здесь решение - отказ от строительства.

Таким образом, критерий гарантированного результата (мак-симинный критерий Вальда) записывается в виде

Близкой по идеям и методам к теории игр является теория статистических решений. От теории игр она отличается тем, что ситуация неопределенности не имеет конфликтной окраски – никто ни кому не противодействует, но налицо элемент неопределенности. В задачах теории статистических решений неизвестные условия операции зависят не от сознательно действующего противника, а от объективной действительности, которую в теории статистических решений принято называть “природой”. Соответствующие ситуации часто называют играми с природой (статистическими играми).

Часто эти ситуации вообще относят к теории игр, оговариваясь в определении игры, что одним из участников может быть среда (природа), действующая как сумма дезорганизующих обстоятельств, весь комплекс внешних условий, в которых игроку приходится принимать решение. Назовем этого игрока – статистиком.

Природа безразлична к выигрышу и не стремится обратить в свою пользу промахи статистика. Пусть статистик имеет m стратегий, а природа может реализовать n своих состояний. Если статистик имеет возможность оценить численно последствия каждой своей чистой стратегии при любом состоянии природы, то игру можно задать платежной матрицей. При упрощении платежной матрицы имеется специфика: нельзя отбрасывать те или иные стратегии “природы”, так как она может реализовать их вне зависимости от того, выгодны они статистику или нет.

При решении таких игр могут быть 2 ситуации:

· игроку А неизвестны вероятности pj , с которыми природа реализует свои состояния;

· вероятности pj известны.

Для принятия решения в таких играх используют различные критерии.

Если вероятности pj состояний природы неизвестны, то можно пользоваться критериями Вальда, Лапласа, Сэвиджа, Гурвица и пр. Основное различие между названными критериями определяется стратегией поведения лица, принимающего решение в условиях неопределенности. Например, критерий Лапласа основан на более оптимистичных предположениях, чем критерий Вальда. Критерий Гурвица можно использовать при различных подходах: от наиболее оптимистичного до наиболее пессимистичного. Таким образом, перечисленные критерии, несмотря на их количественную природу, отражают субъективную оценку ситуации, в которой статистику приходится принимать решение. К сожаленью, не существует общих правил оценки применимости того или иного критерия, так как поведение лица, принимающего решение, по всей видимости, является наиболее важным фактором при выборе подходящего критерия. Сформулируем эти критерии.

1. Критерий Лапласа

Этот критерий опирается на принцип недостаточного обоснования , по которому считается, что наступление всех состояний природы равновероятно, то есть p 1 = p 2 =...= p n =1/ n , а оптимальной считается стратегия Ai , обеспечивающая

. (5.1)

2. Критерий Вальда (минимаксный или максминный критерий )

Этот критерий является наиболее осторожным, поскольку основан на выборе наилучшей из наихудших возможностей:

– в случае нахождения выигрыша;

– в случае нахождения потерь.

Это пессимистические критерии.

3. Критерий Сэвиджа (минимаксного риска)

Критерий Вальда настолько пессимистичен, что может привести к нелогичным выводам. Рассмотрим следующую матрицу потерь, которая обычно приводится в качестве классического примера для обоснования “менее пессимистичного” критерия Сэвиджа.


	11000
	10000	10000

Применение минимаксного критерия приводит к выбору стратегии А2, хотя интуитивно можно выбрать А1, так как при этом выборе можно надеется проиграть 90, тогда как выбор А2 всегда приводит к потерям в 10000 единиц при любом состоянии погоды..

Критерий Сэвиджа “исправляет” положение введением новой матрицы потерь, в которой заменяются на font-size:14.0pt;line-height: 150%">, определяемые следующим образом:

Это означает, что есть разность между наилучшим значением в столбце j и значением .

По существу, выражает сожаление лица, принимающего решение, по поводу того, что он не выбрал наилучшего действия относительно состояния j . Матрица R =() ê называется матрицей сожаления или матрицей риска.

Найдем оптимальную стратегию предыдущей задачи по этому критерию:

Применим к матрице “сожаления” R минимаксный критерий. Получим, что оптимальной стратегией будет– А1.

Отметим, что независимо от того, – доход или потери, – всегда потери. Поэтому к матрице “сожаления” всегда применяется минимаксный критерий.

4. Критерий Гурвица (пессимизма-оптимизма)

Этот критерий охватывает ряд различных подходов к принятию решений: от наиболее оптимистичного до наиболее пессимистичного.

При оптимистичном подходе выбирают стратегию, дающую :

, если – выигрыш, и

, если – потери.

Аналогично при наиболее пессимистичных предположениях выбираемое решение соответствует : , если – выигрыш, и

font-size:14.0pt;line-height: 150%">, если – потери.

Критерий Гурвица устанавливает баланс между случаями крайнего оптимизма и пессимизма взвешиванием обоих способов поведения с соответствующими весами a и 1- a , где 0 £ a £ 1.

Если – прибыль, то выбирается стратегия по правилу:

Если – затраты, критерий выбирает стратегию, дающую

Параметр a интерпретируется как показатель оптимизма; при a =1 критерий слишком оптимистичный, при a =0 он слишком пессимистичный. Значение a между 0 и 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или оптимизму. a =0,5 представляется наиболее разумным.

Анализ практических ситуаций обычно проводится на основе нескольких критериев, что позволяет глубже исследовать суть явления.

Пример.

Одно из предприятий должно определить уровень предложения услуг так, чтобы удовлетворить потребности клиентов. Точное число клиентов не известно, но ожидается, что оно может принимать одно из следующих значений: 200, 250, 300, 350. Для каждого из этих возможных значений существует наилучший уровень предложения (с точки зрения возможных затрат). Отклонения от этих уровней приводят к дополнительным затратам либо из-за превышения предложения над спросом, либо из-за неполного удовлетворения спроса.

Потери в зависимости от ситуации приведены в следующей таблице:

Клиенты Предложен.
a 1
a 2
a 3
a 4

· Критерий Вальда . Так как – потери, применяем минимаксный критерий.

Оптимальной стратегией будет А3.

· Критерий Лапласа . Пусть стратегии 2-го игрока равновероятны. Следовательно . Тогда:

EN-US">EN-US">EN-US">font-size:14.0pt;line-height:150%">Таким образом, наилучшим уровнем предложения в соответствии с критерием Лапласа будет стратегия А2.

· Критерий Сэвиджа . Построим матрицу риска:

position:absolute; z-index:2;left:0px;margin-left:68px;margin-top:21px;width:213px;height:2px">

Лучшая стратегия А2.

· Критерий Гурвица. Пусть a =1 / 2.


			5/2+25/2=15
			7/2+23/2=15
			12/2+21/2=16,5
			15/2+30/2=22,5

Лучшие стратегии А1 и А2.

Если находить решение методами теории игр, то сначала ищем наличие седловой точки:

Эта игра имеет седловую точку и оптимальной будет стратегия А3.

5. Критерий Байеса

Если вероятности состояний природы – pj известны, то можно пользоваться критерием Байеса, согласно которому:

оптимальной считается чистая стратегия, соответствующая максимальному среднему выигрышу: , если – выигрыш и минимальным средним потерям: , если –потери.

Если в предыдущем примере известны вероятности спроса font-size:14.0pt;line-height: 150%">, то для нахождения оптимальной стратегии необходимо найти средние потери для каждой чистой стратегии предприятия и выбрать ту, которая обеспечивает минимум средних потерь: font-size:14.0pt;line-height: 150%;font-family:Symbol">® стратегия А2.

Можно показать, что та стратегия, которая обращает в максимум средний выигрыш, обращает в минимум и средний риск.

Все рассмотренные критерии были сформулированы для чистых стратегий, но каждый из них может быть распространен и на смешанные стратегии, подобно тому, как это делается в теории игр. В теории статистических решений смешанные стратегии имеют смысл при многократном повторении игры.

Но многократно повторяя игру, можно определить частоты повторений той или иной ситуации и в дальнейшем применять стохастический подход к задаче принятия решений.

Если использовать смешанные стратегии, то критерий Вальда формулируется следующим образом: оптимальной будет смешанная стратегия , обеспечивающая , т. е. максимизирующая средний выигрыш (если –выигрыш)

Критерий Сэвиджа для смешанных стратегий : оптимальной считается та смешанная стратегия, при которой максимальный средний риск статистика минимален, то есть стратегия , найденная из условия .

Оптимальные смешенные стратегии в этом случае находятся также, как в обычной матричной игре.

Этот критерий опирается на «принцип недостаточного основания» Лапласа, согласно которому все состояния «природы» Si, i = 1,n полагаются равновероятными. В соответствии с этим принципом каждому состоянию Si, ставится вероятность q i определяемая по формуле

При этом исходной может рассматриваться задача принятия решения в условиях риска, когда выбирается действие R j , дающее наибольший ожидаемый выигрыш. Для принятия решения для каждого действия R j вычисляют среднее арифметическое значение выигрыша:

(26)

Среди Mj(R) выбирают максимальное значение, которое будет соответствовать оптимальной стратегии R j .

Другими словами, находится действие Rj , соответствующее

(27)

Если в исходной задаче матрица возможных результатов представлена матрицей рисков ||r ji ||, то критерий Лапласа принимает следующий вид:

(28)

Пример 4. Одно из транспортных предприятий должно определить уровень своих провозных возможностей так, чтобы удовлетворить спрос клиентов на транспортные услуги на планируемый период. Спрос на транспортные услуги не известен, но ожидается (прогнозируется), что он может принять одно из четырех значений: 10, 15, 20 или 25 тыс. т. Для каждого уровня спроса существует наилучший уровень провозных возможностей транспортного предприятия (с точки зрения возможных затрат). Отклонения от этих уровней приводят к дополнительным затратам либо из-за превышения провозных возможностей над спросом (из-за простоя подвижного состава), либо из-за неполного удовлетворения спроса на транспортные услуги. Ниже приводится таблица, определяющая возможные прогнозируемые затраты на развитие провозных возможностей:

Необходимо выбрать оптимальную стратегию.

Согласно условию задачи, имеются четыре варианта спроса на транспортные услуги, что равнозначно наличию четырех состояний «природы»: S 1 , S 2 , S 3 , S 4 . Известны также четыре стратегии развития провозных возможностей транспортного предприятия: R 1 , R 2 , R 3 , R 4 Затраты на развитие провозных возможностей при каждой паре S i и R j заданы следующей матрицей (таблицей):

Принцип Лапласа предполагает, что S 1 , S 2 , S 3 , S 4 равновероятны. Следовательно, P{S = S i }= 1/n= 1/4 = 0,25, i = 1, 2, 3, 4 и ожидаемые затраты при различных действиях R 1 , R 2 , R 3 , R 4 составляют:

Таким образом, наилучшей стратегией развития провозных возможностей в соответствии с критерием Лапласа будет R 2 .

2. Критерий Вальда (минимаксный или максиминный критерий). Применение данного критерия не требует знания вероятностей состояний Si. Этот критерий опирается на принцип наибольшей осторожности, поскольку он основывается на выборе наилучшей из наихудших стратегий Rj.

Если в исходной матрице (по условию задачи) результат V ij представляет потери лица, принимающего решение, то при выборе оптимальной стратегии используется минимаксный критерий. Для определения оптимальной стратегии R j необходимо в каждой строке матрицы результатов найти наибольший элемент max{V ij }, а затем выбирается действие R j (строка j), которому будет соответствовать наименьший элемент из этих наибольших элементов, т. е. действие, определяющее результат, равный

(29)

Если в исходной матрице по условию задачи результат V ij представляет выигрыш (полезность) лица, принимающего решение, то при выборе оптимальной стратегии используется максиминный критерий.

Для определения оптимальной стратегии R j в каждой строке матрицы результатов находят наименьший элемент min {Vij} , а затем выбирается действие R j (строка j), которому будут соответствовать наибольшие элементы из этих наименьших элементов, т. е. действие, определяющее результат, равный

(30)

Пример 5. Рассмотрим пример 4. Так как V ij в этом примере представляет потери (затраты), применим минимаксный критерий. Необходимые результаты вычисления приведены в следующей таблице:

Таким образом, наилучшей стратегией развития провозных возможностей в соответствии с минимаксным критерием «лучшим из худших» будет третья, т. е. R 3 .

Минимаксный критерий Вальда иногда приводит к нелогичным выводам из-за своей чрезмерной «пессимистичности». «Пессимистичность» этого критерия исправляет критерий Сэвиджа.

3. Критерий Сэвиджа использует матрицу рисков || r ij ||. Элементы данной матрицы можно определить по формулам (23), (24), которые перепишем в следующем виде:

(31)

Это означает, что r ij есть разность между наилучшим значением в столбце i и значениями V ji при том же i. Независимо от того, является ли V ji доходом (выигрышем) или потерями (затратами), r ji в обоих случаях определяет величину потерь лица, принимающего решение. Следовательно, можно применять к r ji только минимаксный критерий. Критерий Сэвиджа рекомендует в условиях неопределенности выбирать ту стратегию Rj, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации (когда риск максимален).

Пример 6. Рассмотрим пример 4. Заданная матрица определяет потери (затраты). По формуле (31) вычислим элементы матрицы рисков || r ij ||:

Полученные результаты вычислений с использованием критерия минимального риска Сэвиджа оформим в следующей таблице:

Введение величины риска r ji , привело к выбору первой стратегии R 1 , обеспечивающей наименьшие потери (затраты) в самой неблагоприятной ситуации (когда риск максимален).

Применение критерия Сэвиджа позволяет любыми путями избежать большого риска при выборе стратегии, а значит, избежать большего проигрыша (потерь).

4. Критерий Гурвица основан на следующих двух предположениях: «природа» может находиться в самом невыгодном состоянии с вероятностью (1 - α) и в самом выгодном состоянии с вероятностью α, где α - коэффициент доверия. Если результат V j i - прибыль, полезность, доход и т. п., то критерий Гурвица записывается так:

Когда V ji представляет затраты (потери), то выбирают действие, дающее

Если α = 0, получим пессимистический критерий Вальда.

Если α = 1, то приходим к решающему правилу вида max max V ji , или к так называемой стратегии «здорового оптимиста», т. е. критерий слишком оптимистичный.

Критерий Гурвица устанавливает баланс между случаями крайнего пессимизма и крайнего оптимизма путем взвешивания обоих способов поведения соответствующими весами (1 - α) и α, где 0≤α≤1. Значение α от 0 до 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или к оптимизму. При отсутствии ярко выраженной склонности α = 0,5 представляется наиболее разумной.

Пример 7. Критерий Гурвица используем в примере 4. Положим α = 0,5. Результаты необходимых вычислений приведены ниже:

Оптимальное решение заключается в выборе W.

Таким образом, в примере предстоит сделать выбор, какое из возможных решений предпочтительнее:

по критерию Лапласа - выбор стратегии R 2 ,

по критерию Вальда - выбор стратегии R 3 ;

по критерию Сэвиджа - выбор стратегии R 1 ;

по критерию Гурвица при α = 0,5 - выбор стратегии R 1 , а если лицо, принимающее решение, - пессимист (α = 0), то выбор стратегии R 3 .

Это определяется выбором соответствующего критерия (Лапласа, Вальда, Сэвиджа или Гурвица).

Выбор критерия принятия решений в условиях неопределенности является наиболее сложным и ответственным этапом в исследовании операций. При этом не существует каких-либо общих советов или рекомендаций. Выбор критерия должно производить лицо, принимающее решение (ЛПР), с учетом конкретной специфики решаемой задачи и в соответствии со своими целями, а также опираясь на прошлый опыт и собственную интуицию.

В частности, если даже минимальный риск недопустим, то следует применять критерий Вальда. Если, наоборот, определенный риск вполне приемлем и ЛПР намерено вложить в некоторое предприятие столько средств, чтобы потом оно не сожалело, что вложено слишком мало, то выбирают критерий Сэвиджа.