Главная » Учебно-методические материалы » ВЫСШАЯ МАТЕМАТИКА, ТВ и МС, МАТ. МЕТОДЫ » Математические методы в экономике |
22.12.2011, 13:32 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Основные понятия. Игры в чистых стратегиях Во многих экономических задачах часто возникают ситуации, когда две или более сторон разрешают одну и ту же проблему, но преследуют различные цели, их интересы противоположны. Подобные ситуации называютсяконфликтными. Примерами таких ситуаций служат отношения между продавцом и покупателем, адвокатом и прокурором, кредитором и дебитором, истцом и ответчиком и т.д.
Эта матрица называется платежной или матрицей игры. Рассмотрим игру со стороны А. Он, выбирая свою стратегию Аi, понимает, что В ответит ему такой стратегией Вj, чтобы выигрыш А был минимальным. Поэтому, из всех наихудших вариантов (минимальных элементов каждой строки платежной матрицы) ![]() ![]() Величина a называется нижнейценой игры или максимином. Это гарантированный выигрыш игрока А. С другой стороны, игрок В выбирая свою стратегию Вj понимает, что игрок А ответит такой стратегией Аi, чтобы его выигрыш был максимален. Поэтому из наилучших вариантов для А (максимальных элементов каждого столбца) ![]() ![]() Величина β называется верхней ценой игры или минимаксом. Это максимальный проигрыш игрока В. Реальный результат решения конфликтной ситуации, называемый ценой игры n, заключен между верхней и нижней ценой: ![]() ![]() ![]() Пример: Дебитор А желает выбрать один из четырех условий займа: А1, А2, А3, А4. Кредитор может на любой вариант займа ответить вариантом предоставления кредита В1, В2, В3, В4, В5. Процентные ставки для дебитора при любом варианте кредитора представлены платежной матрицей:
Находим минимальные элементы каждой строки платежной матрицы αI и из них находим максимальное значение. Из максимальных элементов каждого столбца βj выбираем минимальный.
Видно, что верхние и нижние цены игры совпадают ![]() ![]() Решение игр в смешанных стратегиях Рассмотрим теперь ситуацию, когда верхняя и нижняя цены не совпадают
Решение игры ![]() ![]() ![]() ![]() ![]() ![]() ![]() Пример. Игрок А прячет в одной из рук монету. Игрок В пытается угадать руку с монетой. Если В не угадывает, то Аполучает от В 1 у.е. Если В угадывает руку с монетой и эта рука правая, то он получает от А 1 у.е. Если В находит монету в левой руке, то он получает от А 2 у.е. Определить оптимальные стратегии поведения для каждого игрока и средний выигрыш для А. Пусть стратегии игроков: А1 – спрятать в правой; В1 – искать в правой; А2 – спрятать в левой; В2 – искать в левой. Игровая матрица для данной ситуации относительно игрока А имеет вид:
Тогда вероятности чистых стратегий в смешанной равны: ![]() ![]() ![]() ![]() ![]() Таким образом, игроку А нужно случайно чередовать руки с монетой, но в правой руке прятать в среднем в трех случаях из пяти, а в левой в двух случаях из пяти. В это случае в каждой игре в среднем А получит (-1/5) руб., то есть теряет 20 коп., игра для А не выгодная. Для игрока В выгодно также чередовать руки в которых он ищет монету, но в правой руке искать в 3 случаях из 5, что приведет к среднему выигрышу для него в 20 коп. за игру. В некоторых случаях удается аналогичным образом решить и игровые ситуации с платежными матрицами, большего размера, упростив их до игры 2х2. При этом используются следующие правила: 1) Если все элементы какой-либо строки платежной матрицы не превышают соответствующих элементов любой другой строки, то строка с меньшими элементами соответствует стратегии, которая для игрока А заведомо не выгодна при любом ответе игрока В. Поэтому из платежной матицы строку с меньшими элементами можно вычеркнуть, тем самым выведя из рассмотрения соответствующую ей стратегию. 2) С другой стороны, для игрока В невыгодна заранее, независимо от ответа А, стратегия, которой соответствует столбец платежной матрицы, у которого все элементы больше или равны соответствующим элементам любого другого столбца. Столбец с большими элементами также можно вывести из рассмотрения, вычеркнув из платежной матрицы. Пример. Директор транспортной компании А, оказывающей транспортные услуги по перевозке пассажиров в областном центре, планирует открыть один или несколько маршрутов: А1, А2, А3 и А4. Для этого было закуплено 100 микроавтобусов. Он может поставить весь транспорт на одном из маршрутов (наиболее выгодном), либо распределить по нескольким маршрутам. Спрос на транспорт, а соответственно и прибыль компании во многом зависит от того, какие маршруты в ближайшее время откроет главный конкурент - компания В. Ее руководство полностью владеет ситуацией и может открыть несколько из пяти маршрутов В1, В2, В3, В4 и В5. Оценки прибыли компании А (млн. руб.) при любом ответе В представлена платежной матрицей:
Находим оптимальное распределение прибыли по маршрутам и ожидаемую прибыль. Вычеркиваем из таблицы второй столбец, т.к. все его элементы больше или равны элементам третьего. Вычеркиваем четвертую строку, т.к. ее оставшиеся элементы меньше элементов третьей. Элементы первого столбца больше элементов третьего, вычеркиваем первый столбец. Вторую строку вычеркиваем в результате сравнения с первой. Четвертый столбец вычеркиваем после сравнения с третьим. В результате получаем матрицу: ![]() которая эквивалентна матрице:
Тогда вероятности чистых стратегий компании А в смешанной ![]() ![]() ![]() ![]() Рассмотрим случай, когда платежную матрицу нельзя упростить до размера 2х2. Пусть упрощенная платежная матрица имеет вид: ![]() ![]() ![]() ![]() ![]() ![]() ![]() Из решения задач линейного программирования находятся цена игры ![]() ![]() Пример. Построить прямую и двойственную задачи линейного программирования для решения матричной игры, заданной платежной матрицей: ![]() Прямая и двойственная задачи линейного программирования имеют вид: ![]() ![]() Из решения можно найти игры цену игры ![]() ![]() Игры с природой В рассмотренных ранее задачах соперником игрока А был другой «мыслящий» игрок В. Однако часто таким «соперником» может быть некоторое стечение обстоятельств, неконтролируемое человеком. Выбор стратегии стороной В происходит случайно, совершенно не рассматривая, выгодно это А или нет. Такие ситуации называются играми с природой.
Рассмотрим основные критерии, позволяющие выбирать оптимальную альтернативу для принятия решения. 1) Критерий Лапласа. Он основан на предположении, что каждый вариант развития ситуации (состояния «природы») равновероятен. Поэтому, для принятия решения, необходимо рассчитать функцию полезности ![]() ![]() Выбирается та альтернатива, для которой функция полезности максимальна. Для примера: ![]() Видно, что функция полезности максимальна для альтернативы А5, следовательно ее рациональнее всего принять. 2) Критерий Вальда. Данный критерий основывается на принципе максимального пессимизма, то есть на предположении, что скорее всего произойдет наиболее худший вариант развития ситуации и риск наихудшего варианта нужно свести к минимуму. Для применения критерия нужно для каждой альтернативы выбрать наихудший показатель привлекательности ![]() ![]() ![]() 3) Критерий максимального оптимизма. Наиболее простой критерий, основывающийся на идее, что ЛПР, имея возможность в некоторой степени управлять ситуацией, рассчитывает, что произойдет такое развитие ситуации, которое для него является наиболее выгодным. В соответствии с критерием принимается альтернатива, соответствующая максимальному элементу матрицы выигрышей. Для приведенного примера эта величина ![]() ![]() 4) Критерий Сэвиджа. Он основан на принципе минимизации потерь, связанных с тем, что игрок А принял не оптимальное решение. Для решения задачи составляется матрица потерь, которая называется матрицей рисков ![]() ![]() ![]()
Далее, для каждой альтернативы определяем величины ![]() ![]() ![]() ![]() ![]() ![]() ![]() 5) Критерий Гурвица. Это самый универсальный критерий, который позволяет управлять степенью «оптимизма - пессимизма» игрока А. Введем некоторый коэффициент a, который назовем коэффициентом доверия или коэффициентом оптимизма. Этот коэффициент можно интерпретировать как вероятность, с которой произойдет наилучший для А исход. Исходя из этого, наихудший вариант можно ожидать с вероятностью (1-α). Коэффициент доверия a показывает, насколько игрок А может управлять ситуацией и в той или иной степени рассчитывает на благоприятный для него исход. Если вероятности благоприятной и неблагоприятной ситуации для А равны, то следует принять α=0,5. Для реализации критерия определяются наилучшие ![]() ![]() ![]() ![]() ![]() Выбирается та альтернатива, для которой функция полезности максимальна. Предположим, что для нашего примера игрок А достаточно уверен в положительном результате и оценивает вероятность максимального успеха в α=0,7. Тогда: ![]() В соответствии с расчетами игроку А следует выбрать альтернативу А3. Если же, например, А не очень уверен в положительном исходе и расценивает его вероятность порядка α=0,2, то функции полезности равны: ![]() Видно, что в этом случае следует принять А2, для которого функция полезности максимальна. Следует отметить, что при α=0, критерий Гурвица переходит в пессимистический критерий Вальда, а при α=1 – в критерий максимального оптимизма. В случае, если показатель привлекательности по критерию ![]() Критерий Лапласа определяет оптимальное решение по минимальной функции полезности. Применяя критерийВальда необходимо вычислять максимальный показатель каждой альтернативы (строки) ![]() ![]() ![]() ![]() ![]() ![]() ПРИМЕР 2. Нефтяная компания собирается построить в районе крайнего севера нефтяную вышку. Имеется 4 проекта A, B, C и D. Затраты на строительство (млн. руб.) зависят от того, какие погодные условия будут в период строительства. Возможны 5 вариантов погоды ![]() ![]()
Критерий Лапласа. ![]() Следует выбрать альтернативу А1. Критерий Вальда: среди наихудших вариантов α1=12, α2=10, α3=15, α4=11, наилучший соответствует α2=10, следовательно принимаем альтернативу А2. Критерий максимального оптимизма. Соответствует альтернативе, для которой ![]() Критерии Сэвиджа имеет матрицу рисков:
Максимальные элементы для каждого критерия матрицы рисков равны: β1=4; β2=4; β3=8; β4=3. Принимаем альтернативу, соответствующую минимальному значению β4=3, то есть А4. В соответствии с критерии Гурвица на уровне ![]() ![]() Принимаем альтернативу А2 с наименьшей функцией полезности ![]() | http://math.immf.ru/ |