Главная » Учебно-методические материалы » ВЫСШАЯ МАТЕМАТИКА, ТВ и МС, МАТ. МЕТОДЫ » Математические методы. Попова Н.В. |
22.12.2011, 14:32 | |||||||||||||||||||
Игра m × n в общем случае не имеет наглядной геометрической интерпретации. Ее решение достаточно трудоемко при больших m и n, однако принципиальных трудностей не имеет, поскольку может быть сведено к решению задачи линейного программирования. Покажем это. Пусть игра m × n задана платежной матрицей p = (aij ), i = 1, 2, ..., m; j = 1, 2, ..., n. Игрок А обладает стратегиями A1 , A2 , ..., Am , игрок В — стратегиями B1 , B2 , ..., Bm . Необходимо определить оптимальные стратегии S*A = ( p*1 , p*2 , ... , p*m ) иS*B = ( q*1 , q*2 , ... , q*n ), где p*i, q*j — вероятности применения соответствующих чистых стратегий Ai , Bj, p*1 + p*2 +...+ p*m =1, q*1 + q*2 +...+ q*n = 1. Оптимальная стратегия S*A удовлетворяет следующему требованию. Она обеспечивает игроку А средний выигрыш, не меньший, чем цена игры v, при любой стратегии игрока В и выигрыш, равный цене игры v, при оптимальной стратегии игрока B. Без ограничения общности полагаем v > 0: этого можно добиться, сделав все элементы aij ≥ 0. Если игрок А применяет смешанную стратегию S*A = ( p*1 , p*2 , ... , p*m ) против любой чистой стратегии Bj игрока В, то он получает средний выигрыш, или математическое ожидание выигрыша aj = a1j p1 + a2j p2 +...+ am j pm , о = 1, 2, ..., n (т.е. элементы j-го столбца платежной матрицы почленно умножаются на соответствующие вероятности стратегий A1 , A2 , ..., Am и результаты складываются). Для оптимальной стратегии S*A все средние выигрыши не меньше цены игры v, поэтому получаем систему неравенств:
Каждое из неравенств можно разделить на число v > 0. Введем новые переменные:
Тогда система (11) примет вид:
Цель игрока А — максимизировать свой гарантированный выигрыш, т.е. цену игры v.
обращалась в минимум. Это задача линейного программирования. Решая задачу (3.13)—(3.14), получаем оптимальное решение p*1 + p*2 + ...+ p*m и оптимальную стратегию SA .
которые следуют из того, что средний проигрыш игрока В не превосходит цены игры, какую бы чистую стратегию не применял, игрок А.
то получим систему неравенств:
Переменные yj (1, 2, ..., n) удовлетворяют условию .
Решение задачи линейного программирования (3.16), (3.17) определяет оптимальную стратегию S*B = (q*1 + q*2 + ...+ q*n) . При этом цена игры
Составив расширенные матрицы для задач (3.13), (3.14) и (3.17), (3.18), убеждаемся, что одна матрица получилась из другой транспонированием: Таким образом, задачи линейного программирования (3.13), (3.14) и (3.17), (3.18) являются взаимно-двойственными. Очевидно, при определении оптимальных стратегий в конкретных задачах следует выбрать ту из взаимно-двойственных задач, решение которой менее трудоемко, а решение другой задачи найти с помощью теорем двойственности. Приведем примеры экономических задач, которые описываются игровыми моделями т х п и могут быть решены методами линейного программирования. Обозначив xi = pi/v, i = 1, 2, 3 и yj = qj/v , j = 1, 2, 3, составим две взаимно-двойственные задачи линейного программирования (см. (3.13)-(3.14) и (3.17)-(3.18)). При решении произвольной конечной игры размера m × n рекомендуется придерживаться следующей схемы:
На практике реализация оптимального решения в смешанных стратегиях может происходить несколькими путями. Первый состоит в физическом смешении чистых стратегий Ai - в пропорциях, заданных вероятностями pi . Рассмотрим еще одну экономическую задачу, сводящуюся к игровой модели. | http://matmetod-popova.narod.ru/ |