Главная » Учебно-методические материалы » ВЫСШАЯ МАТЕМАТИКА, ТВ и МС, МАТ. МЕТОДЫ » Математические методы. Попова Н.В. |
22.12.2011, 14:31 | |||||||||
Решение игры 2×2 допускает наглядную геометрическую интерпретацию. Пусть игра задана платежной матрицей Р = (aij), i, j = 1, 2. По оси абсцисс (рис. 3.1) отложим единичный отрезок A1 A2 точка A1(х=0) изображает стратегию A1, а все промежуточные точки этого отрезка — смешанные стратегии SA первого игрока, причем расстояние от SA до правого конца отрезка — это вероятность p1 стратегии A1, расстояние до левого конца — вероятность p2 стратегии A2. На перпендикулярных осях I—I и II—II откладываем выигрыши при стратегиях A1 и A2 соответственно. Если 2-й игрок примет стратегию B1, то она дает выигрыши a11 и a21 на осях I—I и II—II, соответствующие стратегиям A1 и A2. Обозначим эти точки на осях I—I и II—II буквой B1. Средний выигрыш v1, соответствующий смешанной стратегии SA, определяется по формуле математического ожидания v1 = a11 p1 + a21 p2 и равен ординате точки M1, которая лежит на отрезке B1 B1 и имеет абсциссу SA (рис. 3.1).
Аналогично строим отрезок B2B2, соответствующий применению вторым игроком стратегии B2 (Рис. 3.2). При этом средний выигрыш v2 = a12 p1 + a22 p2 — ордината точки M2.
Из решения примера 3.4.1 следует, что геометрически можно определять оптимальную стратегию как игрока А, так и игрока В, в обоих случаях используется принцип минимакса, но во втором случае строится не нижняя, а верхняя граница выигрыша и на ней определяется не максимум, а минимум. Если платежная матрица содержит отрицательные числа, то для графического решения задачи лучше перейти к новой матрице с неотрицательными элементами; для этого к элементам исходной матрицы достаточно добавить соответствующее положительное число. Решение игры при этом не изменится, а цена игры увеличится на это число. В примере 3.4.1 платежная матрица не имела седловой точки (α ≠β ). При наличии седловой точки графическое решение дают варианты, изображенные на рис. 3.6 и 3.7. На рис. 3.6 наибольшей ординатой на ломаной B1 NB2 обладает точка B2, поэтому оптимальной является чистая стратегия A2 для игрока А (B2 — для игрока В), т.е. оптимальное решение: S*A = (0;1), S*B = (0;1). Игра имеет седловую точку a22 = v. Чистая стратегия B2 (рис. 3.7) не выгодна для игрока В, поскольку при любой стратегии игрока А она дает последнему больший выигрыш, чем чистая стратегия B1. На основании принципа минимакса выделим прямую B1B1 и на ней точку B1 с наибольшей ординатой на оси I—I. Чистая стратегия A2 является оптимальной для игрока А, а чистая стратегия B1 — для игрока В. Оптимальное решение: S*A = (0;1), S*B = (1;0), цена игры v = a21 = α = β , т.е. имеется седловая точка. Графический метод можно применять при решении игры 2 × n и m × 2. | http://matmetod-popova.narod.ru/ |