Економічний ризик: ігрові моделі (2002)

1.5.1. Скінченні ігри з нульовою сумою

Для простоти викладу вивчатимемо гру двох гравців з нульовою сумою. Як уже зазначалося, гра — це сукупність правил, що описують сутність конфліктної ситуації та встановлюють:

вибір способу дій гравців на кожному етапі гри;

обсяг необхідної інформації, якою володіє кожен гравець у момент вибору свого способу дії;

плату кожного гравця після завершення будь-якого етапу гри.

Чистою стратегією гравця називається сукупність рекомендацій щодо ведення гри від початку до її завершення.

Гра називається скінченою, якщо в кожного гравця є скінчена кількість стратегій. У протилежному випадку гра є нескінченною.

Нехай гра є скінченою, тоді результати рішень гравців можна виразити в грошовому еквіваленті або з допомогою інших цінностей, які збирається вигравати (придбавати) кожен гравець. Тобто для кожної комбінації вибраних гравцями чистих стратегій існує відповідна величина платежу.

У випадку парної гри ці платежі зручно подавати у вигляді платіжної матриці. Розв’язання гри полягає в знаходженні чистих стратегій для кожного гравця, які б максимізували виграш переможця та одночасно мінімізували б програш переможеного.

Однією із задач теорії гри є виявлення можливості певної рівноваги, що називається компромісом, яка найбільшою мірою задовольняє всіх учасників. Досить досконалою, в плані пошуку компромісного рішення, слід визнати теорію гри двох осіб з нульовою сумою, тобто такої парної гри, в якій виграш першого гравця завжди збігається з величиною програшу другого. В таких іграх, аналізуючи платіжну матрицю виграшів першого гравця, іноді можна знайти оптимальні чисті стратегії обох гравців.

Нехай відома матриця платежів парної гри з нульовою сумою, де елемент платіжної матриці fkj― це виграш першого гравця, тобто сума, яку йому платить другий гравець (програш другого гравця) у випадку використання першим гравцем своєї чистої стратегії Sk → S а другим гравцем— своєї чистої стратегії Өj → Ө.

Розв’язати гру — це означає знайти оптимальну стратегію для кожного гравця. Оптимальною стратегією гравця називається така стратегія, яка за багаторазового повторення гри забезпечує гравцеві максимально можливий середній виграш (або мінімально можливий середній програш). Для знаходження цієї пари стратегій використовують “принцип мінімакса”, сутністю якого є міркування, що супротивник зробить все для того, щоб перешкодити досягненню супротивником своєї цілі. Стратегію першого (другого) гравця називають оптимальною, якщо в разі її багаторазового застосування виграш (програш) першого (другого) гравця не зменшується (не збільшується), які б стратегії не застосовував супротивник.

Для першого гравця F = F+,а тому платіжну матрицю виграшів він аналізує з позиції максимізації гарантованого виграшу, а саме: для кожної своєї чистої стратегії sk (k = 1,...,m) він визначає мінімальне значення виграшу

Число a+ називається нижньою ціною гри, або максміном, а відповідна чиста стратегія sko першого гравця називається максмінною.

Другий гравець ставить за мету мінімізацію свого гарантованого програшу. Для нього F = F-, а тому для кожної чистої стратегії Өj він визначає величину максимального програшу

Число β- називається верхньою ціною гри, або мінімаксом, а відповідна чиста стратегія Өjo другого гравця — мінімаксною.

Часто найбільш “обережні” СПР називають максимінну та мінімаксну чисті стратегії загальним терміном “мінімаксні стратегії”. Мінімаксні чисті стратегії sko та Өjo є стійкими, тобто утворюють оптимальну пару стратегій, у тому випадку, коли нижня ціна гри дорівнює верхній. Тоді платіжна матриця F містить елемент fkojo, що задовольняє умову:

Таким чином, якщо гра має сідлову точку, то чисті стратегії sko та Өjo є оптимальними і тоді сукупність стратегії sko, Өjo та ціна гри V* = a+ = β- утворюють розв’язок гри. Розв’язок гри має таку властивість: якщо один з гравців дотримується своєї оптимальної стратегії, то відхилятися від своєї оптимальної стратегії не вигідно для другого гравця.

У загальному випадку значення ціни гри задовольняє умову: a+ ≤ V ≤ β-, що має місце у випадках, коли гра не має сідлової точки, а мінімаксні чисті стратегії — не оптимальні. Це означає, що відшукання розв’язку гри у чистих стратегіях стає неможливим і кожна зі сторін може поліпшити свій стан шляхом багаторазового випадкового вибору певних своїх чистих стратегій з деяких підмножин (що належать множинам альтернативних чистих стратегій). Такі стратегії називаються змішаними.

Нехай P = (p1;...pm) — розподіл імовірності щодо вибору чистих стратегій першим гравцем у побудові своєї змішаної стратегії, яку надалі будемо позначати через sp. Тут pk — імовірність вибору першим гравцем чистої стратегії sk, і при цьому:

Аналогічно для другого гравця змішану стратегію позначимо через ӨQ, де Q = (q1;...;qn),а qj — імовірність вибору другим гравцем чистої стратегії Өj за умови, що:

Серед змішаних стратегій першого та другого гравців відшукаємо оптимальні й позначимо їх через sp та ӨQ відповідно. Тоді у загальному випадку оптимальним розв’язком гри буде сукупність (sp; ӨQ).

Якщо перший гравець вибрав змішану стратегію sp, а другий — змішану стратегію ӨQ то сподіваний виграш першого гравця (програш другого гравця) у ситуації багаторазового повторення гри становить величину

Методи пошуку оптимальних розв’язків гри базуються на таких положеннях:

1) кожна скінчена гра двох осіб з нульовою сумою має, принаймні, один (оптимальний) розв’язок, можливо у змішаних стратегіях;

2) якщо один з гравців застосовує свою оптимальну змішану стратегію, то його виграш дорівнює ціні гри незалежно від того, з якими ймовірностями (відносними частотами) другий гравець використовуватиме стратегії, що ввійшли в його оптимальну змішану стратегію.

Ці положення у вигляді теореми були сформульовані Дж. фон Нейманом та О. Моргенштерном. Ними доведено [72] так звану основну теорему теорії гри (теорема про мінімакс). Згідно з цією теоремою

У [72] показано, що ціна гри має верхню та нижню межі, а саме: a+ ≤ V* ≤ β-.

Як бачимо з наведених результатів, значення ціни гри V* задає середньозважений виграш першого гравця (або середньозважений програш другого гравця) за багаторазового застосування оптимальних змішаних стратегій sp* та ӨQ* гравців. Із співвідношення (1.11) випливає, що для пари стратегій sp* та ӨQ* властиве таке: за багаторазового їх застосування виграш першого гравця не зменшується, а програш другого гравця не збільшується, які б свої стратегії не застосував супротивник.

Підіб’ємо підсумки:

1) розв’язати скінчену гру з нульовою сумою означає знайти оптимальні чисті стратегії гравців, якщо гра має сідлову точку, або ж знайти оптимальні змішані стратегії гравців sp* та ӨQ*, а точніше — вектори та , що відповідають теоремі про мінімакс, тобто умовам (1.5)—(1.11), а також отримати ціну гри;

2) будь-яка парна матрична гра має розв’язок, якщо допускається використання змішаних стратегій;

3) гра без сідлової точки (α+ < β-) має розв’язок, можливо не єдиний, коли хоча б один з гравців використовує оптимальну змішану стратегію.

Отже, загальноприйняте поняття оптимальності розширюється за рахунок включення таких важливих елементів, як, наприклад, компромісне рішення, яке задовольняє різні сторони конфлікту. Ця та інші особливості теорії гри дають змогу використовувати її методи для розв’язування різноманітних задач, що виникають в економічній науці та практиці. Дуже часто ці задачі допускають використання інших (неігрових) методів і моделей. Нижче буде наведено деякі приклади ігрового моделювання в економіці, а також показано розширені можливості зведення економічних ситуацій до задач теорії гри.