Līdzsvara risinājuma atrašanas mehānisms. Dualitāte lineārajā programmēšanā. Savstarpēji duālu problēmu īpašība

Par optimālām konfliktu teorijā tiek uzskatītas tādas stratēģijas, kas ved spēlētājus pie stabila līdzsvara, t.i. noteiktas situācijas, kas apmierina visus spēlētājus.

Risinājuma optimālums spēļu teorijā ir balstīts uz koncepciju līdzsvara situācija:

1) nevienam spēlētājam nav izdevīgi novirzīties no līdzsvara situācijas, ja tajā paliek visi pārējie,

2) līdzsvara nozīme - spēlei atkārtojot vairākas reizes, spēlētāji sasniegs līdzsvara situāciju, uzsākot spēli jebkurā stratēģiskā situācijā.

Katrā mijiedarbībā var pastāvēt šādi līdzsvara veidi:

1. līdzsvars piesardzīgās stratēģijās . Nosaka stratēģijas, kas nodrošina spēlētājiem garantētu rezultātu;

2. līdzsvars dominējošajās stratēģijās .

Dominējošā stratēģija ir rīcības plāns, kas nodrošina dalībniekam maksimālu ieguvumu neatkarīgi no otra dalībnieka darbībām. Tāpēc dominējošo stratēģiju līdzsvars būs abu spēles dalībnieku dominējošo stratēģiju krustpunkts.

Ja spēlētāju optimālās stratēģijas dominē pār visām viņu stratēģijām, tad spēlē dominē dominējošās stratēģijas. Ieslodzīto dilemmas spēlē Neša līdzsvara stratēģiju kopums būs ("atpazīt - atzīties"). Turklāt ir svarīgi atzīmēt, ka gan spēlētājam A, gan spēlētājam B dominējošā stratēģija ir “atpazīt”, bet dominējošā ir “neatpazīt”;

3. līdzsvars Nešs . Neša līdzsvars ir lēmuma veids divu vai vairāku spēlētāju spēlē, kurā neviens dalībnieks nevar palielināt laimestu, vienpusēji mainot savu lēmumu, kad citi dalībnieki savus lēmumus nemaina.

Pieņemsim, ka tā ir spēle n personas normālā formā, kur ir tīru stratēģiju kopums un izmaksu kopums.

Kad katrs spēlētājs stratēģijas profilā izvēlas stratēģiju, spēlētājs saņem laimestu. Turklāt laimests ir atkarīgs no visa stratēģijas profila: ne tikai no paša spēlētāja izvēlētās stratēģijas, bet arī no citu cilvēku stratēģijām. Stratēģijas profils ir Neša līdzsvars, ja stratēģijas maiņa nav izdevīga nevienam spēlētājam, tas ir, jebkuram



Spēlei var būt Neša līdzsvars gan tīrās, gan jauktās stratēģijās.

Nešs to pierādīja, ja atļaujam jauktas stratēģijas, tad katrā spēlē n spēlētājiem būs vismaz viens Neša līdzsvars.

Neša līdzsvara situācijā katra spēlētāja stratēģija nodrošina viņam vislabāko reakciju uz citu spēlētāju stratēģijām;

4. Līdzsvars Stakelbergs. Stakelberga modelis– oligopola tirgus spēles teorētiskais modelis informācijas asimetrijas klātbūtnē. Šajā modelī firmu uzvedību raksturo dinamiska spēle ar pilnīgu perfektu informāciju, kurā firmu uzvedība tiek modelēta, izmantojot statisks spēles ar pilnīga informācija. Galvenā iezīme Spēle ir vadošā uzņēmuma klātbūtne, kas pirmais nosaka preču ražošanas apjomu, un pārējie uzņēmumi savos aprēķinos vadās pēc tā. Spēles pamatnosacījumi:

· nozare ražo viendabīgu produktu: atšķirības starp dažādu uzņēmumu produkciju ir niecīgas, kas nozīmē, ka pircējs, izvēloties, no kura uzņēmuma pirkt, vadās tikai pēc cenas;

· nozarē darbojas neliels skaits firmu;

· firmas nosaka saražotās produkcijas daudzumu, un tā cena tiek noteikta, pamatojoties uz pieprasījumu;

· ir tā sauktais līderis uzņēmums, kura ražošanas apjomu izmanto citi uzņēmumi.

Tādējādi Stakelberga modelis tiek izmantots, lai atrastu optimālo risinājumu dinamiskajās spēlēs un atbilst spēlētāju maksimālajai atmaksai, pamatojoties uz nosacījumiem, kas rodas pēc tam, kad izvēli jau ir izdarījis viens vai vairāki spēlētāji. Stakelberga līdzsvars.- situācija, kad neviens no spēlētājiem nevar vienpusēji palielināt savu laimestu, un lēmumus vispirms pieņem viens spēlētājs, un tie kļūst zināmi otrajam spēlētājam. “Ieslodzīto dilemmas” spēlē laukumā tiks panākts Stakelberga līdzsvars (1;1) - abu noziedznieku “atzīst vainu”;

5. Pareto optimālums- sistēmas stāvoklis, kurā katra konkrētā kritērija vērtību, kas raksturo sistēmas stāvokli, nevar uzlabot, nepasliktinot citu spēlētāju pozīcijas.

Pareto princips nosaka: "Jebkuras izmaiņas, kas nerada zaudējumus, bet sniedz labumu dažiem cilvēkiem (pēc viņu pašu vērtējuma), ir uzlabojums." Tādējādi tiek atzītas tiesības uz visām izmaiņām, kas nevienam nerada papildu kaitējumu.

Sistēmas Pareto optimālo stāvokļu kopu sauc par “Pareto kopu”, “Pareto optimālo alternatīvu kopu” vai “optimālo alternatīvu kopu”.

Situācija, kad tiek sasniegta Pareto efektivitāte, ir situācija, kad visi ieguvumi no apmaiņas ir izsmelti.

Pareto efektivitāte ir viens no mūsdienu centrālajiem jēdzieniem ekonomikas zinātne. Pamatojoties uz šo koncepciju, tiek veidota pirmā un otrā labklājības pamatteorēma.

Viens no Pareto optimizācijas pielietojumiem ir resursu (darbaspēka un kapitāla) Pareto sadale starptautiskajā ekonomiskajā integrācijā, t.i. divu vai vairāku valstu ekonomiskā apvienošana. Interesanti, ka Pareto sadalījums pirms un pēc starptautiskās ekonomiskās integrācijas tika adekvāti aprakstīts matemātiski (Dalimov R.T., 2008). Analīze parādīja, ka nozaru pievienotā vērtība un darbaspēka resursu ienākumi pārvietojas pretējā virzienā saskaņā ar labi zināmo siltumvadītspējas vienādojumu, līdzīgi kā gāze vai šķidrums telpā, kas ļauj pielietot analīzes metodoloģiju. izmanto fizikā saistībā ar ekonomisko parametru migrācijas ekonomiskajām problēmām.

Pareto optimālais nosaka, ka sabiedrības labklājība sasniedz maksimumu un resursu sadale kļūst optimāla, ja kādas izmaiņas šajā sadalījumā pasliktina vismaz viena ekonomiskās sistēmas subjekta labklājību.

Pareto-optimālais tirgus stāvoklis- situācija, kad nav iespējams uzlabot neviena saimnieciskā procesa dalībnieka stāvokli, vienlaikus nemazinot vismaz viena cita labklājību.

Atbilstoši Pareto kritērijam (sociālās labklājības pieauguma kritērijam) virzība uz optimālo ir iespējama tikai ar tādu resursu sadalījumu, kas paaugstina vismaz viena cilvēka labklājību, nekaitējot nevienam citam.

Situācija S* tiek teikts, ka Pareto dominē situācijā S, ja:

· jebkuram spēlētājam viņa izmaksa ir S<=S*

· ir vismaz viens spēlētājs, kuram viņa peļņa situācijā ir S*>S

"Ieslodzīto dilemmas" problēmā Pareto līdzsvars, kad nav iespējams uzlabot viena no spēlētājiem, nepasliktinot otra pozīciju, atbilst laukuma situācijai (2;2).

Apsvērsim piemērs 1:

Līdzsvars dominējošajās stratēģijās Nē.

Neša līdzsvars. (5.5) un (4.4). Tā kā nevienam no spēlētājiem ir neizdevīgi individuāli atkāpties no izvēlētās stratēģijas.

Pareto optimālais. (5.5). Tā kā spēlētāju laimesti, izvēloties šīs stratēģijas, ir lielāki nekā laimesti, izvēloties citas stratēģijas.

Stakelberga līdzsvars:

Spēlētājs A izdara pirmo gājienu.

Izvēlas savu pirmo stratēģiju. B izvēlas pirmo stratēģiju. A saņem 5.

Izvēlas savu otro stratēģiju. B izvēlas otro. A saņem 4.

5 > 4 =>

B veic pirmo gājienu.

Izvēlas savu pirmo stratēģiju. A izvēlas pirmo stratēģiju. B saņem 5.

Izvēlas savu otro stratēģiju. Un viņš izvēlas otro. B saņem 4.

5 > 4 => Stakelberga līdzsvars (5, 5)

2. piemērs.Modelēšanas duopols.

Apskatīsim šī modeļa būtību:

Lai ir nozare ar diviem uzņēmumiem, no kuriem viens ir “līderfirma”, otrs ir “sekotājs”. Lai produkta cena ir lineāra funkcija no kopējā piedāvājuma J:

P(J) = abQ.

Pieņemsim arī, ka uzņēmumu izmaksas uz produkcijas vienību ir nemainīgas un vienādas Ar 1 un Ar 2 attiecīgi. Tad tiks noteikta pirmās firmas peļņa formula

Π 1 = P(J 1 + J 2) * J 1 − c 1 J 1 ,

un peļņa attiecīgi ir otrā

Π 2 = P(J 1 + J 2) * J 2 − c 2 J 2 .

Saskaņā ar Stackelberg modeli pirmais uzņēmums - vadošais uzņēmums - pirmajā posmā piešķir savu produkciju J 1. Pēc tam otrais uzņēmums - sekotāja firma - analizējot vadošā uzņēmuma darbības nosaka tā produkciju J 2. Abu firmu mērķis ir maksimāli palielināt savas maksājumu funkcijas.

Neša līdzsvaru šajā spēlē nosaka atpakaļejoša indukcija. Apskatīsim spēles priekšpēdējo posmu – otrās firmas gājienu. Šajā posmā 2. firma zina pirmās firmas optimālās produkcijas apjomu J 1*. Tad problēma, kā noteikt optimālo izlaidi J 2 * ir saistīts ar otrā uzņēmuma maksājuma funkcijas maksimālā punkta atrašanas problēmu. Funkcijas Π 2 maksimizēšana attiecībā pret mainīgo J 2, skaitīšana J 1, mēs atklājam, ka otrā uzņēmuma optimālā izlaide

Šī ir sekotāja uzņēmuma labākā atbilde uz vadošās firmas problēmas izvēli. J 1*. Vadošais uzņēmums var maksimāli palielināt savu maksājumu funkciju, ņemot vērā funkcijas veidu J 2*. Funkcijas Π 1 maksimālais punkts mainīgajā J 1, aizstājot J 2* būs

Aizstājot to ar izteiksmi for J 2 *, mēs saņemam

Tādējādi līdzsvara apstākļos vadošais uzņēmums saražo divreiz vairāk produkcijas nekā sekotājs uzņēmums.

Par optimālām konfliktu teorijā tiek uzskatītas tādas stratēģijas, kas ved spēlētājus pie stabila līdzsvara, t.i. noteiktas situācijas, kas apmierina visus spēlētājus.

Risinājuma optimālums spēļu teorijā ir balstīts uz koncepciju līdzsvara situācija:

1) nevienam spēlētājam nav izdevīgi novirzīties no līdzsvara situācijas, ja tajā paliek visi pārējie,

2) līdzsvara nozīme - spēlei atkārtojot vairākas reizes, spēlētāji sasniegs līdzsvara situāciju, uzsākot spēli jebkurā stratēģiskā situācijā.

Katrā mijiedarbībā var pastāvēt šādi līdzsvara veidi:

1. līdzsvars piesardzīgās stratēģijās . Nosaka stratēģijas, kas nodrošina spēlētājiem garantētu rezultātu;

2. līdzsvars dominējošajās stratēģijās .

Dominējošā stratēģija ir rīcības plāns, kas nodrošina dalībniekam maksimālu ieguvumu neatkarīgi no otra dalībnieka darbībām. Tāpēc dominējošo stratēģiju līdzsvars būs abu spēles dalībnieku dominējošo stratēģiju krustpunkts.

Ja spēlētāju optimālās stratēģijas dominē pār visām viņu stratēģijām, tad spēlē dominē dominējošās stratēģijas. Ieslodzīto dilemmas spēlē Neša līdzsvara stratēģiju kopums būs ("atpazīt - atzīties"). Turklāt ir svarīgi atzīmēt, ka gan spēlētājam A, gan spēlētājam B dominējošā stratēģija ir “atpazīt”, bet dominējošā ir “neatpazīt”;

3. līdzsvars Nešs . Neša līdzsvars ir lēmuma veids divu vai vairāku spēlētāju spēlē, kurā neviens dalībnieks nevar palielināt laimestu, vienpusēji mainot savu lēmumu, kad citi dalībnieki savus lēmumus nemaina.

Pieņemsim, ka tā ir spēle n personas normālā formā, kur ir tīru stratēģiju kopums un izmaksu kopums.

Kad katrs spēlētājs stratēģijas profilā izvēlas stratēģiju, spēlētājs saņem laimestu. Turklāt laimests ir atkarīgs no visa stratēģijas profila: ne tikai no paša spēlētāja izvēlētās stratēģijas, bet arī no citu cilvēku stratēģijām. Stratēģijas profils ir Neša līdzsvars, ja stratēģijas maiņa nav izdevīga nevienam spēlētājam, tas ir, jebkuram

Spēlei var būt Neša līdzsvars gan tīrās, gan jauktās stratēģijās.

Nešs to pierādīja, ja atļaujam jauktas stratēģijas, tad katrā spēlē n spēlētājiem būs vismaz viens Neša līdzsvars.

Neša līdzsvara situācijā katra spēlētāja stratēģija nodrošina viņam vislabāko reakciju uz citu spēlētāju stratēģijām;

4. Līdzsvars Stakelbergs. Stakelberga modelis– oligopola tirgus spēles teorētiskais modelis informācijas asimetrijas klātbūtnē. Šajā modelī firmu uzvedību raksturo dinamiska spēle ar pilnīgu perfektu informāciju, kurā firmu uzvedība tiek modelēta, izmantojot statisks spēles ar pilnu informāciju. Spēles galvenā iezīme ir vadošā uzņēmuma klātbūtne, kas pirmā nosaka preču ražošanas apjomu, un pārējie uzņēmumi aprēķinos vadās pēc tā. Spēles pamatnosacījumi:


· nozare ražo viendabīgu produktu: atšķirības starp dažādu uzņēmumu produkciju ir niecīgas, kas nozīmē, ka pircējs, izvēloties, no kura uzņēmuma pirkt, vadās tikai pēc cenas;

· nozarē darbojas neliels skaits firmu;

· firmas nosaka saražotās produkcijas daudzumu, un tā cena tiek noteikta, pamatojoties uz pieprasījumu;

· ir tā sauktais līderis uzņēmums, kura ražošanas apjomu izmanto citi uzņēmumi.

Tādējādi Stakelberga modelis tiek izmantots, lai atrastu optimālo risinājumu dinamiskajās spēlēs un atbilst spēlētāju maksimālajai atmaksai, pamatojoties uz nosacījumiem, kas rodas pēc tam, kad izvēli jau ir izdarījis viens vai vairāki spēlētāji. Stakelberga līdzsvars.- situācija, kad neviens no spēlētājiem nevar vienpusēji palielināt savu laimestu, un lēmumus vispirms pieņem viens spēlētājs, un tie kļūst zināmi otrajam spēlētājam. “Ieslodzīto dilemmas” spēlē laukumā tiks panākts Stakelberga līdzsvars (1;1) - abu noziedznieku “atzīst vainu”;

5. Pareto optimālums- sistēmas stāvoklis, kurā katra konkrētā kritērija vērtību, kas raksturo sistēmas stāvokli, nevar uzlabot, nepasliktinot citu spēlētāju pozīcijas.

Pareto princips nosaka: "Jebkuras izmaiņas, kas nerada zaudējumus, bet sniedz labumu dažiem cilvēkiem (pēc viņu pašu vērtējuma), ir uzlabojums." Tādējādi tiek atzītas tiesības uz visām izmaiņām, kas nevienam nerada papildu kaitējumu.

Sistēmas Pareto optimālo stāvokļu kopu sauc par “Pareto kopu”, “Pareto optimālo alternatīvu kopu” vai “optimālo alternatīvu kopu”.

Situācija, kad tiek sasniegta Pareto efektivitāte, ir situācija, kad visi ieguvumi no apmaiņas ir izsmelti.

Pareto efektivitāte ir viens no mūsdienu ekonomikas zinātnes centrālajiem jēdzieniem. Pamatojoties uz šo koncepciju, tiek veidota pirmā un otrā labklājības fundamentālā teorēma.

Viens no Pareto optimizācijas pielietojumiem ir resursu (darbaspēka un kapitāla) Pareto sadale starptautiskajā ekonomiskajā integrācijā, t.i. divu vai vairāku valstu ekonomiskā apvienošana. Interesanti, ka Pareto sadalījums pirms un pēc starptautiskās ekonomiskās integrācijas tika adekvāti aprakstīts matemātiski (Dalimov R.T., 2008). Analīze parādīja, ka nozaru pievienotā vērtība un darbaspēka resursu ienākumi pārvietojas pretējā virzienā saskaņā ar labi zināmo siltumvadītspējas vienādojumu, līdzīgi kā gāze vai šķidrums telpā, kas ļauj pielietot analīzes metodoloģiju. izmanto fizikā saistībā ar ekonomisko parametru migrācijas ekonomiskajām problēmām.

Pareto optimālais nosaka, ka sabiedrības labklājība sasniedz maksimumu un resursu sadale kļūst optimāla, ja kādas izmaiņas šajā sadalījumā pasliktina vismaz viena ekonomiskās sistēmas subjekta labklājību.

Pareto-optimālais tirgus stāvoklis- situācija, kad nav iespējams uzlabot neviena saimnieciskā procesa dalībnieka stāvokli, vienlaikus nemazinot vismaz viena cita labklājību.

Atbilstoši Pareto kritērijam (sociālās labklājības pieauguma kritērijam) virzība uz optimālo ir iespējama tikai ar tādu resursu sadalījumu, kas paaugstina vismaz viena cilvēka labklājību, nekaitējot nevienam citam.

Situācija S* tiek teikts, ka Pareto dominē situācijā S, ja:

· jebkuram spēlētājam viņa izmaksa ir S<=S*

· ir vismaz viens spēlētājs, kuram viņa peļņa situācijā ir S*>S

"Ieslodzīto dilemmas" problēmā Pareto līdzsvars, kad nav iespējams uzlabot viena no spēlētājiem, nepasliktinot otra pozīciju, atbilst laukuma situācijai (2;2).

Apsvērsim piemērs 1.

Apskatīsim tirgus līdzsvara izveidošanas mehānismu, kad pieprasījuma vai piedāvājuma faktoru izmaiņu ietekmē tirgus atstāj šo stāvokli. Pastāv divi galvenie nelīdzsvarotības veidi starp piedāvājumu un pieprasījumu: preču pārpalikums un trūkums.

Pārmērīgs Preces (pārpalikums) ir tirgus situācija, kad preces piedāvājums par noteiktu cenu pārsniedz pieprasījumu pēc tās. Šajā gadījumā starp ražotājiem rodas konkurence, cīņa par pircējiem. Uzvar tas, kurš piedāvā vairāk labvēlīgi apstākļi preču pārdošana. Tādējādi tirgus cenšas atgriezties līdzsvara stāvoklī.

Trūkums preces - šajā gadījumā precei pieprasītais daudzums par noteiktu cenu pārsniedz preces piegādāto daudzumu. Šādā situācijā starp pircējiem rodas konkurence par iespēju iegādāties deficīta preces. Uzvar tas, kurš piedāvā visaugstāko cenu par konkrēto preci. Paaugstinātā cena piesaista ražotāju uzmanību, kuri sāk paplašināt ražošanu, tādējādi palielinot preču piedāvājumu. Rezultātā sistēma atgriežas līdzsvara stāvoklī.

Tādējādi cena pilda balansēšanas funkciju, stimulējot ražošanas un preču piegādes paplašināšanos deficīta laikā un ierobežojot piedāvājumu, atbrīvojot tirgu no pārpalikumiem.

Cenas līdzsvarojošā loma izpaužas gan caur pieprasījumu, gan piedāvājumu.

Pieņemsim, ka mūsu tirgū tika izjaukts līdzsvars - dažu faktoru (piemēram, ienākumu pieauguma) ietekmē notika pieprasījuma pieaugums, kā rezultātā tā līkne novirzījās no D1 V D2(4.3. att. a), taču priekšlikums palika nemainīgs.

Ja konkrētas preces cena nav mainījusies uzreiz pēc pieprasījuma līknes nobīdes, tad pēc pieprasījuma pieauguma radīsies situācija, kad par to pašu cenu P1 preču daudzums, ko katrs pircējs tagad var pirkums (QD) pārsniedz apjomu, ko par konkrēto cenu var piedāvāt attiecīgās preces ražotāji preces (QS). Pieprasījuma apjoms tagad pārsniegs šīs preces piedāvājuma apjomu, kas nozīmē, ka preču trūkums izmērā Df = QD – Qsšajā tirgū.

Preču trūkums, kā mēs jau zinām, izraisa konkurenci starp pircējiem par iespēju iegādāties šo preci, kas izraisa tirgus cenu pieaugumu. Saskaņā ar piegādes likumu pārdevēju reakcija uz cenas pieaugumu būs piegādātā daudzuma palielināšana. Diagrammā tas tiks izteikts ar tirgus līdzsvara punkta kustību E1 pa piedāvājuma līkni, līdz tā krustojas ar jauno pieprasījuma līkni D2 kur tiks sasniegts jauns līdzsvars no šī tirgus E2 s līdzsvara preču daudzums Q2 un līdzsvara cena P2.

Rīsi. 4.3. Līdzsvara cenas punkta maiņa.


Apskatīsim situāciju, kad līdzsvara stāvoklis tiek izjaukts piedāvājuma pusē.

Pieņemsim, ka dažu faktoru ietekmē ir palielinājies piedāvājums, kā rezultātā tā līkne nobīdījās pa labi no pozīcijas S1 V S2 un pieprasījums nemainījās (4.3. att. b).

Ar nosacījumu, ka tirgus cena paliek tajā pašā līmenī (P1) piedāvājuma pieaugums novedīs pie lieko preces pēc izmēra Sp = Qs – QD. Tā rezultātā rodas pārdevēju konkurence, izraisot tirgus cenas samazināšanos (ar P1 uz P2) un pārdoto preču apjoma pieaugums. Tas tiks atspoguļots grafikā, pārvietojot tirgus līdzsvara punktu E1 pa pieprasījuma līkni, līdz tā krustojas ar jauno piedāvājuma līkni, kas novedīs pie jauna līdzsvara izveidošanas E2 ar parametriem Q2 Un P2.

Līdzīgi var identificēt pieprasījuma samazināšanās un piedāvājuma samazināšanās ietekmi uz preču līdzsvara cenu un līdzsvara daudzumu.

IN izglītojoša literatūra formulēti četri piedāvājuma un pieprasījuma mijiedarbības noteikumi.

1. Pieprasījuma pieaugums izraisa preču līdzsvara cenas un līdzsvara daudzuma pieaugumu.

2. Pieprasījuma samazinājums izraisa gan preču līdzsvara cenas, gan līdzsvara daudzuma kritumu.

3. Piedāvājuma pieaugums ietver līdzsvara cenas samazināšanos un preču līdzsvara daudzuma pieaugumu.

4. Piedāvājuma samazināšanās rada līdzsvara cenas pieaugumu un preču līdzsvara daudzuma samazināšanos.

Izmantojot šos noteikumus, jūs varat atrast līdzsvara punktu jebkurām piedāvājuma un pieprasījuma izmaiņām.

Cenu atgriešanos tirgus līdzsvara līmenī galvenokārt var kavēt šādi apstākļi:

1) administratīvā cenu regulēšana\

2) monopolisms ražotājam vai patērētājam, ļaujot tiem saglabāt monopolcenu, kas var būt gan mākslīgi augsta, gan zema.


| |

4. tēma. Spēļu teorija un mijiedarbības modelēšana.

1. Spēļu teorijas pamatjēdzieni.

2. Līdzsvara veidi: Neša līdzsvars, Stekelberga līdzsvars, Pareto-optimālais līdzsvars, dominējošo stratēģiju līdzsvars.

3. Spēļu teorijas pamatmodeļi.

Spēļu teorijas pamatjēdzieni.

Lietošana matemātiskās metodes, kas ietver spēļu teoriju, ekonomisko procesu analīzē ļauj identificēt tendences un attiecības, kas, izmantojot citas metodes, paliek apslēptas un iegūst pat ļoti negaidītus rezultātus.

Ņemiet vērā, ka spēļu teorija ir viena no jaunākajām matemātikas disciplīnām. Tā kā neatkarīga matemātikas nozare radās 1950. gadu vidū, kad tika publicēta slavenā F. Neimana un O. Morgenšterna monogrāfija “Spēļu un ekonomiskās uzvedības teorija”. Spēļu teorijas pirmsākumi, kas saistīti ar E. Porela (1921) darbiem."

Līdz šim spēļu teorija ir kļuvusi par veselu matemātisko lauku, kas ir bagāts ar interesantiem rezultātiem un kam liels skaits praktiski ieteikumi un lietojumprogrammas.

Apskatīsim starpcilvēku mijiedarbības spēles modeļa pamatpieņēmumus un koncepcijas.

1. Mijiedarbojošo indivīdu skaits ir divi. Indivīdus sauc par spēlētājiem. Spēlētāja jēdziens ļauj mums modelēt sociālās lomas indivīds: pārdevējs, pircējs, vīrs, sieva utt. Spēle ir divu indivīdu, kuriem ir dažādas vai līdzīgas sociālās lomas, mijiedarbības vienkāršots attēlojums, piemēram, pircējs - pārdevējs, pārdevējs - pārdevējs utt.



2. Katram indivīdam ir noteikts uzvedības iespēju vai alternatīvu kopums. Dažādu spēlētāju uzvedības iespēju skaits var nebūt vienāds.

3. Starppersonu mijiedarbība tiek uzskatīta par īstenotu, ja abi spēlētāji vienlaikus izvēlas savas uzvedības variantus un rīkojas saskaņā ar tiem. Atsevišķu cilvēku mijiedarbības aktu sauc par spēles gaitu. Tiek pieņemts, ka mijiedarbības akta ilgums ir nulle.

4. Spēles gaitu nosaka divi veseli skaitļi - pirmā spēlētāja uzvedības opcijas (gājiena) izvēlētais numurs un otrā spēlētāja uzvedības opcijas (gājiena) izvēlētais numurs. Maksimālais iespējamais dažādu gājienu skaits spēlē ir vienāds ar pirmā spēlētāja gājienu kopskaita un otrā spēlētāja gājienu kopskaita reizinājumu.

5. Katra indivīdu mijiedarbība jeb spēles gājiens saņem savu kārtas numuru: 1, 2, 3 utt. Nevajadzētu jaukt jēdzienus “spēles gājiens” (skaitļu pāris) un “spēles gājiena numurs” (viens cipars). Tiek pieņemts, ka mijiedarbība notiek regulāri ar regulāriem intervāliem, tāpēc spēles gājiena skaitlis norāda laiku, cik ilgi konkrētas personas mijiedarbojas savā starpā.

6. Katrs spēlētājs cenšas sasniegt maksimālo kāda mērķa rādītāja vērtību, ko sauc par lietderību jeb laimestu. Tādējādi spēlētājam ir “ekonomiska cilvēka” iezīmes. Spēlētāja izmaksa var būt pozitīva vai negatīva. Negatīvu peļņu sauc arī par zaudējumiem.

7. Katrs spēles gājiens (spēlētāju izvēlēts alternatīvu pāris) atbilst vienam spēlētāja laimestu pārim. Spēlētāju laimestu atkarību no izvēlētajiem gājieniem raksturo spēles matrica jeb izmaksu matrica. Šīs matricas rindas atbilst pirmā spēlētāja alternatīvām (gājieniem), bet kolonnas atbilst otrā spēlētāja alternatīvām (gājieniem). Spēles matricas elementi ir laimestu pāri, kas atbilst attiecīgajai rindai un kolonnai (spēlētāja gājieniem). Pirmā spēlētāja (pirmais numurs spēles matricas šūnā) laimests ir atkarīgs ne tikai no viņa gājiena (rindas numurs), bet arī no otrā spēlētāja gājiena (kolonnas numurs). Tāpēc pirms mijiedarbības īstenošanas indivīds nezina precīzu sava ieguvuma summu. Citiem vārdiem sakot, spēlētāja uzvedības izvēle tiek veikta nenoteiktības apstākļos, t.i., spēlētājam ir “institucionālas personas” iezīmes.

8. Spēlētāja stratēģija ir ierasts uzvedības modelis, ko spēlētājs ievēro, izvēloties alternatīvu uzvedību noteiktā laika periodā. Spēlētāja stratēģiju nosaka visu iespējamo uzvedības variantu izvēles varbūtība (vai biežums). Citiem vārdiem sakot, spēlētāja stratēģija ir vektors, kura koordinātu skaits ir vienāds ar kopējais skaits iespējamās alternatīvas un i-tā koordināte vienāds ar izvēles varbūtību (biežumu). i-tā alternatīva. Ir skaidrs, ka visu koordinātu vērtību summa dots vektors vienāds ar vienu.

Ja spēlētājs attiecīgajā laika periodā izvēlas tikai vienu uzvedības iespēju, tiek izsaukta spēlētāja stratēģija tīrs.

Visas atbilstošā tīrā stratēģijas vektora koordinātas ir vienādas ar nulli, izņemot vienu, kas ir vienāda ar vienu.

Tiek saukta stratēģija, kas nav tīra sajaukts.

Šajā gadījumā spēlētāja stratēģijas vektoram ir vismaz divas koordinātas, kas nav nulles. Viņi reaģē uz aktīvām uzvedības iespējām. Spēlētājs, kurš ievēro jauktu stratēģiju, maina aktīvās uzvedības iespējas atbilstoši izvēlētajām varbūtībām (frekvencēm). Tālāk prezentācijas vienkāršības labad pieņemsim, ka spēlētājs vienmēr ievēro kādu tīru stratēģiju, t.i., aplūkojamajā laika posmā viņš vienmēr izvēlas vienu uzvedības variantu no dotā alternatīvu kopuma.

Institucionālai personai ir raksturīga viņa uzvedības mainīgums, kas ir atkarīgs no viņa iekšējā stāvokļa, dzīves pieredze, ārējais sociālā vide uc Institūciju izpētes spēles pieejas ietvaros šī institucionālās personas īpašība izpaužas kā iespēja spēlētājam mainīt savu stratēģiju. Ja starp spēlētāja stratēģijām vienmēr būtu kāda objektīvi labāka, tad viņš vienmēr tai sekotu un stratēģijas maiņa būtu bezjēdzīga. Bet iekšā īstā dzīve cilvēks parasti apsver vairākas uzvedības stratēģijas. No tiem nav iespējams objektīvi izcelt labākos. Cilvēku savstarpējās mijiedarbības spēles modelis ļauj mums izpētīt šo institucionālās uzvedības iezīmi, jo tas aptver vairākas uzvedības stratēģijas, kas viena otru neizslēdz un atspoguļo dažādi aspekti institūcijas personas uzvedība. Apskatīsim šos uzvedības modeļus.

Spēles matrica

Pirmais spēlētājs Otrais spēlētājs
6; 15 2; 13 3; 11
1; 10 5; 14 4; 12
4; 12 4; 13 3; 13

Atšķirt solidāra Un ne-solidaritāte uzvedības stratēģijas. Pirmie ir raksturīgākie “institucionālajam cilvēkam”, bet otrie - “ekonomiskajam cilvēkam”.

Nesolidaritāte uzvedības stratēģijas raksturo fakts, ka indivīds pats izvēlas savu uzvedību, kamēr viņš vai nu vispār neņem vērā cita indivīda uzvedību, vai, pamatojoties uz esošo pieredzi, pieņem iespējamais variants viņa uzvedība.

Galvenie ne-solidaritātes uzvedības veidi ir šādi: neracionāli, uzmanīgi, optimizējot, novirzes Un novatorisks.

1) Iracionāla uzvedība. Apzīmēsim abas pirmā spēlētāja stratēģijas attiecīgi ar A un B. Tiek uzskatīts, ka stratēģija A ir dominējoša attiecībā uz stratēģiju B, ja jebkuram otrā spēlētāja gājienam pirmā spēlētāja, kas atbilst stratēģijai A, peļņa ir lielāka nekā viņa peļņa, kas atbilst stratēģijai B. Tādējādi stratēģija B ir objektīvi sliktāka ar attiecībā uz stratēģiju A.

Ja stratēģiju A vienmēr var brīvi izvēlēties spēlētājs, tad stratēģiju B vispār nevajadzētu izvēlēties. Ja tomēr stratēģiju B izvēlas pirmais spēlētājs, tad viņa uzvedību šajā gadījumā sauc par neracionālu. Lai identificētu spēlētāja neracionālo uzvedību, pietiek analizēt viņa izmaksu matricu: otra spēlētāja izmaksu matrica netiek izmantota.

Ņemiet vērā, ka termins “iracionāla uzvedība” ir aizgūts no neo klasiskā teorija. Tas nozīmē tikai to, ka šīs stratēģijas izvēle noteikti nav labākā situācijā, kad abi spēlētāji atrodas antagonistiskā konfrontācijā, kas raksturīga “ekonomistam”. Bet “institucionālai personai”, kas iesaistās starppersonu mijiedarbībā ar citiem cilvēkiem, neracionāla uzvedība ir ne tikai iespējama, bet arī var izrādīties vissaprātīgākā rīcība. Piemērs tam ir spēle Ieslodzīto dilemma.

2) Piesardzīga uzvedība. “Institucionālais cilvēks” atšķirībā no “ekonomiskā cilvēka” nav absolūti racionāls, t.i., viņš ne vienmēr izvēlas labāko uzvedību, kas maksimāli palielina peļņu. “Institucionālā cilvēka” ierobežotā racionalitāte izpaužas viņa nespējā izvēlēties labākais variants uzvedība, ko izraisa liels skaits alternatīvu, sarežģīts algoritms optimālās alternatīvas noteikšanai, ierobežots lēmumu pieņemšanas laiks utt. Tajā pašā laikā ierobežotās racionalitātes jēdziens paredz, ka, ņemot vērā visas izvēles sarežģītības, cilvēks spēj izvēlēties diezgan labu alternatīvu.

Spēles pieejā institūciju izpētei indivīda ierobežoto racionalitāti ilustrē spēlētāja uzmanīga uzvedība.

Piesardzīgas uzvedības stratēģija- šī ir spēlētāja stratēģija, kas garantē viņam noteiktu laimesta summu neatkarīgi no otra spēlētāja izvēles (gājiena). Piesardzīgo stratēģiju sauc arī par maksimumu, jo tā tiek aprēķināta, atrodot maksimālo vērtību no vairākām minimālajām vērtībām.

Pirmā spēlētāja piesardzības stratēģija ir definēta šādi. Katrā viņa laimestu matricas rindā tiek atrasts minimālais elements, un pēc tam no šādiem minimālajiem elementiem tiek izvēlēts pirmā spēlētāja maksimālais vai maksimums. Spēles matricas rinda, uz kuras atrodas pirmā spēlētāja maksimums, atbilst viņa piesardzīgajai stratēģijai. Otrā spēlētāja piesardzīgā stratēģija ir līdzīga. Katrā tās laimestu matricas kolonnā tiek atrasts minimālais elements, un pēc tam no šādiem minimālajiem elementiem tiek noteikts maksimālais elements. Spēles matricas kolonna, kurā atrodas otrā spēlētāja maksimums, atbilst viņa piesardzīgajai stratēģijai. Katram spēlētājam var būt vairākas piesardzīgas stratēģijas, taču tām visām ir viena un tā pati nozīme maksimums (augsta-zema stratēģija), vai garantēti laimesti. Jebkurā matricas spēlē pastāv rūpīgas stratēģijas. Lai identificētu spēlētāja piesardzīgo stratēģiju, pietiek analizēt viņa izmaksu matricu, neizmantojot otra spēlētāja izmaksu matricu. Šī iezīme ir raksturīga neracionālai un piesardzīgai uzvedībai.

3) Uzvedības optimizēšana. Ekonomiskajā praksē bieži rodas situācijas, kad saimnieciskie aģenti (piemēram, pārdevējs un parasts pircējs), ilgstoši mijiedarbojoties viens ar otru, atrod abām pusēm piemērotas uzvedības stratēģijas, un tāpēc tās izmanto “ spēlētājiem” ilgu laiku. Spēles pieejā institūciju izpētei aprakstītā situācija tiek modelēta, izmantojot līdzsvara stratēģiju jēdzienu. Šādu stratēģiju pāri raksturo šāda īpašība: ja pirmais spēlētājs novirzās no savas līdzsvara stratēģijas (izvēlas kādu citu), bet otrais turpina ievērot savu līdzsvara stratēģiju, tad pirmais spēlētājs cieš zaudējumus samazinājuma veidā. laimestu apmērā. Spēles matricas šūnu, kas atrodas rindas un kolonnas krustpunktā, kas atbilst līdzsvara stratēģiju pārim, sauc par līdzsvara punktu. Spēles matricai var būt vairāki līdzsvara punkti vai arī tie var nebūt vispār.

Spēlētāja uzvedību, kas seko līdzsvara stratēģijai, sauc par optimizāciju ( minimax uzvedība vai minmax stratēģija).

Tas atšķiras no uzvedības maksimizācijas. Pirmkārt, spēlētāja līdzsvara peļņa nav visu iespējamo izmaksu maksimālā summa. Tas atbilst nevis globālajam maksimumam, bet lokālajam optimumam. Tādējādi funkcijas globālais maksimums, kas definēts skaitliskā intervālā, pārsniedz katru tās lokālo maksimumu. Otrkārt, viena spēlētāja līdzsvara stratēģijas ievērošana nozīmē vietējā maksimuma sasniegšanu tikai tad, ja otrs spēlētājs saglabā līdzsvara stratēģiju. Ja otrais spēlētājs novirzās no līdzsvara stratēģijas, tad, ja pirmais spēlētājs turpina izmantot līdzsvara stratēģiju, tas viņam nedos maksimālu efektu.

Līdzsvara stratēģijas nosaka šāds noteikums: spēles matricas šūna tiek uzskatīta par līdzsvaru, ja pirmā spēlētāja atbilstošā izmaksa ir maksimālā kolonnā, bet otrā spēlētāja atbilstošā izmaksa ir maksimālā rindā. Tādējādi līdzsvara stratēģiju atrašanas algoritmā tiek izmantotas abu spēlētāju, nevis viena no tiem, izmaksu matricas, kā tas ir neracionālas un piesardzīgas uzvedības gadījumos.

4) Devianta uzvedība. Līdzsvara stratēģijas kā uzvedības pamatnormas institucionalizācija notiek, ja cilvēks vispārina savu starppersonu mijiedarbības pieredzi, tostarp deviantās uzvedības pieredzi. Cilvēka apziņa negatīvas sekasŠāda rīcība, kuras pamatā ir nelīdzsvarotu alternatīvu izvēle, ir izšķirošais arguments optimizējošas uzvedības stratēģijas izvēlē. Tādējādi deviantā uzvedība kalpo kā “institucionālas personas” dzīves pieredzes neatņemama sastāvdaļa, kalpojot kā empīrisks pamatojums uzvedības optimizēšanai. Deviantās uzvedības pieredze dod cilvēkam pārliecību, ka otrs spēles dalībnieks vienmēr ievēros līdzsvara stratēģiju. Tādējādi šāda pieredze kalpo kā pierādījums otra spēlētāja uzvedības racionalitātei un turpmākās mijiedarbības ar viņu paredzamībai.

5) Inovatīva uzvedība. Iepriekš tika aplūkota deviantā uzvedība, kuras galvenais mērķis ir empīriski pamatot un nostiprināt sākotnējo līdzsvara stratēģiju. Tomēr novirzes no līdzsvara stratēģijas mērķis var būt būtiski atšķirīgs. Inovatīva uzvedība ir sistemātiska novirze no ierastās līdzsvara stratēģijas, lai atrastu citu novatoram izdevīgāku līdzsvara stāvokli.

Starpcilvēku mijiedarbības spēles modeļa ietvaros inovatīvas uzvedības mērķi var sasniegt, ja spēles matricai ir atšķirīgs līdzsvara punkts, kurā novatora spēlētāja atmaksa ir lielāka nekā sākotnējā līdzsvara stāvoklī. Ja šāda punkta nav, tad novatoriskā uzvedība, visticamāk, būs lemta neveiksmei, un novators atgriezīsies pie sākotnējās līdzsvara stratēģijas. Turklāt viņa zaudējumi no inovācijas eksperimenta būs vienādi ar kopējo novirzes efektu visā eksperimenta periodā.

Reālajā dzīvē mijiedarbojošie indivīdi bieži vien piekrīt ievērot noteiktas uzvedības stratēģijas nākotnē. Šajā gadījumā tiek izsaukta spēlētāju uzvedība solidāra.

Galvenie solidāras uzvedības iemesli:

a) solidāras uzvedības ieguvums abiem spēlētājiem. Mijiedarbības spēles modeļa ietvaros šo situāciju ilustrē spēles matrica, kuras vienā šūnā abu spēlētāju izmaksas ir maksimālas, taču tajā pašā laikā tā nav līdzsvarota un neatbilst piesardzīgo pārim. spēlētāju stratēģijas. Šai šūnai atbilstošas ​​stratēģijas, visticamāk, neizvēlēsies spēlētāji, kuri ievieš ne-solidaritātes uzvedības modeļus. Bet, ja spēlētāji vienojas par piemērotu solidāru stratēģiju izvēli, tad vēlāk viņiem būs neizdevīgi pārkāpt vienošanos, un tas tiks izpildīts automātiski;

b) solidāras uzvedības ētika bieži kalpo kā “iekšējais” mehānisms, lai nodrošinātu līguma ievērošanu. Morālās izmaksas sociālā nosodījuma veidā, ko indivīds sedz, ja viņš pārkāps vienošanos, var viņu ietekmēt augstāka vērtība nekā sasniegtais laimestu pieaugums. Ētiskajam faktoram ir svarīga loma “institucionālā cilvēka” uzvedībā, taču tas faktiski netiek ņemts vērā starpcilvēku mijiedarbības spēles modelī;

c) solidāras rīcības izpilde kalpo kā “ārējs” mehānisms, lai nodrošinātu atbilstību līgumam. Šis faktors institucionālā uzvedība arī nav pietiekami atspoguļota mijiedarbības spēles modelī.


Līdzsvara veidi: Neša līdzsvars, Stekelberga līdzsvars, Pareto-optimālais līdzsvars, dominējošo stratēģiju līdzsvars.

Katrā mijiedarbībā var pastāvēt dažādi veidi līdzsvars: dominējošo stratēģiju līdzsvars, Neša līdzsvars, Stakelberga līdzsvars un Pareto līdzsvars. Dominējošā stratēģija ir rīcības plāns, kas nodrošina dalībniekam maksimālu lietderību neatkarīgi no otra dalībnieka darbībām. Attiecīgi dominējošo stratēģiju līdzsvars būs abu spēles dalībnieku dominējošo stratēģiju krustpunkts. Neša līdzsvars ir situācija, kurā katra spēlētāja stratēģija ir labākā reakcija uz otra spēlētāja darbībām. Citiem vārdiem sakot, šis līdzsvars nodrošina spēlētājam maksimālu lietderību atkarībā no otra spēlētāja darbībām. Stakelberga līdzsvars iestājas, kad spēles dalībnieku lēmumu pieņemšanā ir laika nobīde: viens no viņiem pieņem lēmumus, jau zinot, ko darīja otrs. Tādējādi Stakelberga līdzsvars atbilst spēlētāju maksimālajai lietderībai apstākļos, kad viņi nepieņem vienlaicīgus lēmumus. Atšķirībā no dominējošo stratēģiju līdzsvara un Neša līdzsvara, šāda veida līdzsvars pastāv vienmēr. Visbeidzot, Pareto līdzsvars pastāv ar nosacījumu, ka nav iespējams vienlaikus palielināt abu spēlētāju lietderību. Apskatīsim vienu tehnoloģiju piemēru visu četru veidu līdzsvara meklēšanai.

Dominējošā stratēģija- rīcības plāns, kas nodrošina dalībniekam maksimālu lietderību neatkarīgi no otra dalībnieka darbībām.

Neša līdzsvars- situācija, kurā neviens no spēlētājiem nevar vienpusēji palielināt savu laimestu, mainot rīcības plānu.

Stakelberga līdzsvars- situācija, kad neviens no spēlētājiem nevar vienpusēji palielināt savu laimestu, un lēmumus vispirms pieņem viens spēlētājs, un tie kļūst zināmi otrajam spēlētājam.

Pareto līdzsvars- situācija, kad nav iespējams uzlabot neviena spēlētāja pozīciju, nepasliktinot otra pozīciju un nesamazinot kopējo spēlētāju laimestu.

Ļaujiet uzņēmumam A mēģināt salauzt uzņēmuma B monopolu noteikta produkta ražošanā. Uzņēmums A izlemj, vai tai vajadzētu ienākt tirgū, un uzņēmums B izlemj, vai tai vajadzētu samazināt ražošanas apjomu, ja A nolemj ienākt. Pastāvīgas ražošanas gadījumā uzņēmumā B abi uzņēmumi ir zaudētāji, bet, ja uzņēmums B nolemj samazināt izlaidi, tad tas “dala” savu peļņu ar A.

Dominējošo stratēģiju līdzsvars. Uzņēmums A salīdzina savu peļņu abos scenārijos (-3 un O, ja B nolemj sākt cenu karu) un (4 un 0, ja B nolemj samazināt ražošanas apjomu). Viņai nav stratēģijas, kas nodrošina maksimālu ieguvumu neatkarīgi no B darbībām: 0 > -3 => “neiet tirgū”, ja B atstāj izlaidi tajā pašā līmenī, 4 > 0 => “ieiet”, ja B samazina izlaidi (sk. .cietās bultiņas). Lai gan uzņēmumam A nav dominējošas stratēģijas, uzņēmumam B tā ir. Viņa ir ieinteresēta samazināt izlaidi neatkarīgi no A darbībām (4 > -2, 10 = 10, skatiet punktētās bultiņas). Līdz ar to nav dominējošo stratēģiju līdzsvara.

Neša līdzsvars. Uzņēmuma A labākā reakcija uz firmas B lēmumu atstāt izlaidi tādu pašu ir neienākt, un uz lēmumu samazināt izlaidi ir ienākt. Uzņēmuma B labākā reakcija uz uzņēmuma A lēmumu ienākt tirgū ir samazināt ražošanas apjomu, pieņemot lēmumu neieiet, abas stratēģijas ir līdzvērtīgas. Tāpēc divi Neša līdzsvars (A, A2) atrodas punktos (4, 4) un (0, 10) - A ienāk un B samazina izvadi, vai A neienāk un B nesamazina izvadi. To ir diezgan viegli pārbaudīt, jo šajos punktos neviens no dalībniekiem nav ieinteresēts mainīt savu stratēģiju.

Stakelberga līdzsvars. Pieņemsim, ka uzņēmums A pieņem pirmo lēmumu. Ja tā nolemj atturēties no ienākšanas tirgū, rezultāts būs divi punkti (0, 10): Firmas B preferences pieļauj abas iespējas. Zinot to, uzņēmums A maksimizē savu peļņu punktos (4, 4) un (0, 10), salīdzinot 4 un 0. Preferences ir nepārprotamas, un pirmais Stakelberga līdzsvars StA būs punktā (4, 4). Līdzīgi Stakelberga līdzsvara StB, kad uzņēmums B pieņem lēmumu vispirms, būs punktā (0, 10).

Pareto līdzsvars. Lai noteiktu Pareto optimumu, mums secīgi jāizmēģina visi četri spēles iznākumi, atbildot uz jautājumu: "Vai pāreja uz kādu citu spēles iznākumu nodrošina lietderības pieaugumu vienlaicīgi abiem dalībniekiem?" Piemēram, no iznākuma (-3, -2) mēs varam pāriet uz jebkuru citu iznākumu, izpildot norādīto nosacījumu. Tikai no iznākuma (4, 4) mēs nevaram virzīties tālāk, nesamazinot neviena spēlētāja lietderību, tas būs Pareto līdzsvars, R.

Antagonistiskā spēlē ir dabiski uzskatīt, ka optimālais iznākums ir tāds, kurā nevienam spēlētājam ir neizdevīgi no tā novirzīties. Šādu iznākumu (x*,y*) sauc par līdzsvara situāciju, bet optimitātes principu, kas balstās uz līdzsvara situācijas atrašanu, sauc par līdzsvara principu.

Definīcija. Matricas spēlē ar dimensiju matricu iznākums ir līdzsvara situācija vai seglu punkts, ja

Seglu punktā matricas elements ir gan minimums savā rindā, gan maksimums kolonnā. Spēlē no 2. piemēra elementa a 33 ir seglu punkts. Optimālās stratēģijas šajā spēlē abiem spēlētājiem ir trešās. Ja pirmais spēlētājs novirzās no trešās stratēģijas, viņš sāk uzvarēt mazāk nekā a 33. Ja otrais spēlētājs novirzās no trešās stratēģijas, viņš sāk zaudēt vairāk nekā a 33. Tādējādi abiem spēlētājiem nav nekā labāka kā konsekventi īstenot trešo stratēģiju.

Optimālas uzvedības princips: ja matricas spēlē ir seglu punkts, tad optimālā izvēle ir seglu punktam atbilstošā stratēģija. Kas notiek, ja spēlē ir vairāk nekā viens seglu punkts?

Teorēma. Ļaujiet divi patvaļīgi seglu punkti matricas spēlē. Pēc tam:

Pierādījums. No līdzsvara situācijas definīcijas mums ir:

Aizstāsim , nevienādības (2.8) kreisajā pusē un labajā pusē, , nevienādības (2.9) kreiso pusi un labajā pusē, . Tad mēs iegūstam:

Tas nozīmē vienlīdzību:

No teorēmas izriet, ka izmaksas funkcijai ir vienāda vērtība visās līdzsvara situācijās. Tāpēc arī tiek izsaukts numurs par spēles cenu. Un tiek izsauktas stratēģijas, kas atbilst jebkuram no seglu punktiem optimālas stratēģijas attiecīgi 1. un 2. spēlētāji. Saskaņā ar (2.7) visas spēlētāja optimālās stratēģijas ir savstarpēji aizstājamas.

Spēlētāju optimālā uzvedība nemainīsies, ja stratēģijas kopums spēlē paliks nemainīgs, un izmaksas funkcija tiks reizināta ar pozitīvu konstanti (vai tai tiek pievienots konstants skaitlis).

Teorēma. Seglu punkta (i*,j*) pastāvēšanai matricas spēlē ir nepieciešams un pietiekami, lai maksimums būtu vienāds ar minimumu:

(2.10)

Pierādījums. Nepieciešamība. Ja (i*,j*) ir seglu punkts, tad saskaņā ar (2.6):

(2.11)

Tajā pašā laikā mums ir:

(2.12)

No (2.11) un (2.12) iegūstam:

(2.13)

Spriežot līdzīgi, mēs nonākam pie vienādībām:

Tādējādi

No otras puses, vienmēr pastāv apgrieztā nevienādība (2.5), tāpēc (2.10) izrādās derīga.

Atbilstība. Lai (2.10) ir patiess. Pierādīsim seglu punkta esamību. Mums ir:

Atbilstoši vienlīdzībai (2.10) nevienlīdzības (2.15) un (2.16) pārvēršas par vienādībām. Tad mums ir:

Teorēma ir pierādīta. Pa ceļam tas tika pierādīts vispārīga nozīme maximin un minimax ir vienādi ar spēles cenu.

Jaukta spēles paplašināšana

Aplūkosim matricas spēli G. Ja tajā ir līdzsvara situācija, tad minimax ir vienāds ar maksimumu. Turklāt katrs spēlētājs var sniegt otram spēlētājam informāciju par savu optimālo stratēģiju. Viņa pretinieks no šīs informācijas nevarēs gūt papildu labumu. Tagad pieņemsim, ka spēlē G nav līdzsvara situācijas. Pēc tam:

Šajā gadījumā minimax un maximin stratēģijas nav stabilas. Spēlētājiem var būt pamudinājumi novirzīties no savām piesardzīgajām stratēģijām, jo ​​ir iespēja gūt peļņu vairāk laimestu, bet arī ar risku zaudēt, tas ir, iegūt mazāku laimestu, nekā izmantojot piesardzīgu stratēģiju. Izmantojot riskantas stratēģijas, informācijas nosūtīšana par tām pretiniekam rada kaitīgas sekas: spēlētājs automātiski saņem mazāku atlīdzību nekā izmantojot piesardzīgu stratēģiju.

3. piemērs. Ļaujiet spēles matricai būt šādā formā:

Šādai matricai, t.i. nav līdzsvara situācijas. Spēlētāju piesardzīgās stratēģijas ir i*=1, j*=2. Ļaujiet 2. spēlētājam ievērot stratēģiju j*=2, bet 1. spēlētājam izvēlēties stratēģiju i=2. tad pēdējais saņems atmaksu 3, kas ir par divām vienībām vairāk nekā maksimums. Ja tomēr 2. spēlētājs uzminēs par 1. spēlētāja plāniem, viņš mainīs savu stratēģiju uz j=1, un tad pirmais saņems 0, tas ir, mazāku par viņa maksimumu. Līdzīgu argumentāciju var veikt arī otrajam spēlētājam. Kopumā varam secināt, ka piedzīvojumu stratēģijas izmantošana var nest rezultātu, kas ir lielāks par garantēto atsevišķā spēlē, taču tās izmantošana ir saistīta ar risku. Rodas jautājums, vai ir iespējams apvienot uzticamu piesardzīgu stratēģiju ar piedzīvojumiem bagātu tā, lai palielinātu vidējo laimestu? Būtībā jautājums ir par to, kā sadalīt laimestu starp spēlētājiem (2.17)?

Izrādās, ka saprātīgs risinājums ir izmantot jauktu stratēģiju, tas ir, tīru stratēģiju nejaušu atlasi. Atgādināsim jums to Spēlētāja 1 stratēģiju sauc par jauktu, ja viņš izvēlas i-to rindu ar noteiktu varbūtību p i .Šo stratēģiju var identificēt ar varbūtības sadalījumu daudzās līnijās. Pieņemsim, ka pirmajam spēlētājam ir m tīras stratēģijas, bet otrajam spēlētājam ir n tīras stratēģijas. Tad viņu jauktās stratēģijas ir varbūtības vektori:

(2.18)

Apsveriet divas iespējamās jauktās stratēģijas pirmajam spēlētājam no 3. piemēra: . Šīs stratēģijas atšķiras ar varbūtības sadalījumu starp tīrajām stratēģijām. Ja pirmajā gadījumā matricas rindas spēlētājs izvēlas ar vienādām varbūtībām, tad otrajā gadījumā - ar dažādām. Kad mēs runājam par jauktu stratēģiju, mēs domājam izlases veida atlase nevis “izlases” izvēle, bet izvēle, kuras pamatā ir nejauša mehānisma darbība, kas nodrošina mums vajadzīgo varbūtības sadalījumu. Tādējādi monētas mešana ir piemērota pirmās jauktās stratēģijas īstenošanai. Spēlētājs izvēlas pirmo vai otro līniju atkarībā no tā, kā monēta nonāk. Spēlētājs vidēji vienlīdz bieži izvēlēsies gan pirmo, gan otro rindu, taču izvēle konkrētajā spēles iterācijā nav pakļauta nevienam fiksētam noteikumam un tai ir maksimālā slepenības pakāpe: līdz nejaušā mehānisma ieviešanai, tas nav zināms pat pašam pirmajam spēlētājam. Izlozes mehānisms ir labi piemērots otrās jauktās stratēģijas īstenošanai. Spēlētājs paņem septiņas vienādas papīra lapas, trīs no tām atzīmējot ar krustiņu, un iemet tās cepurē. Tad viņš nejauši izvelk vienu no tiem. Saskaņā ar klasisko varbūtību teoriju viņš izvilks papīra lapu ar krustiņu ar varbūtību 3/7 un tukšu papīra lapu ar varbūtību 4/7. Šāds zīmēšanas mehānisms spēj realizēt jebkuras racionālas varbūtības.

Ļaujiet spēlētājiem ievērot jauktas stratēģijas (2.18). Tad pirmā spēlētāja izmaksa noteiktā spēles iterācijā ir nejaušs mainīgais: v(X,Y). Tā kā spēlētāji izvēlas stratēģijas neatkarīgi viens no otra, tad saskaņā ar varbūtības reizināšanas teorēmu iznākuma (i, j) izvēles varbūtība ar uzvaru ir vienāda ar varbūtību reizinājumu. Tad gadījuma lieluma sadalījuma likums v(X,Y) norādīts nākamajā tabulā

Tagad ļaujiet spēlei darboties bezgalīgi. Tad vidējā izmaksa šādā spēlē ir vienāda ar vērtības matemātisko cerību v(X,Y).

(2.19)

Beigās, bet pietiekami liels skaits spēles iterācijas, vidējā izmaksa nedaudz atšķirsies no vērtības (2,19).

Piemērs 4. Aprēķiniet spēles vidējo peļņu (2,19) no 3. piemēra, ja spēlētāji izmanto šādas stratēģijas: . Izmaksas matrica un varbūtības matrica izskatās šādi:

Atradīsim vidējo:

Tādējādi vidējā izmaksa (2,20) ir starpposms starp maximin un minimax.

Tā kā jebkuram jauktu stratēģiju pārim X un Y var aprēķināt spēles vidējo vērtību, rodas problēmas atrast optimālo stratēģiju. Ir dabiski sākt ar piesardzīgu stratēģiju izpēti. Pirmā spēlētāja uzmanīgā stratēģija nodrošina viņam maksimumu. Otrā spēlētāja uzmanīgā stratēģija neļauj pirmajam uzvarēt vairāk par minimax. Nozīmīgākais rezultāts spēļu ar pretējām interesēm teorijā ir šāds:

Teorēma. Katrai matricas spēlei ir līdzsvara situācija jauktās stratēģijās. Pierādīt šo teorēmu nav viegli. Šajā kursā tas ir izlaists.

Sekas: Līdzsvara situācijas esamība nozīmē, ka maximin ir vienāds ar minimax, un tāpēc jebkurai matricas spēlei ir cena. Optimālā stratēģija pirmajam spēlētājam ir maksimālā stratēģija. Optimālā stratēģija otrajai ir minimax. Tā kā optimālo stratēģiju atrašanas problēma ir atrisināta, mēs sakām, ka jebkura matricas spēle atrisināms par dažādām jauktām stratēģijām.

2x2 spēles risinājums

Piemērs 5. Atrisiniet spēli. Nav grūti pārbaudīt, vai nav seglu punkta. Apzīmēsim pirmā spēlētāja optimālo stratēģiju (x, 1-x) ir kolonnas vektors, bet ērtības labad mēs to rakstām kā virkni. Apzīmēsim otrā spēlētāja optimālo stratēģiju (y,1-y).

Pirmā spēlētāja izmaksa ir nejaušs lielums ar šādu sadalījumu:

v(x,y) 2 -1 -4 7
lpp xy x(1-y) (1–x) g (1-x) (1-y)

Mēs atrodam pirmā spēlētāja vidējo izmaksu vienā iterācijā - nejaušā mainīgā matemātisko cerību v(x,y):

Pārveidosim šo izteiksmi:

Šī matemātiskā cerība sastāv no konstantes (5/7) un mainīgās daļas: 14 (x-11/14) (y-8/14). Ja vērtība y atšķiras no 8/14, tad pirmais spēlētājs vienmēr var izvēlēties X tādā veidā, lai mainīgā daļa būtu pozitīva, palielinot jūsu laimestu. Ja vērtība X atšķiras no 11/14, tad otrais spēlētājs vienmēr var izvēlēties y tādā veidā, lai mainīgo daļu padarītu negatīvu, samazinot pirmā spēlētāja izmaksu. Tādējādi seglu punktu nosaka vienādības: x*=11/14, y*=8/14.

2.5 Spēļu risināšana

Mēs parādīsim, kā atrisināt šādas spēles, izmantojot piemēru.

Piemērs 6. Atrisiniet spēli . Mēs pārliecināmies, ka nav seglu punkta. Apzīmēsim pirmā spēlētāja jaukto stratēģiju X=(x, 1-x) ir kolonnas vektors, bet ērtības labad mēs to rakstām kā virkni.

Lai pirmais spēlētājs izmanto stratēģiju X, bet otrais spēlētājs izmanto savu j-tā tīra stratēģija. Apzīmēsim pirmā spēlētāja vidējo peļņu šajā situācijā kā . Mums ir:

Attēlosim funkciju grafikus (2.21) segmentā .

Punkta ordināta, kas atrodas uz jebkura taisnas līnijas segmenta, atbilst pirmā spēlētāja laimestam situācijā, kad viņš izmanto jauktu stratēģiju (x, (1-x)), bet otrais spēlētājs – atbilstošā tīrā stratēģija. Pirmā spēlētāja garantētais rezultāts ir taisnu līniju saimes apakšējā aploksne (salauzta ABC). Augstākais punktsšī lauztā līnija (punkts B) ir spēlētāja 1 maksimālais garantētais rezultāts. Punkta B abscisa atbilst pirmā spēlētāja optimālajai stratēģijai.

Tā kā vēlamais punkts B ir līniju krustpunkts un , tā abscisu var atrast kā vienādojuma risinājumu:

Tādējādi pirmā spēlētāja optimālā jauktā stratēģija ir (5/9, 4/9). Punkta B ordināta ir spēles izmaksas. Tas ir vienāds ar:

(2.22)

Ņemiet vērā, ka līnija, kas atbilst otrā spēlētāja otrajai stratēģijai, iet virs punkta B. Tas nozīmē, ka, ja pirmais spēlētājs izmanto savu optimālo stratēģiju, bet 2. spēlētājs izmanto otro, tad otrā spēlētāja zaudējums palielinās, salīdzinot ar stratēģiju izmantošanu. 1 vai 3. Tādējādi otrajai stratēģijai nevajadzētu piedalīties otrā spēlētāja optimālajā stratēģijā. Otrā spēlētāja optimālajai stratēģijai vajadzētu izskatīties šādi: . Otrā spēlētāja tīrās 1. un 3. stratēģijas, kurām optimālajā stratēģijā ir komponenti, kas nav nulle, parasti tiek saukti nozīmīgs. 2. stratēģija tiek saukta nenozīmīgs. No iepriekš redzamā attēla, kā arī no vienādības (2.22) ir skaidrs, ka tad, kad pirmais spēlētājs izmanto savu optimālo stratēģiju, otrā spēlētāja peļņa nav atkarīga no tā, kuru no viņa svarīgākajām stratēģijām viņš izmanto. Viņš var arī pielietot jebkuru jauktu stratēģiju, kas sastāv no nozīmīgām (jo īpaši optimālajām), un laimesti šajā gadījumā nemainīsies. Pilnīgi līdzīgs apgalvojums attiecas uz pretējo gadījumu. Ja otrais spēlētājs izmanto savu optimālo stratēģiju, tad pirmā spēlētāja peļņa nav atkarīga no tā, kuru no viņa svarīgākajām stratēģijām viņš izmanto, un ir vienāda ar spēles izmaksām.