Ο μηχανισμός εύρεσης λύσης ισορροπίας. Η δυαδικότητα στον γραμμικό προγραμματισμό. Ιδιότητα αμοιβαία διττών προβλημάτων

20.06.2020

Οι βέλτιστες στρατηγικές στη θεωρία των συγκρούσεων θεωρούνται αυτές που οδηγούν τους παίκτες σε σταθερές ισορροπίες, δηλ. ορισμένες καταστάσεις που ικανοποιούν όλους τους παίκτες.

Η βέλτιστη λύση στη θεωρία παιγνίων βασίζεται στην έννοια κατάσταση ισορροπίας:

1) δεν είναι ωφέλιμο για κανέναν από τους παίκτες να παρεκκλίνει από την κατάσταση ισορροπίας εάν όλοι οι άλλοι παραμένουν σε αυτήν,

2) η έννοια της ισορροπίας - όταν το παιχνίδι επαναλαμβάνεται πολλές φορές, οι παίκτες θα φτάσουν σε μια κατάσταση ισορροπίας, ξεκινώντας το παιχνίδι σε οποιαδήποτε στρατηγική κατάσταση.

Σε κάθε αλληλεπίδραση, μπορούν να υπάρχουν οι ακόλουθοι τύποι ισορροπιών:

1. ισορροπία σε προσεκτικές στρατηγικές . Καθορίζεται από στρατηγικές που παρέχουν στους παίκτες ένα εγγυημένο αποτέλεσμα.

2. ισορροπία σε κυρίαρχες στρατηγικές .

Κυρίαρχη στρατηγικήείναι ένα σχέδιο δράσης που παρέχει σε έναν συμμετέχοντα το μέγιστο κέρδος ανεξάρτητα από τις ενέργειες του άλλου συμμετέχοντα. Επομένως, η ισορροπία των κυρίαρχων στρατηγικών θα είναι η τομή των κυρίαρχων στρατηγικών και των δύο συμμετεχόντων στο παιχνίδι.

Εάν οι βέλτιστες στρατηγικές των παικτών κυριαρχούν σε όλες τις άλλες στρατηγικές τους, τότε το παιχνίδι έχει μια ισορροπία στις κυρίαρχες στρατηγικές. Στο παιχνίδι διλήμματος των κρατουμένων, το σύνολο στρατηγικών ισορροπίας Nash θα είναι ("αναγνωρίζω - παραδέχομαι"). Επιπλέον, είναι σημαντικό να σημειωθεί ότι τόσο για τον παίκτη Α όσο και για τον παίκτη Β, η «αναγνώριση» είναι η κυρίαρχη στρατηγική, ενώ η «μη αναγνώριση» είναι η κυρίαρχη στρατηγική.

3. ισορροπία Nash . Ισορροπία Nashείναι ένας τύπος απόφασης σε ένα παιχνίδι δύο ή περισσότερων παικτών στο οποίο κανένας συμμετέχων δεν μπορεί να αυξήσει τα κέρδη αλλάζοντας την απόφασή του μονομερώς, όταν οι άλλοι συμμετέχοντες δεν αλλάζουν τις αποφάσεις τους.

Ας πούμε ότι είναι ένα παιχνίδι nάτομα σε κανονική μορφή, όπου είναι ένα σύνολο καθαρών στρατηγικών και είναι ένα σύνολο απολαβών.

Όταν κάθε παίκτης επιλέγει μια στρατηγική στο προφίλ στρατηγικής, ο παίκτης λαμβάνει μια νίκη. Επιπλέον, τα κέρδη εξαρτώνται από ολόκληρο το προφίλ των στρατηγικών: όχι μόνο από τη στρατηγική που έχει επιλέξει ο ίδιος ο παίκτης, αλλά και από τις στρατηγικές άλλων ανθρώπων. Ένα προφίλ στρατηγικής είναι μια ισορροπία Nash εάν η αλλαγή της στρατηγικής κάποιου δεν είναι επωφελής για κανέναν παίκτη, δηλαδή για οποιονδήποτε

Ένα παιχνίδι μπορεί να έχει μια ισορροπία Nash τόσο σε καθαρές όσο και σε μικτές στρατηγικές.

Ο Νας το απέδειξε αν το επιτρέψουμε μικτές στρατηγικές, τότε σε κάθε παιχνίδι nΟι παίκτες θα έχουν τουλάχιστον μία ισορροπία Nash.

Σε μια κατάσταση ισορροπίας Nash, η στρατηγική κάθε παίκτη του παρέχει την καλύτερη απάντηση στις στρατηγικές των άλλων παικτών.

4. Ισορροπία Stackelberg. Μοντέλο Stackelberg– ένα μοντέλο θεωρίας παιγνίων μιας ολιγοπωλιακής αγοράς με την παρουσία ασυμμετρίας πληροφοριών. Σε αυτό το μοντέλο, η συμπεριφορά των επιχειρήσεων περιγράφεται από ένα δυναμικό παιχνίδι με πλήρεις τέλειες πληροφορίες, στο οποίο η συμπεριφορά των επιχειρήσεων μοντελοποιείται χρησιμοποιώντας στατικόςπαιχνίδια με πλήρεις πληροφορίες. Κύριο χαρακτηριστικόΤο παιχνίδι είναι η παρουσία μιας κορυφαίας εταιρείας, η οποία είναι η πρώτη που καθορίζει τον όγκο παραγωγής των αγαθών και οι υπόλοιπες εταιρείες καθοδηγούνται στους υπολογισμούς τους από αυτό. Βασικές προϋποθέσεις του παιχνιδιού:

· η βιομηχανία παράγει ένα ομοιογενές προϊόν: οι διαφορές μεταξύ των προϊόντων διαφορετικών εταιρειών είναι αμελητέες, πράγμα που σημαίνει ότι ο αγοραστής, όταν επιλέγει από ποια εταιρεία να αγοράσει, καθοδηγείται μόνο από την τιμή.

· Υπάρχει μικρός αριθμός επιχειρήσεων που δραστηριοποιούνται στον κλάδο.

· Οι επιχειρήσεις καθορίζουν την ποσότητα των παραγόμενων προϊόντων και η τιμή για αυτήν καθορίζεται με βάση τη ζήτηση.

· υπάρχει μια λεγόμενη εταιρεία leader, ο όγκος παραγωγής της οποίας χρησιμοποιείται από άλλες εταιρείες.

Έτσι, το μοντέλο Stackelberg χρησιμοποιείται για την εύρεση της βέλτιστης λύσης σε δυναμικά παιχνίδια και αντιστοιχεί στη μέγιστη απόδοση των παικτών, με βάση τις συνθήκες που προκύπτουν αφού η επιλογή έχει ήδη γίνει από έναν ή περισσότερους παίκτες. Ισορροπία Stackelberg.- μια κατάσταση όπου κανένας από τους παίκτες δεν μπορεί να αυξήσει τα κέρδη του μονομερώς και οι αποφάσεις λαμβάνονται πρώτα από έναν παίκτη και γίνονται γνωστές στον δεύτερο παίκτη. Στο παιχνίδι «δίλημμα κρατουμένων», η ισορροπία Stackelberg θα επιτευχθεί στο τετράγωνο (1;1) - «παραδεχτείτε την ενοχή» και από τους δύο εγκληματίες.

5. Βελτιστότητα Pareto- μια κατάσταση του συστήματος στην οποία η αξία κάθε συγκεκριμένου κριτηρίου που περιγράφει την κατάσταση του συστήματος δεν μπορεί να βελτιωθεί χωρίς να επιδεινωθεί η θέση των άλλων παικτών.

Η αρχή Pareto δηλώνει: «Οποιαδήποτε αλλαγή που δεν προκαλεί απώλεια, αλλά φέρνει οφέλη σε μερικούς ανθρώπους (κατά τη δική τους εκτίμηση), είναι μια βελτίωση». Έτσι, αναγνωρίζεται το δικαίωμα σε όλες τις αλλαγές που δεν προκαλούν πρόσθετη βλάβη σε κανέναν.

Το σύνολο των βέλτιστων καταστάσεων Pareto ενός συστήματος ονομάζεται «σύνολο Pareto», «το σύνολο των βέλτιστων εναλλακτικών Pareto» ή «το σύνολο των βέλτιστων εναλλακτικών».

Η κατάσταση κατά την οποία επιτυγχάνεται η αποτελεσματικότητα Pareto είναι μια κατάσταση όπου όλα τα οφέλη από την ανταλλαγή έχουν εξαντληθεί.

Η αποτελεσματικότητα Pareto είναι μια από τις κεντρικές έννοιες για το σύγχρονο οικονομική επιστήμη. Με βάση αυτή την έννοια, οικοδομούνται το πρώτο και το δεύτερο θεμελιώδες θεώρημα της ευημερίας.

Μία από τις εφαρμογές της βελτιστοποίησης Pareto είναι η κατανομή πόρων Pareto (εργασίας και κεφαλαίου) στη διεθνή οικονομική ολοκλήρωση, δηλ. οικονομική ενοποίηση δύο ή περισσότερων κρατών. Είναι ενδιαφέρον ότι η κατανομή Pareto πριν και μετά τη διεθνή οικονομική ολοκλήρωση περιγράφηκε επαρκώς μαθηματικά (Dalimov R.T., 2008). Η ανάλυση έδειξε ότι η προστιθέμενη αξία των τομέων και το εισόδημα των εργατικών πόρων κινούνται προς την αντίθετη κατεύθυνση σύμφωνα με τη γνωστή εξίσωση της θερμικής αγωγιμότητας, παρόμοια με ένα αέριο ή υγρό στο διάστημα, που καθιστά δυνατή την εφαρμογή της μεθοδολογίας ανάλυσης χρησιμοποιείται στη φυσική σε σχέση με οικονομικά προβλήματα μετανάστευσης οικονομικών παραμέτρων.

Pareto βέλτιστοδηλώνει ότι η ευημερία της κοινωνίας φτάνει στο μέγιστο και η κατανομή των πόρων γίνεται βέλτιστη, εάν οποιαδήποτε αλλαγή σε αυτήν την κατανομή επιδεινώσει την ευημερία τουλάχιστον ενός υποκειμένου του οικονομικού συστήματος.

Pareto-βέλτιστη κατάσταση αγοράς- μια κατάσταση όπου είναι αδύνατο να βελτιωθεί η θέση οποιουδήποτε συμμετέχοντος στην οικονομική διαδικασία χωρίς ταυτόχρονα να μειωθεί η ευημερία τουλάχιστον ενός από τους άλλους.

Σύμφωνα με το κριτήριο Pareto (κριτήριο για την ανάπτυξη της κοινωνικής ευημερίας), η κίνηση προς το βέλτιστο είναι δυνατή μόνο με μια τέτοια κατανομή πόρων που αυξάνει την ευημερία τουλάχιστον ενός ατόμου χωρίς να βλάπτει κανέναν άλλο.

Μια κατάσταση S* λέγεται ότι ο Pareto κυριαρχεί σε μια κατάσταση S εάν:

· για οποιονδήποτε παίκτη η ανταμοιβή του είναι S<=S*

· υπάρχει τουλάχιστον ένας παίκτης για τον οποίο η πληρωμή του στην κατάσταση είναι S*>S

Στο πρόβλημα του «διλήμματος των φυλακισμένων», η ισορροπία Pareto, όταν είναι αδύνατο να βελτιωθεί η θέση του ενός από τους παίκτες χωρίς να επιδεινωθεί η θέση του άλλου, αντιστοιχεί στην κατάσταση του τετραγώνου (2;2).

Ας σκεφτούμε παράδειγμα 1:

Ισορροπίες σε κυρίαρχες στρατηγικέςΟχι.

Ισορροπία Nash. (5.5) και (4.4). Δεδομένου ότι είναι ασύμφορο για οποιονδήποτε από τους παίκτες να παρεκκλίνει μεμονωμένα από την επιλεγμένη στρατηγική.

Pareto βέλτιστο. (5.5). Δεδομένου ότι τα κέρδη των παικτών όταν επιλέγουν αυτές τις στρατηγικές είναι μεγαλύτερα από τα κέρδη όταν επιλέγουν άλλες στρατηγικές.

Ισορροπία Stackelberg:

Ο παίκτης Α κάνει την πρώτη κίνηση.

Επιλέγει την πρώτη του στρατηγική. Ο Β επιλέγει την πρώτη στρατηγική. Ο Α παίρνει 5.

Επιλέγει τη δεύτερη στρατηγική του. Ο Β επιλέγει το δεύτερο. Ο Α παίρνει 4.

5 > 4 =>

Ο Β κάνει την πρώτη κίνηση.

Επιλέγει την πρώτη του στρατηγική. Ο Α επιλέγει την πρώτη στρατηγική. Ο Β παίρνει 5.

Επιλέγει τη δεύτερη στρατηγική του. Και διαλέγει το δεύτερο. Ο Β παίρνει 4.

5 > 4 => Ισορροπία Stackelberg (5, 5)

Παράδειγμα 2.Δυοπώλιο μοντελοποίησης.

Ας εξετάσουμε την ουσία αυτού του μοντέλου:

Ας υπάρχει ένας κλάδος με δύο εταιρίες, εκ των οποίων η μία είναι «επιχείρηση ηγετική», η άλλη «εταιρεία ακολούθων». Έστω η τιμή του προϊόντος μια γραμμική συνάρτηση της συνολικής προσφοράς Q:

Π(Q) = ένα − bQ.

Ας υποθέσουμε επίσης ότι το κόστος των επιχειρήσεων ανά μονάδα παραγωγής είναι σταθερό και ίσο με Με 1 και Με 2 αντίστοιχα. Τότε θα καθοριστεί το κέρδος της πρώτης επιχείρησης τύπος

Π 1 = Π(Q 1 + Q 2) * Q 1 − ντο 1 Q 1 ,

και το κέρδος είναι δεύτερο αναλόγως

Π 2 = Π(Q 1 + Q 2) * Q 2 − ντο 2 Q 2 .

Σύμφωνα με το μοντέλο Stackelberg, η πρώτη εταιρεία - η ηγέτιδα εταιρεία - στο πρώτο βήμα εκχωρεί την παραγωγή της Q 1 . Μετά από αυτό, η δεύτερη εταιρεία - η εταιρεία που ακολουθεί - αναλύοντας τις ενέργειες της ηγετικής εταιρείας καθορίζει την παραγωγή της Q 2. Στόχος και των δύο εταιρειών είναι να μεγιστοποιήσουν τις λειτουργίες πληρωμών τους.

Η ισορροπία Nash σε αυτό το παιχνίδι καθορίζεται από την αντίστροφη επαγωγή. Ας εξετάσουμε το προτελευταίο στάδιο του παιχνιδιού - την κίνηση της δεύτερης εταιρείας. Σε αυτό το στάδιο, η επιχείρηση 2 γνωρίζει τον όγκο της βέλτιστης παραγωγής της πρώτης επιχείρησης Q 1 * . Στη συνέχεια, το πρόβλημα του προσδιορισμού της βέλτιστης παραγωγής Q 2 * καταλήγει στην επίλυση του προβλήματος της εύρεσης του μέγιστου σημείου της συνάρτησης πληρωμής της δεύτερης εταιρείας. Μεγιστοποίηση της συνάρτησης Π 2 ως προς τη μεταβλητή Q 2, μετρώντας Q 1 δεδομένου, βρίσκουμε ότι η βέλτιστη παραγωγή της δεύτερης επιχείρησης

Αυτή είναι η καλύτερη απάντηση της εταιρείας που ακολουθεί στην επιλογή έκδοσης από την ηγετική εταιρεία. Q 1 * . Η κορυφαία εταιρεία μπορεί να μεγιστοποιήσει τη λειτουργία πληρωμής της, λαμβάνοντας υπόψη το είδος της λειτουργίας Q 2*. Μέγιστο σημείο της συνάρτησης Π 1 σε μεταβλητή Q 1 κατά την αντικατάσταση Q 2* θα είναι

Αντικαθιστώντας αυτό στην έκφραση για Q 2 * , παίρνουμε

Έτσι, σε κατάσταση ισορροπίας, η ηγέτιδα εταιρεία παράγει διπλάσια παραγωγή από την εταιρεία που ακολουθεί.

Η βέλτιστη λύση στη θεωρία παιγνίων βασίζεται στην έννοια κατάσταση ισορροπίας:

Σε κάθε αλληλεπίδραση, μπορούν να υπάρχουν οι ακόλουθοι τύποι ισορροπιών:

2. ισορροπία σε κυρίαρχες στρατηγικές .

Ένα παιχνίδι μπορεί να έχει μια ισορροπία Nash τόσο σε καθαρές όσο και σε μικτές στρατηγικές.

4. Ισορροπία Stackelberg. Μοντέλο Stackelberg– ένα μοντέλο θεωρίας παιγνίων μιας ολιγοπωλιακής αγοράς με την παρουσία ασυμμετρίας πληροφοριών. Σε αυτό το μοντέλο, η συμπεριφορά των επιχειρήσεων περιγράφεται από ένα δυναμικό παιχνίδι με πλήρεις τέλειες πληροφορίες, στο οποίο η συμπεριφορά των επιχειρήσεων μοντελοποιείται χρησιμοποιώντας στατικόςπαιχνίδια με πλήρεις πληροφορίες. Το κύριο χαρακτηριστικό του παιχνιδιού είναι η παρουσία μιας κορυφαίας εταιρείας, η οποία είναι η πρώτη που καθορίζει τον όγκο παραγωγής των αγαθών και οι υπόλοιπες επιχειρήσεις καθοδηγούνται στους υπολογισμούς τους από αυτήν. Βασικές προϋποθέσεις του παιχνιδιού:

· Υπάρχει μικρός αριθμός επιχειρήσεων που δραστηριοποιούνται στον κλάδο.

· υπάρχει μια λεγόμενη εταιρεία leader, ο όγκος παραγωγής της οποίας χρησιμοποιείται από άλλες εταιρείες.

Η αποτελεσματικότητα Pareto είναι μια από τις κεντρικές έννοιες για τη σύγχρονη οικονομική επιστήμη. Με βάση αυτή την έννοια, οικοδομούνται το πρώτο και το δεύτερο θεμελιώδες θεώρημα της ευημερίας.

Μια κατάσταση S* λέγεται ότι ο Pareto κυριαρχεί σε μια κατάσταση S εάν:

· για οποιονδήποτε παίκτη η ανταμοιβή του είναι S<=S*

· υπάρχει τουλάχιστον ένας παίκτης για τον οποίο η πληρωμή του στην κατάσταση είναι S*>S

Ας σκεφτούμε παράδειγμα 1.

Ας εξετάσουμε τον μηχανισμό για την εδραίωση της ισορροπίας της αγοράς, όταν, υπό την επίδραση αλλαγών στη ζήτηση ή στους παράγοντες προσφοράς, η αγορά εγκαταλείπει αυτή την κατάσταση. Υπάρχουν δύο κύριοι τύποι ανισορροπίας μεταξύ προσφοράς και ζήτησης: η υπερβολική και η έλλειψη αγαθών.

Υπέρβαση(πλεόνασμα) ενός προϊόντος είναι μια κατάσταση της αγοράς όταν η προσφορά ενός προϊόντος σε μια δεδομένη τιμή υπερβαίνει τη ζήτηση για αυτό. Σε αυτή την περίπτωση, δημιουργείται ανταγωνισμός μεταξύ των κατασκευαστών, αγώνας για αγοραστές. Νικητής είναι αυτός που προσφέρει περισσότερα κερδοφόρους όρουςπωλήσεις αγαθών. Έτσι, η αγορά προσπαθεί να επιστρέψει σε κατάσταση ισορροπίας.

Ελλειψηαγαθά - στην περίπτωση αυτή, η ζητούμενη ποσότητα για ένα προϊόν σε μια δεδομένη τιμή υπερβαίνει την ποσότητα που παρέχεται για το προϊόν. Σε αυτήν την κατάσταση, δημιουργείται ανταγωνισμός μεταξύ των αγοραστών για την ευκαιρία να αγοράσουν σπάνια αγαθά. Αυτός που προσφέρει την υψηλότερη τιμή για ένα δεδομένο προϊόν κερδίζει. Η αυξημένη τιμή προσελκύει την προσοχή των κατασκευαστών, οι οποίοι αρχίζουν να επεκτείνουν την παραγωγή, αυξάνοντας έτσι την προσφορά αγαθών. Ως αποτέλεσμα, το σύστημα επιστρέφει σε κατάσταση ισορροπίας.

Έτσι, η τιμή εκτελεί μια εξισορροπητική λειτουργία, διεγείροντας την επέκταση της παραγωγής και της προσφοράς αγαθών κατά τις ελλείψεις και περιορίζοντας την προσφορά, απαλλάσσοντας την αγορά από πλεονάσματα.

Ο εξισορροπητικός ρόλος της τιμής εκδηλώνεται τόσο μέσω της ζήτησης όσο και της προσφοράς.

Ας υποθέσουμε ότι η ισορροπία που δημιουργήθηκε στην αγορά μας διαταράχθηκε - υπό την επίδραση κάποιων παραγόντων (για παράδειγμα, αύξηση του εισοδήματος) υπήρξε αύξηση της ζήτησης, με αποτέλεσμα η καμπύλη της να μετατοπιστεί από Δ1 V Δ2(Εικ. 4.3 α), αλλά η πρόταση παρέμεινε αμετάβλητη.

Εάν η τιμή ενός δεδομένου προϊόντος δεν έχει αλλάξει αμέσως μετά τη μετατόπιση της καμπύλης ζήτησης, τότε μετά από αύξηση της ζήτησης θα προκύψει μια κατάσταση όταν, στην ίδια τιμή P1ποσότητα αγαθών που μπορεί πλέον κάθε αγοραστής αγορά (QD)υπερβαίνει τον όγκο που μπορούν να προσφερθούν σε μια δεδομένη τιμή από τους κατασκευαστές ενός δεδομένου αγαθών (QS).Το ποσό της ζήτησης θα υπερβαίνει πλέον το ποσό της προσφοράς αυτού του προϊόντος, που σημαίνει την εμφάνιση του έλλειψη αγαθώνσε ποσοστό Df = QD – Qsσε αυτή την αγορά.

Η έλλειψη αγαθών, όπως ήδη γνωρίζουμε, οδηγεί σε ανταγωνισμό μεταξύ των αγοραστών για την ευκαιρία να αγοράσουν αυτό το προϊόν, γεγονός που οδηγεί σε αύξηση των τιμών της αγοράς. Σύμφωνα με το νόμο της προσφοράς, η απάντηση των πωλητών στην αύξηση της τιμής θα είναι η αύξηση της προσφερόμενης ποσότητας. Στο διάγραμμα αυτό θα εκφραστεί με την κίνηση του σημείου ισορροπίας της αγοράς Ε1κατά μήκος της καμπύλης προσφοράς μέχρι να διασταυρωθεί με τη νέα καμπύλη ζήτησης Δ2όπου θα επιτευχθεί μια νέα ισορροπία αυτής της αγοράς Ε2 sποσότητα ισορροπίας αγαθών Ε2και τιμή ισορροπίας P2.

Ρύζι. 4.3. Μετατόπιση του σημείου τιμής ισορροπίας.

Ας εξετάσουμε μια κατάσταση όπου η κατάσταση ισορροπίας διαταράσσεται από την πλευρά της προσφοράς.

Ας υποθέσουμε ότι υπό την επίδραση κάποιων παραγόντων υπήρξε αύξηση της προσφοράς, με αποτέλεσμα η καμπύλη της να μετατοπιστεί προς τα δεξιά από τη θέση S1 V S2και η ζήτηση παρέμεινε αμετάβλητη (Εικ. 4.3 β).

Με την προϋπόθεση ότι η τιμή της αγοράς παραμένει στα ίδια επίπεδα (P1)αύξηση της προσφοράς θα οδηγήσει σε υπέρβασηεμπορεύματα σε μέγεθος Sp = Qs – QD.Ως αποτέλεσμα, υπάρχει ανταγωνισμός πωλητών,οδηγώντας σε μείωση της αγοραίας τιμής (με P1πριν P2)και αύξηση του όγκου των πωλήσεων. Αυτό θα αντικατοπτρίζεται στο γράφημα μετακινώντας το σημείο ισορροπίας της αγοράς Ε1κατά μήκος της καμπύλης ζήτησης έως ότου διασταυρωθεί με τη νέα καμπύλη προσφοράς, η οποία θα οδηγήσει στη δημιουργία μιας νέας ισορροπίας Ε2με παραμέτρους Ε2Και P2.

Ομοίως, είναι δυνατό να προσδιοριστεί η επίδραση στην τιμή ισορροπίας και στην ποσότητα ισορροπίας των αγαθών από τη μείωση της ζήτησης και τη μείωση της προσφοράς.

ΣΕ εκπαιδευτική βιβλιογραφίαδιατυπώνονται τέσσερις κανόνες για την αλληλεπίδραση προσφοράς και ζήτησης.

1. Η αύξηση της ζήτησης προκαλεί αύξηση της τιμής ισορροπίας και της ποσότητας ισορροπίας των αγαθών.

2. Η μείωση της ζήτησης προκαλεί πτώση τόσο της τιμής ισορροπίας όσο και της ποσότητας ισορροπίας των αγαθών.

3. Η αύξηση της προσφοράς συνεπάγεται μείωση της τιμής ισορροπίας και αύξηση της ποσότητας ισορροπίας των αγαθών.

4. Η μείωση της προσφοράς συνεπάγεται αύξηση της τιμής ισορροπίας και μείωση της ποσότητας ισορροπίας των αγαθών.

Χρησιμοποιώντας αυτούς τους κανόνες, μπορείτε να βρείτε το σημείο ισορροπίας για τυχόν αλλαγές στην προσφορά και τη ζήτηση.

Η επιστροφή των τιμών στο επίπεδο ισορροπίας της αγοράς μπορεί κυρίως να παρεμποδιστεί από τις ακόλουθες περιστάσεις:

1) διοικητική ρύθμιση τιμών\

2) μονοπώλιοπαραγωγός ή καταναλωτής, επιτρέποντάς τους να διατηρήσουν μονοπωλιακή τιμή, η οποία μπορεί να είναι είτε τεχνητά υψηλή είτε χαμηλή.

| |

Θέμα 4. Θεωρία παιγνίων και μοντελοποίηση αλληλεπίδρασης.

1. Βασικές έννοιες της θεωρίας παιγνίων.

2. Τύποι ισορροπίας: Ισορροπία Nash, Ισορροπία Steckelberg, Βέλτιστη ισορροπία Pareto, ισορροπία κυρίαρχων στρατηγικών.

3. Βασικά μοντέλα θεωρίας παιγνίων.

Βασικές έννοιες της θεωρίας παιγνίων.

Χρήση μαθηματικές μεθόδους, που περιλαμβάνει τη θεωρία παιγνίων, στην ανάλυση των οικονομικών διαδικασιών μας επιτρέπει να εντοπίσουμε τάσεις και σχέσεις που παραμένουν κρυφές όταν χρησιμοποιούμε άλλες μεθόδους και ακόμη και να έχουμε πολύ απροσδόκητα αποτελέσματα.

Σημειώστε ότι η θεωρία παιγνίων είναι ένας από τους νεότερους μαθηματικούς κλάδους. Η εμφάνισή του ως ανεξάρτητου κλάδου των μαθηματικών χρονολογείται από τα μέσα της δεκαετίας του 1950, όταν δημοσιεύτηκε η περίφημη μονογραφία των F. Neumann και O. Morgenstern «The Theory of Games and Economic Behavior». Οι απαρχές της θεωρίας παιγνίων που συνδέονται με τα έργα του E. Porel (1921).

Μέχρι τώρα, η θεωρία παιγνίων έχει μετατραπεί σε ένα ολόκληρο μαθηματικό πεδίο, πλούσιο σε ενδιαφέροντα αποτελέσματα και έχοντας ένας μεγάλος αριθμός από πρακτικές συστάσειςκαι εφαρμογές.

Ας εξετάσουμε τις βασικές παραδοχές και έννοιες του μοντέλου παιχνιδιού των διαανθρωπίνων αλληλεπιδράσεων.

1. Ο αριθμός των ατόμων που αλληλεπιδρούν είναι δύο. Τα άτομα ονομάζονται παίκτες. Η έννοια του παίκτη μας επιτρέπει να μοντελοποιούμε κοινωνικούς ρόλουςάτομο: πωλητής, αγοραστής, σύζυγος, σύζυγος κ.λπ. Ένα παιχνίδι είναι μια απλοποιημένη αναπαράσταση των αλληλεπιδράσεων δύο ατόμων που έχουν διαφορετικούς ή παρόμοιους κοινωνικούς ρόλους, για παράδειγμα, αγοραστής - πωλητής, πωλητής - πωλητής κ.λπ.

2. Κάθε άτομο έχει ένα σταθερό σύνολο επιλογών συμπεριφοράς ή εναλλακτικών. Ο αριθμός των επιλογών συμπεριφοράς για διαφορετικούς παίκτες μπορεί να μην είναι ίδιος.

3. Η διαπροσωπική αλληλεπίδραση θεωρείται ότι υλοποιείται εάν και οι δύο παίκτες επιλέγουν ταυτόχρονα επιλογές για τη συμπεριφορά τους και ενεργούν σύμφωνα με αυτές. Μια μεμονωμένη πράξη ανθρώπινης αλληλεπίδρασης ονομάζεται η πορεία ενός παιχνιδιού. Η διάρκεια της πράξης αλληλεπίδρασης θεωρείται ότι είναι μηδέν.

4. Η πορεία του παιχνιδιού καθορίζεται από δύο ακέραιους αριθμούς - τον επιλεγμένο αριθμό της επιλογής συμπεριφοράς (μετακίνηση) του πρώτου παίκτη και τον επιλεγμένο αριθμό της επιλογής συμπεριφοράς (μετακίνηση) του δεύτερου παίκτη. Ο μέγιστος δυνατός αριθμός διαφορετικών κινήσεων στο παιχνίδι είναι ίσος με το γινόμενο του συνολικού αριθμού κινήσεων του πρώτου παίκτη και του συνολικού αριθμού κινήσεων του δεύτερου παίκτη.

5. Κάθε αλληλεπίδραση μεταξύ ατόμων, ή κίνηση παιχνιδιού, λαμβάνει τον δικό της σειριακό αριθμό: 1, 2, 3, κ.λπ. Η έννοια της «μετακίνησης παιχνιδιού» (ζεύγος αριθμών) και «αριθμός κίνησης παιχνιδιού» (ένας αριθμός) δεν πρέπει να συγχέεται. Οι αλληλεπιδράσεις υποτίθεται ότι συμβαίνουν τακτικά σε τακτά χρονικά διαστήματα, επομένως ο αριθμός σειράς του παιχνιδιού υποδεικνύει το χρονικό διάστημα που τα συγκεκριμένα άτομα αλληλεπιδρούν μεταξύ τους.

6. Κάθε παίκτης προσπαθεί να επιτύχει τη μέγιστη τιμή κάποιου δείκτη στόχου, που ονομάζεται χρησιμότητα, ή κέρδη. Έτσι, ο παίκτης έχει τα χαρακτηριστικά ενός «οικονομικού ανθρώπου». Η ανταμοιβή του παίκτη μπορεί να είναι είτε θετική είτε αρνητική. Ένα αρνητικό κέρδος ονομάζεται επίσης απώλεια.

7. Κάθε κίνηση του παιχνιδιού (ένα ζευγάρι εναλλακτικών που επιλέγουν οι παίκτες) αντιστοιχεί σε ένα μόνο ζευγάρι κερδών παικτών. Η εξάρτηση των κερδών των παικτών από τις κινήσεις που επιλέγουν περιγράφεται από τη μήτρα του παιχνιδιού ή τη μήτρα πληρωμής. Οι σειρές αυτού του πίνακα αντιστοιχούν στις εναλλακτικές (κινήσεις) του πρώτου παίκτη και οι στήλες αντιστοιχούν στις εναλλακτικές (κινήσεις) του δεύτερου παίκτη. Τα στοιχεία της μήτρας του παιχνιδιού είναι ζεύγη κερδών που αντιστοιχούν στην αντίστοιχη σειρά και στήλη (κινήσεις παίκτη). Τα κέρδη του πρώτου παίκτη (ο πρώτος αριθμός στο κελί της μήτρας του παιχνιδιού) εξαρτώνται όχι μόνο από την κίνησή του (αριθμός σειράς), αλλά και από την κίνηση του δεύτερου παίκτη (αριθμός στήλης). Επομένως, πριν εφαρμοστεί η αλληλεπίδραση, το άτομο δεν γνωρίζει το ακριβές ποσό του κέρδους του. Με άλλα λόγια, η επιλογή της συμπεριφοράς του παίκτη πραγματοποιείται υπό συνθήκες αβεβαιότητας, δηλαδή ο παίκτης έχει τα χαρακτηριστικά ενός «θεσμικού ατόμου».

8. Η στρατηγική ενός παίκτη είναι ένα συνηθισμένο μοτίβο συμπεριφοράς που ακολουθεί ο παίκτης όταν επιλέγει μια εναλλακτική συμπεριφορά για μια συγκεκριμένη χρονική περίοδο. Η στρατηγική του παίκτη καθορίζεται από τις πιθανότητες (ή τις συχνότητες) επιλογής όλων των πιθανών επιλογών συμπεριφοράς. Με άλλα λόγια, η στρατηγική του παίκτη είναι ένα διάνυσμα του οποίου ο αριθμός των συντεταγμένων είναι ίσος με συνολικός αριθμόςπιθανές εναλλακτικές και i-η συντεταγμένηίση με την πιθανότητα (συχνότητα) επιλογής i-η εναλλακτική. Είναι σαφές ότι το άθροισμα των τιμών όλων των συντεταγμένων δεδομένο διάνυσμαίσο με ένα.

Εάν ένας παίκτης επιλέξει μόνο μία επιλογή συμπεριφοράς κατά την υπό εξέταση χρονική περίοδο, τότε καλείται η στρατηγική του παίκτη ΚΑΘΑΡΗ.

Όλες οι συντεταγμένες του αντίστοιχου καθαρού διανύσματος στρατηγικής είναι ίσες με μηδέν, εκτός από μία, που ισούται με ένα.

Μια στρατηγική που δεν είναι καθαρή ονομάζεται μικτός.

Σε αυτήν την περίπτωση, το διάνυσμα στρατηγικής του παίκτη έχει τουλάχιστον δύο μη μηδενικές συντεταγμένες. Ανταποκρίνονται σε επιλογές ενεργητικής συμπεριφοράς. Ένας παίκτης που ακολουθεί μια μικτή στρατηγική εναλλάσσει ενεργές επιλογές συμπεριφοράς σύμφωνα με τις δεδομένες πιθανότητες (συχνότητες) επιλογής. Στη συνέχεια, για την απλότητα της παρουσίασης του υλικού, θα υποθέσουμε ότι ο παίκτης ακολουθεί πάντα κάποια καθαρή στρατηγική, δηλαδή, κατά τη διάρκεια της χρονικής περιόδου που εξετάζεται, επιλέγει πάντα μια επιλογή συμπεριφοράς από ένα δεδομένο σύνολο εναλλακτικών.

Ένα θεσμικό άτομο χαρακτηρίζεται από τη μεταβλητότητα της συμπεριφοράς του, η οποία εξαρτάται από την εσωτερική του κατάσταση, εμπειρία ζωής, εξωτερικό κοινωνικό περιβάλλονκ.λπ. Στο πλαίσιο της προσέγγισης του παιχνιδιού στη μελέτη των θεσμών, αυτή η ιδιότητα ενός θεσμικού προσώπου εκφράζεται στην πιθανότητα αλλαγής στρατηγικής του παίκτη. Εάν μεταξύ των στρατηγικών του παίκτη υπήρχε πάντα μια αντικειμενικά καλύτερη, τότε θα την ακολουθούσε πάντα και η αλλαγή της στρατηγικής θα ήταν άσκοπη. Αλλά σε πραγματική ζωήένα άτομο συνήθως εξετάζει διάφορες στρατηγικές συμπεριφοράς. Είναι αδύνατο να ξεχωρίσουμε αντικειμενικά τα καλύτερα από αυτά. Το μοντέλο παιχνιδιού των διαανθρωπίνων αλληλεπιδράσεων μας επιτρέπει να μελετήσουμε αυτό το χαρακτηριστικό της θεσμικής συμπεριφοράς, καθώς καλύπτει μια σειρά από στρατηγικές συμπεριφοράς που δεν αλληλοαποκλείονται και αντικατοπτρίζουν διάφορες πτυχέςσυμπεριφορά ενός θεσμικού προσώπου. Ας δούμε αυτά τα πρότυπα συμπεριφοράς.

Παιχνίδι μήτρα

Πρώτος παίκτης	Δεύτερος παίκτης

	6; 15	2; 13	3; 11
	1; 10	5; 14	4; 12
	4; 12	4; 13	3; 13

Διακρίνω αλληλέγγυαΚαι μη αλληλεγγύηστρατηγικές συμπεριφοράς. Τα πρώτα είναι τα πιο χαρακτηριστικά του «θεσμικού ανθρώπου» και τα δεύτερα του «οικονομικού ανθρώπου».

Μη αλληλεγγύηοι στρατηγικές συμπεριφοράς χαρακτηρίζονται από το γεγονός ότι ένα άτομο επιλέγει τη συμπεριφορά του ανεξάρτητα, ενώ είτε δεν λαμβάνει καθόλου υπόψη τη συμπεριφορά ενός άλλου ατόμου, είτε, με βάση την υπάρχουσα εμπειρία, υποθέτει πιθανή παραλλαγήτη συμπεριφορά του.

Οι κύριοι τύποι συμπεριφοράς μη αλληλεγγύης περιλαμβάνουν τα ακόλουθα: παράλογος, προσεκτικός, βελτιστοποίηση, αποκλίνουσαΚαι καινοτόμος.

1) Παράλογη συμπεριφορά. Ας υποδηλώσουμε τις δύο στρατηγικές του πρώτου παίκτη με Α και Β, αντίστοιχα. Η στρατηγική Α λέγεται ότι είναι κυρίαρχη σε σχέση με τη στρατηγική Β εάν, για οποιαδήποτε κίνηση του δεύτερου παίκτη, η απόδοση του πρώτου παίκτη που αντιστοιχεί στη στρατηγική Α είναι μεγαλύτερη από την ανταμοιβή του που αντιστοιχεί στη στρατηγική Β. Επομένως, η στρατηγική Β είναι αντικειμενικά χειρότερη με σεβασμό στη στρατηγική Α.

Εάν η στρατηγική Α μπορεί πάντα να επιλέγεται ελεύθερα από τον παίκτη, τότε η στρατηγική Β δεν πρέπει ποτέ να επιλέγεται καθόλου. Εάν, παρόλα αυτά, η στρατηγική Β επιλεγεί από τον πρώτο παίκτη, τότε η συμπεριφορά του σε αυτή την περίπτωση ονομάζεται παράλογη. Για να προσδιορίσετε την παράλογη συμπεριφορά ενός παίκτη, αρκεί να αναλύσετε τον πίνακα πληρωμών του: ο πίνακας πληρωμών του άλλου παίκτη δεν χρησιμοποιείται.

Σημειώστε ότι ο όρος «παράλογη συμπεριφορά» είναι δανεισμένος από το neo κλασική θεωρία. Σημαίνει μόνο ότι η επιλογή αυτής της στρατηγικής δεν είναι σίγουρα η καλύτερη σε μια κατάσταση όπου και οι δύο παίκτες βρίσκονται σε μια ανταγωνιστική αντιπαράθεση, χαρακτηριστική ενός «οικονομικού ανθρώπου». Αλλά για ένα «θεσμικό άτομο» που συνάπτει διαπροσωπικές αλληλεπιδράσεις με άλλα άτομα, η παράλογη συμπεριφορά όχι μόνο είναι δυνατή, αλλά μπορεί να αποδειχθεί και η πιο λογική πορεία δράσης. Ένα παράδειγμα αυτού είναι το παιχνίδι Prisoners' Dilemma.

2) Επιφυλακτική συμπεριφορά. Ο «θεσμικός άνθρωπος», σε αντίθεση με τον «οικονομικό άνθρωπο», δεν είναι απολύτως ορθολογικός, δηλ. δεν επιλέγει πάντα την καλύτερη συμπεριφορά που μεγιστοποιεί το κέρδος. Ο περιορισμένος ορθολογισμός του «θεσμικού ανθρώπου» εκφράζεται στην αδυναμία του να επιλέξει καλύτερη επιλογήσυμπεριφορά λόγω μεγάλου αριθμού εναλλακτικών λύσεων, σύνθετου αλγόριθμου για τον προσδιορισμό της βέλτιστης εναλλακτικής, περιορισμένου χρόνου λήψης αποφάσεων κ.λπ. Ταυτόχρονα, η έννοια του περιορισμένου ορθολογισμού προϋποθέτει ότι, δεδομένων όλων των πολυπλοκοτήτων της επιλογής, ένα άτομο είναι σε θέση να επιλέξει μια αρκετά καλή εναλλακτική.

Στην προσέγγιση του παιχνιδιού στη μελέτη των θεσμών, ο περιορισμένος ορθολογισμός του ατόμου απεικονίζεται από την προσεκτική συμπεριφορά του παίκτη.

Στρατηγική προσεκτικής συμπεριφοράς- αυτή είναι η στρατηγική ενός παίκτη που του εγγυάται ένα ορισμένο ποσό κερδών ανεξάρτητα από την επιλογή (κίνηση) του άλλου παίκτη. Η προσεκτική στρατηγική ονομάζεται επίσης maximin επειδή υπολογίζεται βρίσκοντας τη μέγιστη τιμή από πολλές ελάχιστες τιμές.

Η προσεκτική στρατηγική του πρώτου παίκτη ορίζεται ως εξής. Σε κάθε σειρά του πίνακα των κερδών του, βρίσκεται το ελάχιστο στοιχείο και στη συνέχεια επιλέγεται το μέγιστο ή μέγιστο του πρώτου παίκτη από αυτά τα ελάχιστα στοιχεία. Η σειρά της μήτρας του παιχνιδιού στην οποία βρίσκεται το μέγιστο του πρώτου παίκτη αντιστοιχεί στην προσεκτική στρατηγική του. Η προσεκτική στρατηγική του δεύτερου παίκτη είναι παρόμοια. Σε κάθε στήλη του πίνακα των κερδών του, βρίσκεται το ελάχιστο στοιχείο και, στη συνέχεια, προσδιορίζεται το μέγιστο στοιχείο από αυτά τα ελάχιστα στοιχεία. Η στήλη της μήτρας του παιχνιδιού στην οποία βρίσκεται το μέγιστο του δεύτερου παίκτη αντιστοιχεί στην προσεκτική στρατηγική του. Κάθε παίκτης μπορεί να έχει πολλές προσεκτικές στρατηγικές, αλλά όλες χαρακτηρίζονται από μία αξία maximina (στρατηγική υψηλού-χαμηλού), ή εγγυημένα κέρδη. Προσεκτικές στρατηγικές υπάρχουν σε κάθε παιχνίδι matrix. Για να προσδιορίσετε την προσεκτική στρατηγική ενός παίκτη, αρκεί να αναλύσετε τον πίνακα πληρωμών του, χωρίς να χρησιμοποιήσετε τον πίνακα πληρωμών του άλλου παίκτη. Αυτό το χαρακτηριστικό είναι κοινό για την παράλογη και προσεκτική συμπεριφορά.

3) Βελτιστοποίηση συμπεριφοράς. Στην οικονομική πρακτική, συχνά προκύπτουν καταστάσεις όταν οικονομικοί παράγοντες (για παράδειγμα, ένας πωλητής και ένας τακτικός αγοραστής), κατά τη διάρκεια της μακροπρόθεσμης αλληλεπίδρασης μεταξύ τους, βρίσκουν στρατηγικές συμπεριφοράς που ταιριάζουν και στα δύο μέρη και ως εκ τούτου χρησιμοποιούνται από το « παίκτες» για μεγάλο χρονικό διάστημα. Στην προσέγγιση του παιχνιδιού στη μελέτη των θεσμών, η περιγραφόμενη κατάσταση μοντελοποιείται χρησιμοποιώντας την έννοια των στρατηγικών ισορροπίας. Ένα ζευγάρι τέτοιων στρατηγικών χαρακτηρίζεται από την ακόλουθη ιδιότητα: εάν ο πρώτος παίκτης αποκλίνει από τη στρατηγική ισορροπίας του (επιλέγει κάποια άλλη) και ο δεύτερος συνεχίζει να ακολουθεί τη στρατηγική ισορροπίας του, τότε ο πρώτος παίκτης υφίσταται ζημιά με τη μορφή μείωσης στο ποσό των κερδών. Το κελί του πίνακα του παιχνιδιού που βρίσκεται στην τομή μιας γραμμής και μιας στήλης που αντιστοιχεί σε ένα ζεύγος στρατηγικών ισορροπίας ονομάζεται σημείο ισορροπίας. Η μήτρα του παιχνιδιού μπορεί να έχει πολλά σημεία ισορροπίας ή να μην τα έχει καθόλου.

Η συμπεριφορά ενός παίκτη που ακολουθεί τη στρατηγική ισορροπίας ονομάζεται βελτιστοποίηση ( συμπεριφορά minimax ή στρατηγική minmax).

Διαφέρει από τη μεγιστοποίηση της συμπεριφοράς. Πρώτον, η ανταμοιβή ισορροπίας του παίκτη δεν είναι η μέγιστη από όλες τις πιθανές πληρωμές. Δεν αντιστοιχεί σε ένα καθολικό μέγιστο, αλλά σε ένα τοπικό βέλτιστο, επομένως, το καθολικό μέγιστο μιας συνάρτησης που ορίζεται σε ένα αριθμητικό διάστημα υπερβαίνει κάθε ένα από τα τοπικά μέγιστα. Δεύτερον, η παρακολούθηση της στρατηγικής ισορροπίας από έναν παίκτη συνεπάγεται την επίτευξη ενός τοπικού μέγιστου μόνο εάν ο άλλος παίκτης διατηρεί τη στρατηγική ισορροπίας. Εάν ο δεύτερος παίκτης αποκλίνει από τη στρατηγική ισορροπίας, τότε η συνεχής χρήση της στρατηγικής ισορροπίας από τον πρώτο παίκτη δεν θα του δώσει ένα μεγιστοποιητικό αποτέλεσμα.

Οι στρατηγικές ισορροπίας καθορίζονται από τον ακόλουθο κανόνα: ένα κελί του πίνακα του παιχνιδιού θεωρείται ισορροπημένο εάν η αντίστοιχη απόδοση του πρώτου παίκτη είναι η μέγιστη στη στήλη και η αντίστοιχη απόδοση του δεύτερου παίκτη είναι η μέγιστη στη σειρά. Έτσι, ο αλγόριθμος για την εύρεση στρατηγικών ισορροπίας χρησιμοποιεί τους πίνακες αποπληρωμής και των δύο παικτών, και όχι ενός από αυτούς, όπως στις περιπτώσεις της παράλογης και προσεκτικής συμπεριφοράς.

4) Αποκλίνουσα συμπεριφορά. Η θεσμοθέτηση μιας στρατηγικής ισορροπίας ως βασικού κανόνα συμπεριφοράς προκύπτει ως αποτέλεσμα της γενίκευσης της εμπειρίας ενός ατόμου από τις διαπροσωπικές του αλληλεπιδράσεις, συμπεριλαμβανομένης της εμπειρίας αποκλίνουσας συμπεριφοράς. Ανθρώπινη συνείδηση αρνητικές επιπτώσειςΜια τέτοια συμπεριφορά, βασισμένη στην επιλογή εναλλακτικών λύσεων μη ισορροπίας, είναι το αποφασιστικό επιχείρημα για την επιλογή μιας στρατηγικής βελτιστοποίησης συμπεριφοράς. Έτσι, η αποκλίνουσα συμπεριφορά χρησιμεύει ως αναπόσπαστο συστατικό της εμπειρίας ζωής ενός «θεσμικού ατόμου», χρησιμεύοντας ως εμπειρική αιτιολόγηση για τη βελτιστοποίηση της συμπεριφοράς. Η εμπειρία της αποκλίνουσας συμπεριφοράς δίνει σε ένα άτομο τη σιγουριά ότι ο άλλος συμμετέχων στο παιχνίδι θα τηρήσει πάντα τη στρατηγική ισορροπίας. Έτσι, μια τέτοια εμπειρία χρησιμεύει ως απόδειξη του ορθολογισμού της συμπεριφοράς του άλλου παίκτη και της προβλεψιμότητας των μελλοντικών αλληλεπιδράσεων μαζί του.

5) Καινοτόμος συμπεριφορά. Παραπάνω εξετάστηκε η αποκλίνουσα συμπεριφορά, ο κύριος σκοπός της οποίας είναι η εμπειρική τεκμηρίωση και εμπέδωση της αρχικής στρατηγικής ισορροπίας. Ωστόσο, ο σκοπός της απόκλισης από τη στρατηγική ισορροπίας μπορεί να είναι θεμελιωδώς διαφορετικός. Η καινοτόμος συμπεριφορά είναι μια συστηματική απόκλιση από τη συνήθη στρατηγική ισορροπίας προκειμένου να βρεθεί μια άλλη κατάσταση ισορροπίας που είναι πιο κερδοφόρα για τον καινοτόμο.

Στο πλαίσιο του μοντέλου παιχνιδιού των διαανθρωπίνων αλληλεπιδράσεων, ο στόχος της καινοτόμου συμπεριφοράς μπορεί να επιτευχθεί εάν η μήτρα του παιχνιδιού έχει διαφορετικό σημείο ισορροπίας, στο οποίο η ανταμοιβή του καινοτόμου παίκτη είναι μεγαλύτερη από ό,τι στην αρχική κατάσταση ισορροπίας. Εάν δεν υπάρχει τέτοιο σημείο, τότε η καινοτόμος συμπεριφορά θα είναι πιθανότατα καταδικασμένη σε αποτυχία και ο καινοτόμος θα επιστρέψει στην αρχική στρατηγική ισορροπίας. Επιπλέον, οι απώλειές του από το πείραμα καινοτομίας θα είναι ίσες με τη συνολική επίδραση της απόκλισης για ολόκληρη την περίοδο του πειράματος.

Στην πραγματική ζωή, τα άτομα που αλληλεπιδρούν συχνά συμφωνούν να ακολουθήσουν ορισμένες στρατηγικές συμπεριφοράς στο μέλλον. Σε αυτή την περίπτωση καλείται η συμπεριφορά των παικτών αλληλέγγυα.

Οι κύριοι λόγοι συμπεριφοράς αλληλεγγύης:

α) το όφελος της συμπεριφοράς αλληλεγγύης και για τους δύο παίκτες. Στο πλαίσιο του μοντέλου αλληλεπίδρασης παιχνιδιού, αυτή η κατάσταση απεικονίζεται από έναν πίνακα παιχνιδιού, σε ένα κελί του οποίου οι αποδόσεις και των δύο παικτών είναι μέγιστες, αλλά ταυτόχρονα δεν είναι ισορροπία και δεν αντιστοιχεί σε ένα ζευγάρι προσεκτικών στρατηγικές των παικτών. Οι στρατηγικές που αντιστοιχούν σε αυτό το κελί είναι απίθανο να επιλεγούν από παίκτες που εφαρμόζουν μοντέλα συμπεριφοράς μη αλληλεγγύης. Αλλά εάν οι παίκτες καταλήξουν σε συμφωνία σχετικά με την επιλογή των κατάλληλων στρατηγικών αλληλεγγύης, τότε στη συνέχεια θα είναι ασύμφορο για αυτούς να παραβιάσουν τη συμφωνία και θα πραγματοποιηθεί αυτόματα.

β) η ηθική της συμπεριφοράς αλληλεγγύης συχνά χρησιμεύει ως «εσωτερικός» μηχανισμός για τη διασφάλιση της συμμόρφωσης με τη συμφωνία. Το ηθικό κόστος με τη μορφή κοινωνικής καταδίκης που θα επιβαρυνθεί ένα άτομο εάν παραβιάσει μια συμφωνία μπορεί να έχει αντίκτυπο σε αυτό υψηλότερη τιμήαπό την αύξηση των κερδών που επιτεύχθηκαν. Ο ηθικός παράγοντας παίζει σημαντικό ρόλο στη συμπεριφορά του «θεσμικού ανθρώπου», αλλά στην πραγματικότητα δεν λαμβάνεται υπόψη στο μοντέλο παιχνιδιού των διαανθρωπίνων αλληλεπιδράσεων.

γ) η επιβολή της συμπεριφοράς αλληλεγγύης χρησιμεύει ως «εξωτερικός» μηχανισμός για τη διασφάλιση της συμμόρφωσης με τη συμφωνία. Αυτός ο παράγονταςΗ θεσμική συμπεριφορά δεν αντικατοπτρίζεται επίσης επαρκώς στο μοντέλο παιχνιδιού των αλληλεπιδράσεων.

Τύποι ισορροπίας: Ισορροπία Nash, Ισορροπία Steckelberg, Βέλτιστη ισορροπία Pareto, ισορροπία κυρίαρχων στρατηγικών.

Σε κάθε αλληλεπίδραση μπορεί να υπάρχει διαφορετικά είδηισορροπίες: ισορροπία κυρίαρχων στρατηγικών, ισορροπία Nash, ισορροπία Stackelberg και ισορροπία Pareto. Μια κυρίαρχη στρατηγική είναι ένα σχέδιο δράσης που παρέχει σε έναν συμμετέχοντα τη μέγιστη χρησιμότητα ανεξάρτητα από τις ενέργειες του άλλου συμμετέχοντα. Αντίστοιχα, η ισορροπία των κυρίαρχων στρατηγικών θα είναι η τομή των κυρίαρχων στρατηγικών και των δύο συμμετεχόντων στο παιχνίδι. Η ισορροπία Nash είναι μια κατάσταση στην οποία η στρατηγική κάθε παίκτη είναι η καλύτερη απάντηση στις ενέργειες του άλλου παίκτη. Με άλλα λόγια, αυτή η ισορροπία παρέχει στον παίκτη τη μέγιστη χρησιμότητα ανάλογα με τις ενέργειες του άλλου παίκτη. Η ισορροπία Stackelberg συμβαίνει όταν υπάρχει μια χρονική καθυστέρηση στη λήψη αποφάσεων των συμμετεχόντων στο παιχνίδι: ένας από αυτούς παίρνει αποφάσεις γνωρίζοντας ήδη τι έκανε ο άλλος. Έτσι, η ισορροπία Stackelberg αντιστοιχεί στη μέγιστη χρησιμότητα των παικτών σε συνθήκες μη ταυτόχρονης λήψης αποφάσεων από αυτούς. Σε αντίθεση με την ισορροπία των κυρίαρχων στρατηγικών και την ισορροπία Nash, αυτός ο τύπος ισορροπίας υπάρχει πάντα. Τέλος, η ισορροπία Pareto υπάρχει υπό την προϋπόθεση ότι είναι αδύνατο να αυξηθεί η χρησιμότητα και των δύο παικτών ταυτόχρονα. Ας εξετάσουμε ένα παράδειγμα της τεχνολογίας για την αναζήτηση ισορροπιών και των τεσσάρων τύπων.

Κυρίαρχη στρατηγική- ένα σχέδιο δράσης που παρέχει στον συμμετέχοντα τη μέγιστη χρησιμότητα, ανεξάρτητα από τις ενέργειες του άλλου συμμετέχοντα.

Ισορροπία Nash- μια κατάσταση στην οποία κανένας από τους παίκτες δεν μπορεί να αυξήσει τα κέρδη του μονομερώς αλλάζοντας το σχέδιο δράσης του.

Ισορροπία Stackelberg- μια κατάσταση όπου κανένας από τους παίκτες δεν μπορεί να αυξήσει τα κέρδη του μονομερώς και οι αποφάσεις λαμβάνονται πρώτα από έναν παίκτη και γίνονται γνωστές στον δεύτερο παίκτη.

Ισορροπία Pareto- μια κατάσταση όπου είναι αδύνατο να βελτιωθεί η θέση κάποιου από τους παίκτες χωρίς να επιδεινωθεί η θέση του άλλου και χωρίς να μειωθούν τα συνολικά κέρδη των παικτών.

Ας επιδιώξει η εταιρεία Α να σπάσει το μονοπώλιο της εταιρείας Β στην παραγωγή ενός συγκεκριμένου προϊόντος. Η επιχείρηση Α αποφασίζει εάν πρέπει να εισέλθει στην αγορά και η εταιρεία Β αποφασίζει εάν θα πρέπει να μειώσει την παραγωγή εάν ο Α αποφασίσει να εισέλθει. Στην περίπτωση σταθερής παραγωγής στην επιχείρηση Β, και οι δύο εταιρείες είναι χαμένες, αλλά εάν η επιχείρηση Β αποφασίσει να μειώσει την παραγωγή, τότε «μοιράζεται» τα κέρδη της με την Α.

Ισορροπία κυρίαρχων στρατηγικών. Η εταιρεία Α συγκρίνει την απόδοσή της και στα δύο σενάρια (-3 και O εάν ο Β αποφασίσει να ξεκινήσει έναν πόλεμο τιμών) και (4 και 0 εάν ο Β αποφασίσει να μειώσει την παραγωγή). Δεν έχει στρατηγική που να εξασφαλίζει μέγιστο κέρδος ανεξάρτητα από τις ενέργειες του Β: 0 > -3 => «μη εισέλθετε στην αγορά» εάν ο Β αφήσει την παραγωγή στο ίδιο επίπεδο, 4 > 0 => «εισέλθετε» εάν ο Β μειώσει την παραγωγή (βλ. .συμπαγή βέλη). Αν και η εταιρεία Α δεν έχει κυρίαρχη στρατηγική, η εταιρεία Β έχει. Ενδιαφέρεται να μειώσει την παραγωγή ανεξάρτητα από τις ενέργειες του Α (4 > -2, 10 = 10, βλ. διακεκομμένα βέλη). Κατά συνέπεια, δεν υπάρχει ισορροπία κυρίαρχων στρατηγικών.

Ισορροπία Nash.Η καλύτερη απάντηση της επιχείρησης Α στην απόφαση της επιχείρησης Β να αφήσει την ίδια παραγωγή είναι να μην εισέλθει, και στην απόφαση να μειώσει την παραγωγή είναι να εισέλθει. Η καλύτερη απάντηση της εταιρείας Β στην απόφαση της εταιρείας Α να εισέλθει στην αγορά είναι να μειώσει την παραγωγή όταν αποφασίζει να μην εισέλθει, και οι δύο στρατηγικές είναι ισοδύναμες. Επομένως, δύο ισορροπίες Nash (A, A2) βρίσκονται στα σημεία (4, 4) και (0, 10) - το A εισέρχεται και το B μειώνει την έξοδο, ή το A δεν εισέρχεται και το B δεν μειώνει την έξοδο. Είναι αρκετά εύκολο να το επαληθεύσετε, αφού σε αυτά τα σημεία κανένας από τους συμμετέχοντες δεν ενδιαφέρεται να αλλάξει τη στρατηγική του.

Ισορροπία Stackelberg.Ας υποθέσουμε ότι η εταιρεία Α λαμβάνει την πρώτη απόφαση, εάν επιλέξει να εισέλθει στην αγορά, τελικά θα καταλήξει στο σημείο (4, 4): η επιλογή της εταιρείας Β είναι σαφής σε αυτήν την περίπτωση, 4 > -2. Εάν αποφασίσει να μην εισέλθει στην αγορά, τότε το αποτέλεσμα θα είναι δύο βαθμοί (0, 10): Οι προτιμήσεις της εταιρείας Β επιτρέπουν και τις δύο επιλογές. Γνωρίζοντας αυτό, η εταιρεία Α μεγιστοποιεί την απόδοσή της στα σημεία (4, 4) και (0, 10), συγκρίνοντας τα 4 και 0. Οι προτιμήσεις είναι σαφείς και το πρώτο Stackelberg ισορροπίας Stackelberg θα είναι στο σημείο (4, 4). Ομοίως, η ισορροπία Stackelberg StB, όταν η επιχείρηση Β αποφασίσει πρώτη, θα βρίσκεται στο σημείο (0, 10).

Ισορροπία Pareto.Για να προσδιορίσουμε το βέλτιστο Pareto, πρέπει να δοκιμάσουμε διαδοχικά και τα τέσσερα αποτελέσματα του παιχνιδιού, απαντώντας στην ερώτηση: «Η μετάβαση σε οποιοδήποτε άλλο αποτέλεσμα του παιχνιδιού παρέχει αύξηση της χρησιμότητας ταυτόχρονα και για τους δύο συμμετέχοντες;» Για παράδειγμα, από το αποτέλεσμα (-3, -2) μπορούμε να προχωρήσουμε σε οποιοδήποτε άλλο αποτέλεσμα, πληρώντας την καθορισμένη συνθήκη. Μόνο από το αποτέλεσμα (4, 4) δεν μπορούμε να προχωρήσουμε περαιτέρω χωρίς να μειώσουμε τη χρησιμότητα κανενός από τους παίκτες, αυτή θα είναι η ισορροπία Pareto, R.

Σε ένα ανταγωνιστικό παιχνίδι, είναι φυσικό να θεωρούμε ότι το βέλτιστο αποτέλεσμα είναι αυτό στο οποίο είναι ασύμφορο για κάθε παίκτη να παρεκκλίνει από αυτό. Ένα τέτοιο αποτέλεσμα (x*,y*) ονομάζεται κατάσταση ισορροπίας και η αρχή της βελτιστοποίησης, που βασίζεται στην εύρεση μιας κατάστασης ισορροπίας, ονομάζεται αρχή ισορροπίας.

Ορισμός. Σε ένα παιχνίδι μήτρας με μήτρα διαστάσεων, το αποτέλεσμα είναι κατάσταση ισορροπίαςή ένα σημείο σέλας αν

Σε ένα σημείο σέλας, ένα στοιχείο μήτρας είναι και ελάχιστο στη σειρά του και μέγιστο στη στήλη του. Στο παιχνίδι από το παράδειγμα 2 στοιχείο ένα 33είναι ένα σημείο σέλας. Οι βέλτιστες στρατηγικές σε αυτό το παιχνίδι είναι οι τρίτες και για τους δύο παίκτες. Εάν ο πρώτος παίκτης παρεκκλίνει από την τρίτη στρατηγική, τότε αρχίζει να κερδίζει λιγότερο από ένα 33. Εάν ο δεύτερος παίκτης παρεκκλίνει από την τρίτη στρατηγική, τότε αρχίζει να χάνει περισσότερα από ένα 33. Έτσι, δεν υπάρχει τίποτα καλύτερο και για τους δύο παίκτες από το να ακολουθούν με συνέπεια την τρίτη στρατηγική.

Αρχή της βέλτιστης συμπεριφοράς: εάν υπάρχει ένα σημείο σέλας σε ένα παιχνίδι matrix, τότε η βέλτιστη επιλογή είναι η στρατηγική που αντιστοιχεί στο σημείο σέλας. Τι συμβαίνει εάν υπάρχουν περισσότερα από ένα σημεία σέλας στο παιχνίδι;

Θεώρημα. Αφήνω δύο αυθαίρετα σημεία σέλας σε ένα παιχνίδι matrix. Επειτα:

Απόδειξη. Από τον ορισμό μιας κατάστασης ισορροπίας έχουμε:

Ας αντικαταστήσουμε το , στην αριστερή πλευρά της ανισότητας (2.8) και στη δεξιά πλευρά, , στην αριστερή πλευρά της ανισότητας (2.9) και στη δεξιά πλευρά, . Τότε παίρνουμε:

Αυτό συνεπάγεται την ισότητα:

Από το θεώρημα προκύπτει ότι η συνάρτηση αποπληρωμής έχει την ίδια τιμή σε όλες τις καταστάσεις ισορροπίας. Γι' αυτό λέγεται ο αριθμός στο κόστος του παιχνιδιού. Και οι στρατηγικές που αντιστοιχούν σε οποιοδήποτε από τα σημεία σέλας καλούνται βέλτιστες στρατηγικέςπαίκτες 1 και 2, αντίστοιχα. Δυνάμει του (2.7), όλες οι βέλτιστες στρατηγικές του παίκτη είναι εναλλάξιμες.

Η βέλτιστη συμπεριφορά των παικτών δεν θα αλλάξει εάν το σύνολο των στρατηγικών στο παιχνίδι παραμείνει το ίδιο και η συνάρτηση πληρωμής πολλαπλασιαστεί με μια θετική σταθερά (ή προστεθεί ένας σταθερός αριθμός σε αυτό).

Θεώρημα. Για την ύπαρξη ενός σημείου σέλας (i*,j*) σε ένα παιχνίδι μήτρας, είναι απαραίτητο και αρκετό το μέγιστο να είναι ίσο με το minimax:

(2.10)

Απόδειξη. Ανάγκη.Εάν το (i*,j*) είναι σημείο σέλας, τότε, σύμφωνα με το (2.6):

(2.11)

Παράλληλα έχουμε:

(2.12)

Από τις (2.11) και (2.12) παίρνουμε:

(2.13)

Συλλογιζόμενοι ομοίως, φτάνουμε στις ισότητες:

Ετσι,

Από την άλλη πλευρά, η αντίστροφη ανισότητα (2,5) ισχύει πάντα, άρα η (2,10) αποδεικνύεται έγκυρη.

Επάρκεια. Ας είναι αληθές το (2.10). Ας αποδείξουμε την ύπαρξη ενός σημείου σέλας. Εχουμε:

Σύμφωνα με την ισότητα (2.10), οι ανισότητες (2.15) και (2.16) μετατρέπονται σε ισότητες. Τότε έχουμε:

Το θεώρημα έχει αποδειχθεί. Στην πορεία αποδείχθηκε ότι γενική σημασίαΤο maximin και το minimax είναι ίσα με την τιμή του παιχνιδιού.

Μικτή επέκταση παιχνιδιών

Θεωρήστε ένα παιχνίδι μήτρας G. Αν υπάρχει μια κατάσταση ισορροπίας σε αυτό, τότε το ελάχιστο είναι ίσο με το μέγιστο. Επιπλέον, κάθε παίκτης μπορεί να παρέχει στον άλλο παίκτη πληροφορίες σχετικά με τη βέλτιστη στρατηγική του. Ο αντίπαλός του δεν θα μπορέσει να αποκομίσει κανένα πρόσθετο όφελος από αυτές τις πληροφορίες. Τώρα ας υποθέσουμε ότι δεν υπάρχει κατάσταση ισορροπίας στο παιχνίδι G. Επειτα:

Σε αυτήν την περίπτωση, οι στρατηγικές minimax και maximin δεν είναι σταθερές. Οι παίκτες μπορεί να έχουν κίνητρα να αποκλίνουν από τις προσεκτικές στρατηγικές τους λόγω της πιθανότητας να κερδίσουν περισσότερα κέρδη, αλλά και με τον κίνδυνο να χάσεις, δηλαδή να πάρεις μικρότερη νίκη από ό,τι όταν χρησιμοποιείς μια προσεκτική στρατηγική. Όταν χρησιμοποιείτε ριψοκίνδυνες στρατηγικές, η μετάδοση πληροφοριών σχετικά με αυτές στον εχθρό έχει επιζήμιες συνέπειες: ο παίκτης λαμβάνει αυτόματα μικρότερη απόδοση από ό,τι όταν χρησιμοποιεί μια προσεκτική στρατηγική.

Παράδειγμα 3. Ας έχει η μήτρα του παιχνιδιού τη μορφή:

Για έναν τέτοιο πίνακα, δηλ. δεν υπάρχει κατάσταση ισορροπίας. Οι προσεκτικές στρατηγικές των παικτών είναι i*=1, j*=2. Αφήστε τον παίκτη 2 να ακολουθήσει τη στρατηγική j*=2 και ο παίκτης 1 να επιλέξει τη στρατηγική i=2. τότε ο τελευταίος θα λάβει αποπληρωμή 3, που είναι δύο μονάδες περισσότερο από το μέγιστο. Εάν, ωστόσο, ο παίκτης 2 μαντέψει για τα σχέδια του παίκτη 1, θα αλλάξει τη στρατηγική του σε j=1 και τότε ο πρώτος θα λάβει μια πληρωμή 0, δηλαδή μικρότερη από το μέγιστο. Παρόμοιος συλλογισμός μπορεί να γίνει και για τον δεύτερο παίκτη. Σε γενικές γραμμές, μπορούμε να συμπεράνουμε ότι η χρήση μιας περιπετειώδους στρατηγικής μπορεί να φέρει αποτέλεσμα μεγαλύτερο από το εγγυημένο σε ένα ξεχωριστό παιχνίδι, αλλά η χρήση της συνδέεται με ρίσκο. Τίθεται το ερώτημα, είναι δυνατόν να συνδυάσετε μια αξιόπιστη προσεκτική στρατηγική με μια περιπετειώδη με τέτοιο τρόπο ώστε να αυξήσετε τον μέσο όρο των κερδών σας; Ουσιαστικά, το ερώτημα είναι πώς θα μοιραστούν τα κέρδη μεταξύ των παικτών (2.17);

Αποδεικνύεται ότι μια λογική λύση είναι να χρησιμοποιήσετε μια μικτή στρατηγική, δηλαδή μια τυχαία επιλογή καθαρών στρατηγικών. Ας το θυμηθούμε Η στρατηγική του παίκτη 1 ονομάζεται μικτή, αν επιλέξει την i-η σειρά με ορισμένη πιθανότητα p i .Αυτή η στρατηγική μπορεί να ταυτιστεί με την κατανομή πιθανοτήτων σε πολλές γραμμές. Ας υποθέσουμε ότι ο πρώτος παίκτης έχει m καθαρές στρατηγικές και ο δεύτερος παίκτης έχει n καθαρές στρατηγικές. Τότε οι μικτές στρατηγικές τους είναι πιθανολογικά διανύσματα:

(2.18)

Εξετάστε δύο πιθανές μικτές στρατηγικές για τον πρώτο παίκτη από το Παράδειγμα 3: . Αυτές οι στρατηγικές διαφέρουν στις κατανομές πιθανοτήτων μεταξύ καθαρών στρατηγικών. Εάν στην πρώτη περίπτωση οι σειρές του πίνακα επιλέγονται από τον παίκτη με ίσες πιθανότητες, τότε στη δεύτερη περίπτωση - με διαφορετικές. Όταν μιλάμε για μικτή στρατηγική, εννοούμε τυχαία επιλογήόχι μια «τυχαία» επιλογή, αλλά μια επιλογή που βασίζεται στη λειτουργία ενός τυχαίου μηχανισμού που παρέχει την κατανομή πιθανοτήτων που χρειαζόμαστε. Έτσι, η ρίψη ενός νομίσματος είναι κατάλληλη για την εφαρμογή της πρώτης από τις μικτές στρατηγικές. Ο παίκτης επιλέγει την πρώτη γραμμή ή τη δεύτερη, ανάλογα με το πώς προσγειώνεται το κέρμα. Κατά μέσο όρο, ένας παίκτης θα επιλέγει τόσο την πρώτη γραμμή όσο και τη δεύτερη εξίσου συχνά, αλλά η επιλογή σε μια συγκεκριμένη επανάληψη του παιχνιδιού δεν υπόκειται σε κανένα σταθερό κανόνα και έχει τον μέγιστο βαθμό μυστικότητας: μέχρι την εφαρμογή του τυχαίου μηχανισμού, είναι άγνωστο ακόμη και στον πρώτο παίκτη. Ο μηχανισμός της κλήρωσης είναι κατάλληλος για την εφαρμογή της δεύτερης μικτής στρατηγικής. Ο παίκτης παίρνει επτά πανομοιότυπα κομμάτια χαρτιού, σημειώνοντας τρία από αυτά με σταυρό και τα πετάει στο καπέλο. Στη συνέχεια, τυχαία, βγάζει ένα από αυτά. Σύμφωνα με την κλασική θεωρία πιθανοτήτων, θα βγάλει ένα κομμάτι χαρτί με σταυρό με πιθανότητα 3/7 και ένα κενό κομμάτι χαρτί με πιθανότητα 4/7. Ένας τέτοιος μηχανισμός σχεδίασης είναι ικανός να εφαρμόσει οποιεσδήποτε ορθολογικές πιθανότητες.

Αφήστε τους παίκτες να ακολουθήσουν μικτές στρατηγικές (2.18). Τότε η πληρωμή του πρώτου παίκτη σε μια συγκεκριμένη επανάληψη του παιχνιδιού είναι μια τυχαία μεταβλητή: v(X,Y). Εφόσον οι παίκτες επιλέγουν στρατηγικές ανεξάρτητα ο ένας από τον άλλον, τότε, σύμφωνα με το θεώρημα του πολλαπλασιασμού των πιθανοτήτων, η πιθανότητα επιλογής του αποτελέσματος (i, j) με νίκη είναι ίση με το γινόμενο των πιθανοτήτων. Στη συνέχεια ο νόμος κατανομής της τυχαίας μεταβλητής v(X,Y)δίνεται από τον παρακάτω πίνακα

Τώρα αφήστε το παιχνίδι να παίζεται επ' αόριστον. Τότε η μέση απόδοση σε ένα τέτοιο παιχνίδι είναι ίση με τη μαθηματική προσδοκία της αξίας v(X,Y).

(2.19)

Στο τέλος, αλλά αρκετά μεγάλος αριθμόςεπαναλήψεις του παιχνιδιού, η μέση απόδοση θα διαφέρει ελαφρώς από την τιμή (2,19).

Παράδειγμα 4. Υπολογίστε τη μέση απόδοση (2,19) για το παιχνίδι από το παράδειγμα 3, όταν οι παίκτες χρησιμοποιούν τις ακόλουθες στρατηγικές: . Ο πίνακας πληρωμών και ο πίνακας πιθανοτήτων μοιάζουν με αυτό:

Ας βρούμε τον μέσο όρο:

Έτσι, η μέση απόδοση (2,20) είναι ενδιάμεση μεταξύ maximin και minimax.

Εφόσον για οποιοδήποτε ζεύγος μικτών στρατηγικών X και Y μπορεί να υπολογιστεί η μέση τιμή του παιχνιδιού, προκύπτει το πρόβλημα της εύρεσης της βέλτιστης στρατηγικής. Είναι φυσικό να ξεκινήσετε εξερευνώντας προσεκτικές στρατηγικές. Η προσεκτική στρατηγική του πρώτου παίκτη του παρέχει ένα μέγιστο. Η προσεκτική στρατηγική του δεύτερου παίκτη δεν επιτρέπει στον πρώτο να κερδίσει περισσότερα από τα minimax. Το πιο σημαντικό αποτέλεσμα στη θεωρία των παιχνιδιών με αντίθετα συμφέροντα είναι το εξής:

Θεώρημα. Κάθε παιχνίδι μήτρας έχει μια κατάσταση ισορροπίας σε μικτές στρατηγικές. Η απόδειξη αυτού του θεωρήματος δεν είναι εύκολη. Παραλείπεται σε αυτό το μάθημα.

Συνέπειες: Η ύπαρξη μιας κατάστασης ισορροπίας σημαίνει ότι το maximin είναι ίσο με το minimax, και επομένως κάθε παιχνίδι μήτρας έχει μια τιμή. Η βέλτιστη στρατηγική για τον πρώτο παίκτη είναι η στρατηγική μεγιστοποίησης. Η βέλτιστη στρατηγική για το δεύτερο είναι το minimax. Εφόσον το πρόβλημα της εύρεσης βέλτιστων στρατηγικών έχει λυθεί, λέμε ότι οποιοδήποτε παιχνίδι matrix διαλυτόςσε μια ποικιλία μικτών στρατηγικών.

Λύση στο παιχνίδι 2x2

Παράδειγμα 5. Λύστε το παιχνίδι. Δεν είναι δύσκολο να επαληθεύσετε ότι δεν υπάρχει σημείο σέλας. Ας υποδηλώσουμε τη βέλτιστη στρατηγική του πρώτου παίκτη (x, 1-x)είναι διάνυσμα στήλης, αλλά για ευκολία το γράφουμε ως συμβολοσειρά. Ας υποδηλώσουμε τη βέλτιστη στρατηγική του δεύτερου παίκτη (ε, 1-ε).

Η πληρωμή του πρώτου παίκτη είναι μια τυχαία μεταβλητή με την ακόλουθη κατανομή:

v(x,y)	2	-1	-4	7
Π	xy	x(1-y)	(1-x)y	(1-x)(1-ε)

Βρίσκουμε τη μέση απόδοση ανά επανάληψη του πρώτου παίκτη - τη μαθηματική προσδοκία μιας τυχαίας μεταβλητής v(x,y):

Ας μετατρέψουμε αυτήν την έκφραση:

Αυτή η μαθηματική προσδοκία αποτελείται από ένα σταθερό (5/7) και ένα μεταβλητό μέρος: 14(x-11/14)(y-8/14). Εάν η τιμή yδιαφορετικό από το 8/14, τότε ο πρώτος παίκτης μπορεί πάντα να επιλέξει Χμε τέτοιο τρόπο ώστε να κάνετε το μεταβλητό μέρος θετικό, αυξάνοντας τα κέρδη σας. Εάν η τιμή Χδιαφορετικό από 14/11, τότε ο δεύτερος παίκτης μπορεί πάντα να επιλέξει yμε τέτοιο τρόπο ώστε να κάνει το μεταβλητό μέρος αρνητικό, μειώνοντας την απόδοση του πρώτου παίκτη. Έτσι, το σημείο σέλας καθορίζεται από τις ισότητες: x*=11/14, y*=8/14.

2.5 Επίλυση παιχνιδιών

Θα δείξουμε πώς να λύνουμε τέτοια παιχνίδια χρησιμοποιώντας ένα παράδειγμα.

Παράδειγμα 6. Λύστε το παιχνίδι . Φροντίζουμε να μην υπάρχει σημείο σέλας. Ας υποδηλώσουμε τη μικτή στρατηγική του πρώτου παίκτη X=(x, 1-x)είναι διάνυσμα στήλης, αλλά για ευκολία το γράφουμε ως συμβολοσειρά.

Αφήστε τον πρώτο παίκτη να χρησιμοποιήσει τη στρατηγική Χ και ο δεύτερος παίκτης τη δική του ι-ου καθαρόστρατηγική. Ας υποδηλώσουμε τη μέση απόδοση του πρώτου παίκτη σε αυτήν την κατάσταση ως . Εχουμε:

Ας απεικονίσουμε τα γραφήματα των συναρτήσεων (2.21) στο τμήμα .

Η τεταγμένη ενός σημείου που βρίσκεται σε οποιοδήποτε ευθύγραμμο τμήμα αντιστοιχεί στα κέρδη του πρώτου παίκτη σε μια κατάσταση όπου χρησιμοποιεί μια μικτή στρατηγική (x,(1-x)), και ο δεύτερος παίκτης – η αντίστοιχη καθαρή στρατηγική. Το εγγυημένο αποτέλεσμα του πρώτου παίκτη είναι ο κάτω φάκελος της οικογένειας των ευθειών (σπασμένα ABC). Το ΨΗΛΟΤΕΡΟ ΣΗΜΕΙΟαυτή η διακεκομμένη γραμμή (σημείο Β) είναι το μέγιστο εγγυημένο αποτέλεσμα του παίκτη 1. Η τετμημένη του σημείου Β αντιστοιχεί στη βέλτιστη στρατηγική του πρώτου παίκτη.

Δεδομένου ότι το επιθυμητό σημείο Β είναι η τομή των ευθειών και , η τετμημένη του μπορεί να βρεθεί ως λύση στην εξίσωση:

Έτσι, η βέλτιστη μικτή στρατηγική του πρώτου παίκτη είναι (5/9, 4/9). Η τεταγμένη του σημείου Β είναι το κόστος του παιχνιδιού. Είναι ίσο με:

(2.22)

Σημειώστε ότι η γραμμή που αντιστοιχεί στη δεύτερη στρατηγική του δεύτερου παίκτη περνά πάνω από το σημείο Β. Αυτό σημαίνει ότι εάν ο πρώτος παίκτης χρησιμοποιήσει τη βέλτιστη στρατηγική του και ο παίκτης 2 τη δεύτερη, τότε η απώλεια του δεύτερου αυξάνεται σε σύγκριση με τη χρήση στρατηγικών 1 ή 3. Έτσι, το δεύτερο η στρατηγική δεν πρέπει να συμμετέχει στη βέλτιστη στρατηγική του δεύτερου παίκτη. Η βέλτιστη στρατηγική του παίκτη 2 θα πρέπει να μοιάζει με: . Οι καθαρές στρατηγικές 1 και 3 του δεύτερου παίκτη, οι οποίες έχουν μη μηδενικά στοιχεία στη βέλτιστη στρατηγική, συνήθως ονομάζονται σημαντικός. Η στρατηγική 2 ονομάζεται ασήμαντος. Από το παραπάνω σχήμα, καθώς και από την ισότητα (2.22), είναι σαφές ότι όταν ο πρώτος παίκτης χρησιμοποιεί τη βέλτιστη στρατηγική του, η απόδοση του δεύτερου παίκτη δεν εξαρτάται από τις βασικές στρατηγικές που χρησιμοποιεί. Μπορεί επίσης να εφαρμόσει οποιαδήποτε μικτή στρατηγική που αποτελείται από σημαντικές (ιδίως, τη βέλτιστη) και τα κέρδη σε αυτή την περίπτωση δεν θα αλλάξουν. Μια εντελώς παρόμοια δήλωση ισχύει για την αντίθετη περίπτωση. Εάν ο δεύτερος παίκτης χρησιμοποιεί τη βέλτιστη στρατηγική του, τότε η ανταμοιβή του πρώτου παίκτη δεν εξαρτάται από τις βασικές του στρατηγικές που χρησιμοποιεί και είναι ίση με το κόστος του παιχνιδιού.