l'économie

Équilibre de Nash. Théorie des jeux pour les économistes (John Nash)

Table des matières:

Équilibre de Nash. Théorie des jeux pour les économistes (John Nash)
Équilibre de Nash. Théorie des jeux pour les économistes (John Nash)

Vidéo: LA THEORIE DES JEUX (Nash,Pareto,etc...) 2024, Juillet

Vidéo: LA THEORIE DES JEUX (Nash,Pareto,etc...) 2024, Juillet
Anonim

Dans les années 1930, John von Neumann et Oscar Morgenstern sont devenus les fondateurs d'un nouveau domaine intéressant des mathématiques, appelé "théorie des jeux". Dans les années 1950, le jeune mathématicien John Nash s'est intéressé à ce domaine. La théorie de l'équilibre est devenue le sujet de sa thèse, qu'il a écrite à 21 ans. Ainsi est née une nouvelle stratégie pour les jeux appelée Nash Equilibrium, qui a remporté le prix Nobel de nombreuses années plus tard, en 1994.

Image

Le long écart entre la rédaction d'une thèse et l'acceptation universelle a été un test pour le mathématicien. Un génie sans reconnaissance a entraîné de graves violations mentales, mais John Nash a pu résoudre ce problème grâce à son excellent esprit logique. Sa théorie de "l'équilibre de Nash" a reçu le prix Nobel, et son adaptation cinématographique dans le film "Beautiful mind" ("Mind Games").

Théorie des jeux en bref

Puisque la théorie de l'équilibre de Nash explique le comportement des gens en termes d'interaction, il convient donc de considérer les concepts de base de la théorie des jeux.

La théorie des jeux étudie le comportement des participants (agents) dans des conditions d'interaction les uns avec les autres selon le type de jeu, lorsque le résultat dépend de la décision et du comportement de plusieurs personnes. Le participant prend des décisions, guidé par ses prévisions concernant le comportement des autres, ce qu'on appelle la stratégie de jeu.

Il existe également une stratégie dominante dans laquelle le participant obtient le résultat optimal pour tout comportement des autres participants. Il s'agit de la meilleure stratégie gagnant-gagnant du joueur.

Dilemme du prisonnier et percée scientifique

Le dilemme du prisonnier est un cas avec un jeu où les participants sont obligés de prendre des décisions rationnelles, atteignant un objectif commun dans le contexte d'un conflit d'alternatives. La question est de savoir laquelle de ces options il choisira, compte tenu de son intérêt personnel et commun, ainsi que de son incapacité à obtenir les deux. Les joueurs semblent enfermés dans des conditions de jeu difficiles, ce qui les fait parfois réfléchir de manière très productive.

Image

Ce dilemme a été exploré par le mathématicien américain John Nash. L'équilibre qu'il dégagea devint révolutionnaire en son genre. Particulièrement vivante, cette nouvelle pensée a influencé l'opinion des économistes sur la façon dont les acteurs du marché font des choix, en tenant compte des intérêts des autres, avec une interaction et une intersection étroites des intérêts.

Il est préférable d'étudier la théorie des jeux avec des exemples spécifiques, car cette discipline mathématique elle-même n'est pas théorique.

Exemple de dilemme du prisonnier

Par exemple, deux personnes ont été volées, sont tombées entre les mains de la police et sont interrogées dans des cellules séparées. Dans le même temps, les policiers offrent à chaque participant des conditions favorables à sa libération s'il témoigne contre son partenaire. Chacun des criminels a l'ensemble de stratégies suivant qu'il considérera:

  1. Tous deux témoignent et reçoivent simultanément 2, 5 ans de prison.

  2. Les deux sont silencieux en même temps et reçoivent 1 an chacun, car dans ce cas, la base de preuves de leur culpabilité sera faible.

  3. L'un témoigne et obtient la liberté, tandis que l'autre se tait et écope de 5 ans de prison.

De toute évidence, l'issue de l'affaire dépend de la décision des deux participants, mais ils ne peuvent pas parvenir à un accord car ils sont assis dans des cellules différentes. Le conflit de leurs intérêts personnels dans la lutte pour un intérêt commun est également clairement visible. Chaque détenu a deux options d'action et 4 options de résultats.

Chaîne d'inférence

Le criminel A envisage donc les options suivantes:

  1. Je suis silencieux et mon partenaire est silencieux - nous recevrons tous les deux 1 an de prison.

  2. Je donne à mon partenaire et il me donne - nous avons tous deux 2, 5 ans de prison.

  3. Je me tais, et mon partenaire me livre - je vais recevoir 5 ans de prison, et il sera libre.

  4. Je loue mon partenaire, et il est silencieux - j'ai la liberté, et il est 5 ans en prison.

Nous donnons une matrice de solutions et de résultats possibles pour plus de clarté.

Le tableau des résultats probables du dilemme du prisonnier.

Image

La question est: que choisira chaque participant?

"Silence, tu ne peux pas parler" ou "Silence tu ne peux pas parler"

Pour comprendre le choix du participant, il faut passer par la chaîne de ses pensées. Selon le raisonnement du criminel A: si je me tais et tais mon partenaire, nous recevrons une peine minimale (1 an), mais je ne peux pas savoir comment il se comportera. S'il témoigne contre moi, il vaut mieux que je témoigne, sinon je peux m'asseoir pendant 5 ans. Je préfère rester assis 2, 5 ans à 5 ans. S'il ne dit rien, alors je dois d'autant plus témoigner, car de cette façon j'aurai la liberté. Le membre B fait également valoir la même chose.

Image

Il est facile de comprendre que la stratégie dominante pour chacun des criminels est de témoigner. Le point optimal de ce jeu se produit lorsque les deux criminels témoignent et reçoivent leur "prix" - 2, 5 ans de prison. La théorie des jeux de Nash l'appelle équilibre.

Nash Optimal Optimal Solution

La révolution de la vision de Nashev est qu'un tel équilibre n'est pas optimal si l'on considère le participant individuel et son intérêt personnel. Après tout, la meilleure option est de garder le silence et de se libérer.

L'équilibre de Nash est un point de convergence des intérêts, où chaque participant choisit une option qui n'est optimale pour lui que si les autres participants choisissent une stratégie spécifique.

En considérant l'option lorsque les deux criminels sont silencieux et ne reçoivent que 1 an chacun, nous pouvons l'appeler l'option Pareto-optimale. Cependant, cela n'est possible que si les criminels auraient pu convenir à l'avance. Mais même cela ne garantirait pas ce résultat, car la tentation de revenir en arrière de la persuasion et d'éviter la punition est grande. Le manque de confiance mutuelle et le danger d'avoir 5 ans obligent à choisir l'option avec reconnaissance. Réfléchir au fait que les participants adhéreront à l'option avec silence, agissant de concert, est tout simplement irrationnel. Une telle conclusion peut être tirée si nous étudions l'équilibre de Nash. Les exemples ne font que le prouver.

Égoïste ou rationnel

La théorie de l'équilibre de Nash a produit des conclusions étonnantes, réfutant les principes qui existaient auparavant. Par exemple, Adam Smith a considéré le comportement de chacun des participants comme absolument égoïste, ce qui a mis le système en équilibre. Cette théorie a été appelée la «main invisible du marché».

Image

John Nash a vu que si tous les participants agissent dans la poursuite de leurs propres intérêts, cela ne conduira jamais à un résultat de groupe optimal. Étant donné que la pensée rationnelle est inhérente à chaque participant, le choix qu'offre la stratégie d'équilibre de Nash est plus probable.

Expérience purement masculine

Un exemple frappant est le jeu du «paradoxe blond», qui, bien qu'il semble inapproprié, est une illustration vivante montrant comment fonctionne la théorie du jeu Nash.

Dans ce jeu, vous devez imaginer que la compagnie des gars libres est venue au bar. Vient ensuite une compagnie de filles, dont l'une est préférable aux autres, dit une blonde. Comment les gars se comportent-ils pour obtenir la meilleure petite amie pour eux-mêmes?

Image

Donc, le raisonnement des gars: si tout le monde commence à se familiariser avec la blonde, alors très probablement, elle n'atteindra personne, alors ses amis ne voudront pas se rencontrer. Personne ne veut être le deuxième repli. Mais si les gars choisissent d'éviter la blonde, la probabilité pour chacun de trouver une bonne petite amie parmi les filles est élevée.

La situation d'équilibre de Nash n'est pas optimale pour les mecs, car, poursuivant uniquement leurs intérêts égoïstes, tout le monde choisirait une blonde. Il est évident que la poursuite des seuls intérêts égoïstes équivaudra à l'effondrement des intérêts du groupe. L'équilibre de Nash signifie que chaque gars agit dans son propre intérêt personnel, qui est en contact avec les intérêts de l'ensemble du groupe. Ce n'est pas une option optimale pour tout le monde personnellement, mais optimale pour tout le monde, en fonction de la stratégie de réussite globale.

Toute notre vie est un jeu

Prendre des décisions dans des conditions réelles est très similaire à un jeu lorsque vous attendez un certain comportement rationnel de la part des autres participants. En affaires, au travail, en équipe, en entreprise et même dans les relations avec le sexe opposé. Des transactions importantes aux situations de la vie ordinaire, tout obéit à une loi ou à une autre.

Image

Bien sûr, les situations de jeu envisagées avec des criminels et la barre ne sont que d'excellentes illustrations démontrant l'équilibre de Nash. Des exemples de tels dilemmes surviennent très souvent sur le marché réel, et cela fonctionne particulièrement dans les cas où deux monopoleurs contrôlent le marché.

Stratégies mixtes

Souvent, nous ne participons pas à un mais à plusieurs jeux à la fois. Choisir l'une des options pour un jeu, guidé par une stratégie rationnelle, mais vous entrez dans un autre jeu. Après plusieurs décisions rationnelles, vous pouvez constater que votre résultat ne vous convient pas. Que faire?

Considérez deux types de stratégie:

  • Une stratégie pure est le comportement d'un participant qui vient de la réflexion sur le comportement possible des autres participants.

  • Une stratégie mixte ou une stratégie aléatoire est l'alternance de stratégies pures au hasard ou le choix d'une stratégie pure avec une certaine probabilité. Cette stratégie est également appelée randomisée.

Image

Compte tenu de ce comportement, nous obtenons un nouveau regard sur l'équilibre de Nash. Si plus tôt on disait que le joueur choisit une stratégie une fois, alors un autre comportement peut être imaginé. Nous pouvons admettre que les joueurs choisissent une stratégie au hasard avec une certaine probabilité. Les jeux dans lesquels les équilibres de Nash ne peuvent être trouvés dans des stratégies pures les ont toujours dans des stratégies mixtes.

L'équilibre de Nash dans les stratégies mixtes est appelé équilibre mixte. Il s'agit d'un tel équilibre, où chaque participant choisit la fréquence optimale pour choisir ses stratégies, à condition que les autres participants choisissent leurs stratégies avec une fréquence donnée.