comprendre-equilibre-nash

Dans notre série de concepts économiques, nous analysons cette semaine l’équilibre de Nash. Ce concept a été développé par l’économiste français Antoine-Augustin Cournot dans son analyse intitulée « Oligopoles » (1838), dans laquelle il propose un modèle concurrentiel où plusieurs entreprises se disputent le même bien et où chacune d’entre elles tente de déterminer la quantité « optimale » à produire afin de maximiser ses profits individuels.

1. Origine du concept

Le concept d’équilibre de Nash a été développé dans le cadre de la théorie des stratégies pures, des stratégies mixtes et de ce que l’on appelle l’équilibre de Nash pour les jeux extensifs :

1.1 Stratégies pures

L’aspect des stratégies pures a été étudié par Cournot lui-même et a été développé sur la base que tout ce qu’un individu gagnait/perdait était équivalent à ce qu’un autre individu perdait/gagnait, la situation globale de l’économie restant invariable, un jeu économique qui n’avait pas beaucoup de profondeur puisque chaque individu ne pouvait pas choisir une stratégie simultanément.

1.2 Stratégies mixtes

Le développement de stratégies mixtes nécessiterait la coexistence simultanée de différentes stratégies d’action pour chaque individu interagissant dans le jeu. Pour cela, il faut attendre le développement de ce que l’on a appelé la « théorie moderne des jeux » avec les études de John Von Neuman et d’Oskar Morgenstein dans son ouvrage « The Theory of Games and Economic Behavior » (1944).

La véritable splendeur du développement de ce concept viendra avec l’arrivée de l’économiste John Forbes Nash, qui en démontrera la véritable valeur dans sa thèse de doctorat en 1951, en approfondissant l’analyse jusqu’à atteindre ce qui est connu aujourd’hui sous le nom d’équilibre de Nash, Il s’agit d’un travail multidisciplinaire qui lui a valu le prix Nobel d’économie en 1994, lorsqu’il a démontré que tout jeu avec un nombre fini de stratégies possède au moins un équilibre de Nash en stratégies mixtes, et le comité du prix Nobel a considéré que l’équilibre de Nash est vrai pour les jeux non coopératifs.

1.3 Application aux jeux extensifs

Bien qu’elle n’ait pas modifié en substance l’analyse de John Forbes Nash, elle a modifié la méthode d’obtention de l’équilibre, en ajoutant la possibilité de raisonner par « induction à rebours » pour la détermination de la stratégie résultante.

2. Principales hypothèses

Comme dans presque toutes les hypothèses économiques, une forte hypothèse de rationalité sous-tend les hypothèses suivantes qui permettront d’atteindre un équilibre de Nash :

  • Chaque joueur cherche à maximiser son gain/profit attendu en fonction des gains et des conditions décrivant le jeu.
  • Les joueurs mettent en œuvre les stratégies souhaitées et préméditées en fonction de leurs préférences, stratégies qui sont censées être exécutées sans erreur.
  • Les joueurs possèdent une capacité suffisante pour déterminer leurs équilibres privés et pour estimer ceux des autres joueurs qui interagissent dans le jeu.
  • On suppose que le fait qu’un individu modifie sa stratégie n’affecte pas la décision initiale qu’un autre individu prévoit de déployer. Chaque joueur détermine également sa trajectoire en fonction de ce qu’il pense que les autres feront et, s’il pense que cela changera, il en tiendra compte dans sa détermination.
  • Tous les agents économiques en interaction supposent que les règles sont respectées et, en même temps, que la rationalité est une caractéristique générale de chacun d’entre eux.

3. Problèmes d’applicabilité et de non-respect des hypothèses

Si les circonstances prédéfinies dans l’épigraphe précédente ne sont pas réunies, les résultats du jeu ne seront pas des équilibres de Nash, mais d’autres types de solutions seront consommés, les principaux échecs étant :

  • Il suffit que l’un des joueurs ne soit pas rationnel pour qu’un équilibre de Nash ne puisse être atteint.
  • L’équilibre n’est pas non plus atteint s’il y a au moins un joueur qui n’est pas en mesure de mettre en œuvre sa stratégie préméditée.
  • Parfois, les « règles du jeu » ne sont pas tout à fait claires pour chacun des individus qui interagissent, et il existe une tendance naturelle à les résoudre en décidant sur la base de l’expérience ; par conséquent, il arrive que l’on atteigne des équilibres qui peuvent différer sensiblement des équilibres théoriques ou réels.

4. L’équilibre de Nash dans notre vie

Ce concept, en raison de sa nature multidisciplinaire, a une application variée dans la vie réelle. Il est vrai qu’il existe des jeux tels que le populaire « pierre, papier, ciseaux » pour lesquels il ne s’applique pas, mais il y a des cas dans la vie personnelle et professionnelle dans lesquels il s’applique.

Les applications les plus connues et les plus courantes sont les suivantes :

4.1 Le jeu compétitif

Il s’agit d’un jeu dont la version la plus simple implique deux agents économiques, qui peuvent être plus nombreux, et dans lequel tous deux doivent choisir simultanément un nombre entier entre zéro et dix. Les deux joueurs gagnent la plus petite valeur en unités monétaires proposées, mais en plus, si les nombres sont différents, celui qui a choisi le plus grand doit payer deux unités monétaires à l’autre, il n’y a qu’un seul équilibre de Nash, celui dans lequel les deux joueurs choisissent zéro. Par conséquent, toute autre combinaison peut être plus préjudiciable aux intérêts d’un participant au jeu qui choisit un nombre entier de valeur inférieure.

Si nous introduisons une légère modification du jeu consistant à déterminer si les deux individus peuvent atteindre le gain choisi dans le cas où ils coïncident tous les deux, ce jeu aura onze équilibres de Nash.

4.2 Jeu de coordination

Il s’agit d’un jeu de coordination de la conduite, dans lequel il y a deux participants, et leurs choix sont : conduire à droite ou conduire à gauche, et leurs gains sont de cent s’il n’y a pas d’accident et de zéro s’il y a un accident.  Ce jeu ne peut atteindre que deux équilibres de Nash, tant que les deux participants choisissent simultanément l’option opposée.

4.3 Le dilemme du prisonnier

Il s’agit du jeu le plus populaire dans le cadre du concept d’équilibre de Nash, et il consiste en un jeu de stratégie pure, lorsque deux individus sont arrêtés pour avoir commis un crime et qu’ils avouent avoir commis le crime dont ils sont accusés en même temps. Cette stratégie leur sera plus préjudiciable à tous les deux que s’ils décident de coopérer, car ils devront passer plus de temps en prison.

Vous pouvez vous demander pourquoi les deux participants ne décident pas de coopérer dès le départ ? La réponse est simple : une fois que le choix d’un participant est connu de l’autre, il est toujours possible d’améliorer le résultat personnel. Par conséquent, si les deux participants coopèrent, la décision sera un optimum de Pareto, mais pas un équilibre de Nash.

Pour illustrer ce raisonnement, utilisons le graphique suivant : la matrice montre les gains, et les en-têtes indiquent les différentes stratégies que nous et notre homologue pouvons suivre :

dilemme-du-prisonnier

Il existe deux façons d’atteindre l’équilibre de Nash, la première par une stratégie de collusion renforçant la confiance par le biais d’un contrat, ou par l’expérience, dans laquelle les deux joueurs appliqueraient la vieille règle de « œil pour œil et dent pour dent ».

4.4 La tragédie des biens communs

Ce jeu provient d’une analyse ultérieure de l’équilibre de Nash par Garrett James Hardin, qu’il a publiée dans son ouvrage « The tragedy of the commons » (1968). Il s’agit d’un jeu dans lequel il y a n joueurs, qui utilisent un bien commun, tel qu’une forêt.

Tous les joueurs peuvent décider d’en prendre soin ou non, et même si certains décident de ne pas en prendre soin, ils peuvent toujours en faire usage. Il s’agit d’un jeu dans lequel les joueurs doivent décider s’ils suivent une stratégie égoïste ou, au contraire, une stratégie de solidarité. Un jeu qui atteindrait ses n équilibres de Nash si tous les agents économiques qui y participent choisissaient la stratégie égoïste, puisque la solidarité réduit leur profit.

Comme dans le cas de certains biens publics, il existe un problème de conservation de biens tels que l’environnement qui, partant d’une situation où il n’est pas possible de polluer, nous aurons presque toujours tendance à être égoïstes et à valoriser notre confort en utilisant notre véhicule privé plus que la protection de l’atmosphère contre les gaz polluants.

En ce sens, et afin de modifier cet équilibre de Nash, les gouvernements et les administrations publiques introduisent des paiements supplémentaires dans le jeu, tels que des amendes, qui sont « capables » de modifier le comportement « naturel » des individus, afin d’essayer de forcer un équilibre social dans lequel tous les individus font preuve de solidarité.