Estratègia barrejada

El concepte d'estratègia barrejada o estratègia mixta es fa servir a la teoria de jocs per descriure una estratègia que comprèn els possibles moviments i la distribució de probabilitat, que correspon a la freqüència amb què cada moviment es tria. Una estratègia totalment barrejada és una estratègia barrejada en la qual el jugador assigna una probabilitat estrictament positiva a cada estratègia pura. Les estratègies totalment barrejades són importants per al refinament de l'equilibri.

L'estratègia barrejada s'ha d'entendre observant el contrast amb l'estratègia pura, on cada jugador juga una única estratègia amb probabilitat 1.

Definicions formals

Recordem que un joc rectangular està format d'un conjunt N, d'una col·lecció de conjunts { D j } j N {\displaystyle \{{D_{j}}\}_{j\in N}} i d'una col·lecció de funcions { φ j } j N {\displaystyle \{{\varphi _{j}}\}_{j\in N}} on

φ j : j N D j R {\displaystyle \varphi _{j}:\prod _{j\in N}D_{j}\rightarrow \mathbb {R} \,} .

A N li direm el conjunt de jugadors, a cada D j {\displaystyle D_{j}} el conjunt d'estratègies pures del jugador j i a φ j {\displaystyle \varphi _{j}} la funció de pagament del jugador j.

De vegades per comoditat es farà servir una sola funció de pagament que consistirá en considerar cadascuna φ j {\displaystyle \varphi _{j}} com la j-ena component d'un vector N-dimensional, és a dir, és considerará un joc rectangular ( N , D j , ϕ ) {\displaystyle (N,D_{j},\phi )} , amb

φ : j N D j R N {\displaystyle \varphi :\prod _{j\in N}D_{j}\rightarrow {\mathbb {R} }^{N}\,} .

Denotarem i N D i = D {\displaystyle \prod _{i\in N}D_{i}=D}

Estratègia mixta

Donat un joc rectangular ( N , D j , ϕ j ) {\displaystyle (N,D_{j},{\phi }_{j})} , diem que X j R l j {\displaystyle X^{j}\in R^{l_{j}}} és una estratègia mixta del jugador j, si per tota σ j D j {\displaystyle \sigma ^{j}\in D_{j}} , x σ j j 0 {\displaystyle x_{\sigma ^{j}}^{j}\geq 0} y σ j D j x σ j j = 1 {\displaystyle \sum _{\sigma ^{j}\in D_{j}}x_{\sigma j}^{j}=1} . El enter l j {\displaystyle l_{j}} denota el nombre de estratègies pures del jugador j.

Intuïtivament, una estratègia mixta és un vector que associa certa probabilitat a cada estratègia pura del jugador j, d'ací que cada entrada hagi de ser no negativa y la suma de totes ellas sigui 1.

A una estratègia mixta X j {\displaystyle X^{j}} del jugador j, x σ k j {\displaystyle x_{\sigma ^{k}}^{j}} s'interpreta como el pes o probabilitat que el jugador j li associï a la seva estratègia pura σ k {\displaystyle \sigma ^{k}} .

La lletra M j {\displaystyle M_{j}} denotarà al conjunt d'estratègies mixtes del jugador j i M al producte cartesià dels conjunts M j {\displaystyle M_{j}} . A cada element de M li direm un perfil d'estratègies mixtes.

En particular, podem tenir en consideració una estratègia mixta de la forma x σ k j = 1 {\displaystyle x_{\sigma ^{k}}^{j}=1} per a algú k, x σ i j = 0 {\displaystyle x_{\sigma ^{i}}^{j}=0} par tot i diferent de k. Aquestes estratègies corresponen a les estratègies pures, per això és que aquestes darreres siguin un cas particular de les estratègies mixtes.

Funció de pagament esperat

La funció de pagament esperat d'un joc rectangular ( N , { D j } j N , φ ) {\displaystyle (N,\{D_{j}\}_{j\in N},\varphi )} és la funció E : M R N {\displaystyle E:M\rightarrow \mathbb {R} ^{N}} definida com:

E ( X 1 , X 2 , . . . , X N ) = ( σ 1 , σ 2 , . . . , σ N ) D x σ 1 1 x σ 2 2 . . . x σ N N φ ( σ 1 , σ 2 , . . . , σ N ) {\displaystyle E(X^{1},X^{2},...,X^{N})=\sum _{(\sigma _{1},\sigma _{2},...,\sigma _{N})\in D}x_{\sigma _{1}}^{1}x_{\sigma _{2}}^{2}...x_{\sigma _{N}}^{N}\varphi (\sigma _{1},\sigma _{2},...,\sigma _{N})}

Intuïtivament, la funció de pagament esperat es basa en la definició de valor esperat, és a dir, el pagament mitjà per a cada jugador consistirà en la suma de cada guany possible (donat per φ {\displaystyle \varphi } ) per la probabilitat que es doni un guany (aquesta probabilitat és justament el producte de les σ j {\displaystyle \sigma _{j}} ). Per aquesta raó existeix implícitament una suposició d'independència a la presa de decisions, és a dir, encara que els jugadors puguin arribar a pactar, al moment de prendre la seva decisió no existeix cap força externa que els hi obligui a mantenir la seva paraula.

Denotarem la funció de pagament esperat del jugador j como E j {\displaystyle E_{j}} , que estarà definida com la j-ena component de la funció de pagament esperat.

Aquestes funcions són importants tant a la teoría como en la pràctica, perquè estan estretament relacionades amb els equilibris de Nash.

Exemple

Un joc
A B
A 1, 1 0, 0
B 0, 0 1, 1

El joc mostrat a la dreta es coneix com a joc de coordinació. En ell, un jugador tria les files i un altre les columnes. El jugador de les files rep la recompensa marcada pel primer dígit, el de les columnes la marcada pel segon. Si el de les files opta per jugar A amb probabilitat 1 (és a dir, juga A segur), llavors està jugant una estratègia pura. Si el de les columnes tria llançar una moneda i jugar A si surt cara i B si surt creu, llavors està jugant una estratègia barrejada.

Rellevància

John Forbes Nash va provar que hi ha un equilibri per a cada joc finit (després, aquest equilibri es coneixerà com a equilibri de Nash). L'equilibri de Nash es pot dividir en dos tipus:

Els equilibris de Nash d'estratègia pura són equilibris de Nash on tots els jugadors juguen estratègies pures. En canvi, els equilibris de Nash d'estratègia barrejada són equilibris on almenys un jugador juga una estratègia barrejada. Mentre que Nash va demostrar que cada joc finit té un equilibri de Nash, no tots tenen equilibris de Nash d'estratègia pura. Per exemple, un joc que no té equilibri de Nash per a estratègies pures és Pedra-Paper-Tisores.


  • Vegeu aquesta plantilla
Articles sobre teoria de jocs
Definicions
Forma normal d'un joc · Forma extensiva d'un joc · Joc cooperatiu · Joc resolt · Matriu de recompenses · Succinct game · Conjunt d'informació · Hierarchy of beliefs · Preference
Conceptes d'equilibri
Equilibri de Nash · Subgame perfection · Mertens-stable equilibrium · Jocs Bayesians · Trembling hand · Proper equilibrium · Epsilon-equilibrium · Correlated equilibrium · Equilibri seqüencial · Quasi-perfect equilibrium · Evolutionarily stable strategy · Risk dominance · Shapley value · Òptim de Pareto · Quantal response equilibrium · Self-confirming equilibrium · Strong Nash equilibrium · Markov perfect equilibrium
Estratègies
Argument de robatori d'estratègia · Estratègia dominant · Estratègia barrejada · Estira i arronsa · Grim trigger · Col·lusió · Backward induction · Forward induction · Markov strategy
Classes de jocs
Joc simètric · Informació perfecta · Simultaneous game · Sequential game · Joc repetitiu · Signaling game · Cheap talk · Joc de suma nul·la · Mechanism design · Problema del regateig · Joc estocàstic · Large poisson game · Nontransitive game · Global games
Jocs
Dilema del presoner · Dilema del viatger · Joc de coordinació · Joc del gallina · Centipede game · Volunteer's dilemma · Dollar auction · Batalla dels sexes · Caça del cérvol · Matching pennies · Ultimatum game · Pedra, paper, tisores · Pirate game · Dictator game · Public goods game · Blotto games · War of attrition · El Farol Bar problem · Cake cutting · Cournot game · Deadlock · Dilema de Diner · Guess 2/3 of the average · Kuhn poker · Nash bargaining game · Screening game · Prisoners and hats puzzle · Trust game · Princess and monster game · Monty Hall problem
Teoremes
Teorema minimax · Nash's theorem · Purification theorem · Folk theorem · Revelation principle · Paradoxa d'Arrow
Persones eminents
Albert W. Tucker · Amos Tversky · Antoine Augustin Cournot · Ariel Rubinstein · Claude Shannon · Daniel Kahneman · David K. Levine · David M. Kreps · Donald B. Gillies · Drew Fudenberg · Émile Borel · Eric Maskin · Harold W. Kuhn · Herbert A. Simon · Herbert Scarf · Hervé Moulin · Jean Tirole · Jean-François Mertens · Jennifer Tour Chayes · John Harsanyi · John Maynard Smith · John Nash · John von Neumann · Julia Robinson · Kenneth Arrow · Kenneth Binmore · Leonid Hurwicz · Lloyd Shapley · Melvin Dresher · Merrill M. Flood · Olga Bondareva · Oskar Morgenstern · Paul Milgrom · Peyton Young · Reinhard Selten · René de Possel · Robert Axelrod · Robert Aumann · Robert B. Wilson · Roger Myerson · Salvador Barberà Sandez · Samuel Bowles · Suzanne Scotchmer · Thomas Schelling · William Vickrey
Altres
All-pay auction · Anàlisis confrontació · Avantatge del primer moviment en escacs · Glossari de la teoria dels jocs · Llista de teòrics dels jocs · Llista de jocs de la teoria dels jocs · Paradoxa de Bertrand · Situació de ningú guanya · Teoria de jocs combinatòria · Teoria evolutiva de jocs · Tragèdia dels comuns · Tirania de les petites decisions