Conceptos Esenciales de Teoría de Juegos y Modelos de Oligopolio


Conceptos Fundamentales de Teoría de Juegos

Estrategias y Equilibrios

Estrategia Estrictamente Dominante

Una estrategia sᵢ* es estrictamente dominante para el jugador i si proporciona una mayor utilidad, independientemente de las acciones de los demás jugadores.

Fórmula:

uᵢ(sᵢ*, s₋ᵢ) > uᵢ(sᵢ’, s₋ᵢ) ∀ s₋ᵢ, ∀ sᵢ’ ≠ sᵢ*

Supuesto clave: Se aplica el supuesto de racionalidad. Un jugador racional siempre elegirá la estrategia que le proporcione el mayor pago, sin importar las acciones de los demás.

Estrategia Estrictamente Dominada

Una estrategia sᵢᵈ está estrictamente dominada si existe otra estrategia que le proporciona una mayor utilidad en todos los casos posibles.

Fórmula:

uᵢ(sᵢᵈ, s₋ᵢ) < uᵢ(sᵢ’, s₋ᵢ) ∀ s₋ᵢ

Mejor Respuesta

Una estrategia sᵢ* es la mejor respuesta del jugador i a las estrategias s₋ᵢ de los demás jugadores si le proporciona la mayor utilidad posible.

Fórmula:

uᵢ(sᵢ*, s₋ᵢ) ≥ uᵢ(sᵢ’, s₋ᵢ) ∀ sᵢ’ ∈ Sᵢ

Equilibrio de Nash

Un perfil de estrategias (s₁*, s₂*, …, sₙ*) constituye un Equilibrio de Nash si cada jugador está eligiendo su mejor respuesta, dadas las estrategias de los demás.

Fórmula:

uᵢ(sᵢ*, s₋ᵢ*) ≥ uᵢ(sᵢ’, s₋ᵢ*) ∀ sᵢ’ ∈ Sᵢ, ∀ i

Eliminación Iterativa de Estrategias Estrictamente Dominadas (EIEED)

Supuesto clave: Se aplica el supuesto de conocimiento común de la racionalidad.

Estrategia Dominante

Una estrategia sᵢ* es dominante para el jugador i si es al menos tan buena como cualquier otra estrategia, para todas las estrategias posibles de los demás jugadores.

Fórmula:

uᵢ(sᵢ*, s₋ᵢ) ≥ uᵢ(sᵢ’, s₋ᵢ) ∀ s₋ᵢ, ∀ sᵢ’ ∈ Sᵢ

Toda predicción basada en estrategias estrictamente dominantes es un Equilibrio de Nash, ya que cada jugador elige su mejor respuesta independientemente de las acciones de los demás, lo cual satisface la definición de Equilibrio de Nash. Sin embargo, no todo Equilibrio de Nash implica que las estrategias sean estrictamente dominantes. El Equilibrio de Nash solo requiere que la estrategia sea la mejor respuesta dado lo que hacen los otros jugadores, no frente a todas las posibles acciones. Por lo tanto:

  • Estrategia Estrictamente Dominante ⇒ Equilibrio de Nash
  • Pero no a la inversa.

Óptimo de Pareto

Una situación es Óptimo de Pareto si no es posible mejorar la utilidad de un jugador sin empeorar la de al menos otro. Una situación domina de Pareto a otra si mejora la utilidad de al menos un jugador sin perjudicar a ninguno. Una combinación de acciones es Óptimo de Pareto si no existe otra que la domine de Pareto. (Implica que se han alcanzado los mejores pagos posibles para al menos un jugador, sin reducir los de los demás).

Estrategias Mixtas

Juegos Repetidos

Supongamos un juego dinámico donde se presenta una primera matriz de dos jugadores:

Y luego de observar esa etapa, se presenta esta otra:

Supongamos que se solicitan los Equilibrios Perfectos en Subjuegos (EPS). El primer paso es encontrar el Equilibrio de Nash (EN) en la etapa 1. Posteriormente, se deben construir 4 subjuegos (o 4 matrices adicionales). En el subjuego 1, se deben SUMAR los pagos de la combinación (A, I) de la etapa 1 a toda la matriz de la etapa 2. De manera similar, en el subjuego 2 se suman los pagos de (A, D) de la etapa 1 a la matriz de la etapa 2; en el subjuego 3, los de (B, I); y en el subjuego 4, los de (B, D). Este proceso puede representarse mediante un árbol de juego. Para obtener la solución, es necesario encontrar todos los EN, incluyendo el de la etapa 1. Por ejemplo, un EPS podría ser (ABBBB, IDDDD).

Para las decisiones y pagos resultantes:

  • Etapa t = 1: (A, I) → Pagos: (1, 1)
  • Etapa t = 2: (B, D) → Pagos: (2, 2)

Pagos Totales:

  • Jugador 1: 1 + 2 = 3
  • Jugador 2: 1 + 2 = 3

Por lo tanto, los pagos resultantes serían (3, 3).

¿Qué sucedería si el Jugador 1 tuviera un factor de descuento δ₁ y el Jugador 2 un factor de descuento δ₂, donde 0 < δ₁, δ₂ < 1?

El equilibrio no se vería afectado, y los pagos serían:

  • Para el Jugador 1: (1 + 2 × δ₁)
  • Para el Jugador 2: (1 + 2 × δ₂)

Juegos Repetidos un Número Finito de Veces (t=2)

  • En t = 1, los jugadores pueden desviarse.
  • En t = 2, solo hay un castigo posible.
  • Se considera el factor de descuento δ (donde 0 < δ < 1).
  • Una estrategia de cooperación es un Equilibrio Perfecto en Subjuegos (EPS) si:

Ganancia por cumplir = Ganancia en t = 1 + δ × Ganancia en t = 2

Ganancia por desviarse = Desvío en t = 1 + δ × Castigo en t = 2

Por lo tanto, se cumple si: [Ganancia en t=1 + δ × Ganancia en t=2] ≥ [Desvío en t=1 + δ × Castigo en t=2]

Juegos Repetidos Infinitamente (con Factor de Descuento δ)

  • Pago por cumplir (cooperar siempre):

U = R / (1 – δ)

  • Si un jugador se desvía en t = 1 y es castigado para siempre:

U = G + (C × δ) / (1 – δ)

Donde:

  • R: Pago por cooperar
  • G: Ganancia al desviarse en t = 1
  • C: Castigo futuro (pago en el período de castigo)

✅ Es un Equilibrio Perfecto en Subjuegos (EPS) si:

R / (1 – δ) ≥ G + (C × δ) / (1 – δ)

⇒ δ ≥ (G – R) / (G – C)

Conclusión clave: Si el castigo es severo (C es muy bajo) y la ganancia por desviarse no es significativa, es más fácil sostener la cooperación como un Equilibrio Perfecto en Subjuegos (EPS). En juegos infinitos, el valor de δ (factor de descuento) es crucial para determinar si el castigo es suficiente para disuadir las desviaciones.

Juegos Dinámicos de Información Imperfecta

Se presentan cuando un jugador debe tomar una decisión sin conocer la elección previa del otro, o cuando ambos jugadores eligen simultáneamente.

  • Cuando el Jugador 2 no observa la acción del Jugador 1.
  • Cuando ambos jugadores deciden simultáneamente.

Ejemplo: Dilema del Prisionero Repetido Infinitamente

Supongamos que ambos jugadores tienen un factor de descuento de δ = 1/2 y siguen la siguiente estrategia:

  • En t = 1: Colaborar.
  • En t > 1: Colaborar si y solo si el otro jugador ha colaborado en t − 1.

Solución:

¿Cuáles son los pagos resultantes si ambos jugadores siguen esta estrategia?

Los jugadores obtendrían un beneficio por colaborar en este juego repetido infinitamente de 4 / (1 − δ). Dado que δ = 1/2, el beneficio de colaborar es 4 / (1 – 1/2) = 4 / (1/2) = 8.

¿Es un Equilibrio de Nash?

Para verificar si es un Equilibrio de Nash (EN), es necesario determinar si alguno de los jugadores tiene incentivos para desviarse. Hemos calculado que el beneficio de colaborar (es decir, de no desviarse de la estrategia propuesta) es 8.

Ahora, debemos comparar este valor con el beneficio de desviarse de la estrategia. El mejor desvío para cualquier jugador, si asume que el otro decide “colaborar”, es “no colaborar”. En ese caso, obtiene un pago de 5 en el período de desvío. Posteriormente, se activa el castigo hasta el infinito, cuyo pago es de 1 por período.

Por lo tanto, el beneficio de desviarse de la estrategia es:

5 + (1 × δ) / (1 − δ)

Dado que δ = 1/2, el beneficio de desviarse es: 5 + (1 × 1/2) / (1 – 1/2) = 5 + (1/2) / (1/2) = 5 + 1 = 6.

Dado que el beneficio de colaborar (8) es mayor que el beneficio de desviarse (6), los jugadores no tienen incentivos para desviarse. En conclusión, (colaborar, colaborar) es un Equilibrio de Nash.

Modelos de Oligopolio y Competencia Imperfecta

1. Modelo de Cournot (Competencia en Cantidades)

Las empresas eligen sus cantidades de producción simultáneamente (juego estático). El precio de mercado depende de la cantidad total producida: P(Q) = a – bQ, donde Q = q₁ + q₂.

Pasos para la Resolución:

  1. Plantear la función de beneficio de cada empresa:
    πᵢ = P(Q) * qᵢ – Cᵢ(qᵢ)
    Ejemplo: π₁ = (a – b(q₁ + q₂))q₁ – cq₁
  2. Derivar la función de beneficio respecto a la cantidad de la empresa (qᵢ) e igualar a cero:
    dπᵢ/dqᵢ = 0 ⇒ Esto genera la Función de Mejor Respuesta de cada empresa.
  3. Resolver el sistema de ecuaciones formado por las funciones de mejor respuesta de todas las empresas para encontrar el Equilibrio de Nash.

Consideración sobre Subjuegos: No hay subjuegos relevantes en este modelo, ya que es un juego simultáneo.

2. Modelo de Stackelberg (Liderazgo en Cantidades)

Una empresa (el líder) elige su cantidad de producción primero, y la otra empresa (el seguidor) observa esta decisión y responde. Es un juego dinámico.

Pasos para la Resolución:

  1. Hallar la función de mejor respuesta del seguidor, como si fuera un modelo de Cournot.
  2. Reemplazar esta función de mejor respuesta en la función de beneficio del líder.
  3. Maximizar el beneficio del líder respecto a su propia cantidad.
  4. Una vez obtenida la cantidad óptima del líder, hallar la cantidad del seguidor utilizando su función de mejor respuesta.

Consideración sobre Subjuegos: Sí, en este modelo existen subjuegos. Se resuelve mediante el método de inducción hacia atrás (backward induction).

3. Modelo de Bertrand (Competencia en Precios)

Las empresas eligen sus precios de venta simultáneamente (juego estático). Si los precios son distintos, los consumidores compran al precio más bajo. Si los precios son iguales, la demanda se reparte entre las empresas.

Resultado Clásico:

Si las empresas venden bienes homogéneos y tienen el mismo costo marginal (c), el único equilibrio de Nash es que ambas cobren un precio igual al costo marginal (p = c). Esto implica un beneficio económico nulo para ambas empresas.

Consideración sobre Subjuegos: No aplica en el modelo clásico, ya que es un juego estático y simultáneo.

4. Problema de los Ejidos (Externalidad entre Jugadores)

Dos o más agentes deciden cuánto explotar un recurso común. La acción de cada agente genera una externalidad negativa sobre los demás.

Forma Típica de la Función de Beneficio:

πᵢ = a * qᵢ – b(q₁ + q₂) * qᵢ

Pasos para la Resolución:

  1. Derivar la función de beneficio respecto a la cantidad de explotación de cada agente (qᵢ) para encontrar la función de mejor respuesta.
  2. Resolver el sistema de ecuaciones resultante para encontrar el equilibrio.

Consideración sobre Subjuegos: No hay subjuegos en este modelo, ya que se trata como un juego simultáneo similar al de Cournot.

Dejar un Comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *