Probabilidades de piedra, papel o tijera
ResumenLa forma en que los seres humanos toman decisiones en interacciones estratégicas no cooperativas es una gran pregunta. Para el sistema de juego modelo fundamental Piedra-Papel-Tijeras (RPS), la teoría clásica del equilibrio de Nash (NE) predice que los jugadores aleatorizan completamente sus elecciones de acción para evitar ser explotados, mientras que la teoría evolutiva de juegos de racionalidad limitada en general predice movimientos cíclicos persistentes, especialmente en poblaciones finitas. Sin embargo, como los estudios empíricos han sido relativamente escasos, sigue siendo una cuestión controvertida qué marco teórico es más apropiado para describir la toma de decisiones de los sujetos humanos. Aquí observamos movimientos cíclicos persistentes a nivel de población en un experimento de laboratorio del juego RPS iterado en tiempo discreto bajo el protocolo tradicional de emparejamiento aleatorio. Este comportamiento colectivo se contradice con la teoría NE pero se explica cuantitativamente, sin ningún parámetro ajustable, por un modelo microscópico de respuesta condicional de ganar-perder-empatar. Los cálculos teóricos sugieren que si todos los jugadores adoptan la misma estrategia de respuesta condicional optimizada, su retribución acumulada será mucho mayor que el valor de referencia de la estrategia mixta NE. Nuestro trabajo demuestra la viabilidad de entender los comportamientos de la competencia humana desde el ángulo de la física estadística de no-equilibrio.
Teoría del juego piedra, papel o tijera
IntroducciónEl piedra, papel o tijera funciona muy bien para decidir quién tiene que sacar la basura. Pero, ¿te has dado cuenta de lo que ocurre cuando, en lugar de jugar al mejor de tres, dejas que el juego continúe ronda tras ronda? Al principio, juegas un patrón que te da la ventaja, pero luego tu oponente se da cuenta rápidamente y pone las cosas a su favor. A medida que las estrategias evolucionan, se llega a un punto en el que ninguna de las partes parece poder mejorar más. ¿Por qué ocurre esto?
En 1950, el matemático John Nash demostró que en cualquier tipo de juego con un número finito de jugadores y un número finito de opciones -como Piedra-Papel-Tijeras- siempre existe una mezcla de estrategias en la que ningún jugador puede mejorar cambiando sólo su propia estrategia. La teoría que subyace a estos perfiles estratégicos estables, que llegaron a conocerse como “equilibrios de Nash”, revolucionó el campo de la teoría de juegos, alterando el curso de la economía y cambiando la forma en que se estudia y analiza todo, desde los tratados políticos hasta el tráfico de la red. Y le valió a Nash el Premio Nobel en 1994.
Resultados de piedra, papel o tijera
Piedra, papel y tijera es un juego simultáneo de suma cero, que sólo tiene dos resultados posibles: un empate o una victoria para un jugador y una pérdida para el otro. Para repasar rápidamente las reglas, cualquiera de los tres elementos se juega simultáneamente a mano; la piedra gana al papel, empata con la piedra y pierde con las tijeras, el papel gana a la piedra, empata con el papel y pierde con las tijeras, y las tijeras ganan al papel, empatan con las tijeras y pierden con la piedra. El juego tiene orígenes asiáticos y se juega así desde la época de la dinastía china Han.
Entonces, ¿es sólo al azar que la gente elige sus respuestas en este juego para ganar? En realidad no, las matemáticas han encontrado una forma de ganar o al menos han formulado estrategias para hacerlo a través de este ciclo aleatorio de ensayo y error. Investigadores de la Universidad de Zhejiang, en China, han llevado a cabo un revelador experimento sobre el modelo de juego piedra, papel o tijera. Su estudio consistió en que 360 estudiantes jugaran 300 rondas de piedra, papel o tijera, que duraron aproximadamente dos horas, para encontrar algunas pistas y patrones estadísticos para ganar. Según la teoría clásica del equilibrio de Nash, un jugador elige todos sus movimientos o acciones con la misma probabilidad. Como hay tres elementos en el RPS, la probabilidad de elegir cualquiera de ellos sería de 1/3. Lo que significa que los jugadores elegirán al azar cualquiera de los tres elementos, porque piensan que no serían explotados de esa manera. Mientras que la moderna teoría de juegos de la Racionalidad Limitada predice movimientos cíclicos persistentes en el modelo de piedra, papel o tijera. Sin embargo, esto desafía la teoría del equilibrio de Nash.
Matriz de pagos para piedra, papel o tijera
La teoría de los juegos estudia la interacción estratégica entre individuos o grupos racionales. El resultado final es la combinación de estrategias que es mejor para cada uno de los individuos participantes. El concepto de Equilibrio de Nash establece que la estrategia final elegida por cada jugador (individuo) es su mejor respuesta hacia la estrategia elegida por el otro y viceversa.
Este juego es un juego estático (de movimientos simultáneos) con información completa. Sin embargo, no tiene un equilibrio de Nash en estrategias puras. Es necesario adjuntar una probabilidad para obtener una solución. Sin embargo, se llama Equilibrio de Nash en estrategia mixta. El Equilibrio de Nash dice que si, en un juego de dos jugadores, el jugador uno elige su estrategia óptima, digamos S1* dada la estrategia óptima del jugador dos S2* Y el jugador dos elige su estrategia óptima S2* dado que el jugador uno ha elegido S1*. Entonces (S1*, S2*) se conoce como el Equilibrio de Nash en estrategia pura.
El jugador uno tiene tres estrategias: piedra (R), papel (P) y tijera (S). Del mismo modo, el jugador dos tiene las mismas tres estrategias (R, P y S). El juego se representa en forma normal. La primera entrada de cada celda corresponde al pago del jugador uno y la segunda entrada de cada celda representa el pago del jugador dos. Este juego es un juego estático (de movimientos simultáneos) de información completa. Por lo tanto, el equilibrio de Nash en estrategias puras en este juego no existe.