Red de conocimiento de divisas - Preguntas y respuestas sobre Forex - Menciona una historia que tenga el mismo significado que esta historia.

Menciona una historia que tenga el mismo significado que esta historia.

Historia en teoría de juegos

Este ejemplo trata sobre: ​​Hay dos cerdos en la pocilga, un cerdo grande y un cerdo pequeño. Hay un pedal en un lado de la pocilga. Cada vez que se pisa el pedal, una pequeña cantidad de comida caerá del puerto de alimentación en el otro lado de la pocilga, lejos del pedal. Si un cerdo pisa el pedal, el otro cerdo tendrá la oportunidad de comerse primero la comida que cae del otro lado. Cuando el cerdito pisa el pedal, el cerdo grande se comerá toda la comida justo antes de que corra hacia el comedero; si el cerdo grande pisa el pedal, todavía existe la posibilidad de que el cerdo grande pueda correr hacia la comida; comedero antes de que el cerdito termine de comer la comida caída, luchando por conseguir la otra mitad de las sobras.

Entonces, ¿qué estrategias adoptará cada uno de los dos cerdos? La respuesta es: el cerdito elegirá la estrategia del "autostop", es decir, esperar cómodamente junto al comedero mientras el cerdo grande correrá incansablemente entre el pedal y el comedero en busca de un poco de chatarra;

¿Cuál es el motivo? Porque el cerdito no obtendrá nada si pedalea, pero conseguirá comida si no pedalea. Para el cerdito, no importa si el cerdo grande pisa el pedal o no, siempre es una buena opción no pisar el pedal. Por otro lado, el cerdo grande ya sabía que el cerdito no pisaría el pedal, era mejor pisar él mismo el pedal que no pisarlo, así que tuvo que hacerlo él mismo.

El fenómeno del "cerdito acostado y el cerdo grande corriendo" es causado por las reglas del juego de la historia. Los indicadores centrales de las reglas son: la cantidad de cosas que caen cada vez y la distancia entre el pedal y el puerto de alimentación.

Si se cambian los indicadores básicos, ¿seguirá apareciendo en la pocilga la misma escena de "cerditos acostados y cerdos grandes corriendo"? Probar.

Cambio de plan uno: plan de reducción. Alimente sólo la mitad de la cantidad original. El resultado fue que ni el cerdito ni el cerdito grande pisaron el pedal. Si el cerdito lo pisa, el cerdito grande se terminará la comida; si el cerdito grande lo pisa, el cerdito se terminará la comida. Quien pisa el pedal significa aportar comida a la otra parte, por lo que nadie tiene la motivación para pisar el pedal.

Si el objetivo es conseguir que los cerdos pedaleen más, el diseño de esta regla de juego es evidentemente un fracaso.

Cambio de plan dos: plan incremental. Alimente el doble de la cantidad original. El resultado es que tanto el cerdito como el cerdito grande pisarán el pedal. Quien quiera comer, pisará el pedal. De todos modos, la otra persona no terminará la comida de una vez. Los cerditos y los cerdos grandes equivalen a vivir en una sociedad "comunista" con materiales relativamente abundantes, por lo que su sentido de competencia no es muy fuerte.

Para los diseñadores de reglas de juego, el coste de esta regla es bastante alto (se proporcionan porciones dobles de comida cada vez y como la competencia no es fuerte, el efecto de intentar que los cerdos pedaleen más); no es efectivo.

Plan de cambio tres: plan de reducción y turno. Alimente solo la mitad de la cantidad original, pero acerque el puerto de alimentación al pedal. Como resultado, tanto el cerdito como el cerdito grande luchaban desesperadamente por pisar el pedal. El que espera no consigue nada, pero el que trabaja más consigue más. Cada cosecha simplemente se consume.

Para los diseñadores de juegos, esta es la mejor solución. El costo no es alto, pero la ganancia es máxima.

La historia original de "Smart Pig Game" inspiró al jugador más débil de la competición (el cerdito) a considerar esperar como la mejor estrategia. Pero para la sociedad, debido a que el cerdito no participó en la competencia, la asignación de recursos sociales cuando el cerdito hacía autostop no estaba en un estado óptimo. Para asignar los recursos de la manera más eficiente, los diseñadores de las reglas no quieren que nadie se beneficie. Esto es cierto para el gobierno, y lo mismo es cierto para los jefes de la empresa. Que el fenómeno del "gorrón" pueda eliminarse por completo depende de si los indicadores básicos de las reglas del juego están establecidos apropiadamente.

Por ejemplo, el sistema de incentivos de la empresa está diseñado con demasiadas recompensas, incluidas tenencias de acciones y opciones. Todos los empleados de la empresa se han vuelto millonarios. Sin mencionar el alto costo, el entusiasmo de los empleados no es alto. debe ser muy alto. Esto equivale a la situación descrita en el plan incremental "Smart Pig Game". Pero si la recompensa no es fuerte y todos la ven (también hay "cerditos" que no trabajan), el cerdo grande que alguna vez trabajó muy duro no tendrá la motivación - al igual que el plan de reducción del "Juego del Cerdo Inteligente" situación descrita. El mejor diseño de mecanismo de incentivos es como cambiar el plan tres: reducir y cambiar. Las recompensas no son compartidas por todos, sino que están dirigidas directamente a los individuos (como las comisiones comerciales en proporción), lo que no solo ahorra costos (para la empresa). por ejemplo), también elimina el fenómeno del "gorrón" y puede lograr incentivos eficaces.

Muchas personas no han leído la historia de "Smart Pig Game", pero están utilizando conscientemente la estrategia de Piggy. Los inversores minoristas en el mercado de valores esperan que el comerciante levante su silla de manos; esperan la aparición de nuevos productos rentables en el mercado industrial y luego los imitan masivamente para obtener enormes ganancias, personas de la empresa que no crean beneficios; compartir los resultados, etc. Por lo tanto, quienes formulan diversas reglas del juego de gestión económica deben tener un conocimiento profundo de los principios detrás de los cambios en los indicadores del "juego del cerdo inteligente".

Luego está el dilema del prisionero

La policía arrestó a dos sospechosos, A y B, pero no había pruebas suficientes para acusarlos del crimen. Así que la policía encarceló a los sospechosos por separado, se reunió con ellos por separado y proporcionó a ambas partes las siguientes opciones:

Si una persona se declara culpable y testifica contra la otra parte (el término relacionado se llama "traicionar" al otra parte), y la otra parte permanece en silencio. La persona será puesta en libertad inmediatamente y la persona que guarde silencio será condenada a 10 años de prisión.

Si ambos guardan silencio (el término relacionado se llama "cooperar" entre sí), ambos serán condenados a medio año de prisión.

Si ambos se denuncian ("traicionan"), ambos serán condenados a 2 años de prisión.

Un cuadro se resume de la siguiente manera:

A guarda silencio (coopera) A se declara culpable (traición)

B guarda silencio (coopera) Ambos cumplen media hora un año de prisión y A es liberado inmediatamente; B cumple 10 años de prisión

B se declara culpable (traición). Para ilustrar, el dilema del prisionero supone que cada jugador (es decir, el "prisionero") tiene interés propio, es decir, busca maximizar sus propios intereses sin preocuparse por los intereses del otro jugador. Si el beneficio de un participante de una determinada estrategia es menor que el de otras estrategias bajo cualquier circunstancia, esta estrategia se denomina "desventaja estricta" y los participantes racionales nunca la elegirán. Además, ninguna otra fuerza interfiere en la toma de decisiones personales y los participantes pueden elegir estrategias completamente según sus propios deseos.

¿Qué estrategia debe elegir el preso para minimizar su condena personal? Debido a que los dos prisioneros están aislados, no conocen la elección del otro e incluso si pueden hablar, es posible que no puedan confiar en que el otro no tomará represalias. En términos de elección racional individual, la pena de prisión por denunciar una traición es siempre inferior a la de guardar silencio. Imagínense cómo dos prisioneros racionales tomarían una decisión en este dilema:

Si la otra parte guarda silencio y me traiciona, seré liberado, por lo que elegiré traicionar.

Si la otra parte me traiciona y me acusa, tengo que acusar a la otra parte para obtener una sentencia menor, así que elegiré traicionar.

Los dos se enfrentan a la misma situación, por lo que su pensamiento racional los llevará a la misma conclusión: elegir traicionar. La deserción es la estrategia dominante de las dos estrategias. Por lo tanto, el único equilibrio de Nash posible en este juego es que ambos jugadores se traicionen entre sí, y ambos cumplirán dos años de prisión.

El equilibrio de Nash de este juego obviamente no es una solución óptima de Pareto que tenga en cuenta los intereses del grupo. En términos de intereses generales, si ambos participantes cooperan y permanecen en silencio, ambos solo serán sentenciados a medio año de prisión. Los intereses generales son mayores y el resultado es mejor que la situación en la que los dos se traicionaron y se traicionaron. condenado a 2 años de prisión. Pero según los supuestos anteriores, ambos son individuos racionales y sólo persiguen sus propios intereses personales. La situación de equilibrio será que ambos prisioneros opten por desertar. Como resultado, los juicios de ambos prisioneros son más altos que los de la cooperación y el beneficio general es menor que el de la cooperación. Aquí es donde reside el “dilema”. El ejemplo demuestra maravillosamente que en los juegos de suma distinta de cero, el óptimo de Pareto y el equilibrio de Nash entran en conflicto.

Organiza la estructura básica del juego del dilema del prisionero para analizar el dilema del prisionero con mayor claridad. La forma general de este juego se utiliza comúnmente en economía experimental para analizar diversos temas. A continuación se muestra un ejemplo de implementación de la forma general:

Hay dos jugadores y un crupier. Cada participante recibe dos tarjetas, una con las palabras "cooperación" y "deserción" impresas. Cada participante coloca una carta con el texto boca abajo frente al crupier. Tener el texto boca abajo elimina la posibilidad de que los participantes conocieran la elección de la otra persona1.

Luego, el crupier entrega las dos cartas de participante y paga los beneficios de acuerdo con las siguientes reglas:

Una persona deserta y otra coopera: el desertor obtiene 5 puntos (tentación de traicionar) y el cooperador obtiene 0 puntos (pago por ser estafado).

Ambas personas cooperan: cada una obtiene 3 puntos (recompensa por la cooperación).

Ambos traicionan: cada uno obtiene 1 punto (penalización por traición).

Utilice una tabla de matriz de pagos para mostrar los pagos de la siguiente manera (el rojo y el azul representan a los dos jugadores respectivamente):

Matriz de pagos de la forma general del dilema del prisionero Cooperación Defección

Cooperación 3, 3 0, 5

Deserción 5, 0 1, 1

Utilice los símbolos "T, R, P, S" para indicar cooperación y deserción

Cooperación R , R S, T

Defección T, S P, P

Utilice el término "ganar-perder" para expresar cooperación y traición

La cooperación gana-gana grandes pérdidas-grandes victorias

Traición Gran ganancia-Gran pérdida-Pérdida

Se pueden sacar algunas conclusiones generales de los puntos ganados en juegos simples.

Tabla de símbolos T, R, P, S

Símbolo Puntuación Inglés Chino (sin terminología) Explicación

T 5 Tentación Tentación de traicionar Los ingresos del éxito traición sola.

R 3 Recompensa Recompensa de cooperación*** es lo mismo que el ingreso de cooperación

P 1 Castigo Castigo de traición*** es lo mismo que el ingreso de traición

S 0 Suckers fue engañado y pagado por separado Ganancias por traición

Si T (Tentación) = tentación de traicionar, R (Recompensa) = recompensa por la cooperación, P (Castigo) = castigo por traición, S (Suckers) ) = pago por haber sido engañado, en términos de puntuación de elección personal, se puede derivar la siguiente desigualdad.

Tgt; Rgt; Pgt; S

(Solución: obtener la desigualdad anterior a partir de 5gt; 3gt; 1gt; 0)

En términos de puntos generales, se obtendrá la siguiente desigualdad.

2Rgt; T S o 2Rgt; 2P

(Solución: 2×3gt; 5 0 o 2×3gt; 2x1; 2 personas cooperan para conseguir 6 puntos. Comparados entre sí. *** que desertó obtuvo 2 puntos y el *** que desertó solo obtuvo 5 puntos. Obviamente, la cooperación obtiene más puntos que la deserción es la estrategia dominante para el grupo)

Y juegos repetidos o repeticiones. El dilema del prisionero hará que los participantes pasen de centrarse en Tgt;Rgt;Pgt;S a centrarse en 2Rgt;T S. Es decir, sacará de apuros a los participantes. La teoría anterior fue creada por Douglas Hofstadter.

Ejemplo de ciencia política: carrera armamentista

En ciencia política, una carrera armamentista entre dos países puede describirse mediante el dilema del prisionero. Ambos países pueden afirmar que tienen dos opciones: aumentar sus armamentos (deserción) o llegar a un acuerdo de reducción de armas (cooperación). Ninguno de los países puede estar seguro de que el otro cumplirá el acuerdo, por lo que, en última instancia, ambos tenderán a aumentar sus armamentos. Lo que parece paradójico es que aunque aumentar los armamentos sería un comportamiento "racional" para ambos países, los resultados parecen ser "irracionales" (por ejemplo, causará daños a ambas economías). Esto puede considerarse como un corolario de la teoría de la contención, que consiste en utilizar una fuerte fuerza militar para contener el ataque del oponente con el fin de lograr la paz.

Ejemplo económico: guerra arancelaria

Dos países tienen dos opciones cuando se trata de aranceles:

Aumentar los aranceles para proteger sus propios productos. (Traición)

Llegar a un acuerdo arancelario con la otra parte para reducir los aranceles para facilitar la circulación de sus respectivas mercancías. (Cooperación)

Cuando un país no cumple con el acuerdo arancelario debido a ciertos factores y aumenta los aranceles solo (deserción), el otro país responderá de la misma manera (también deserción), lo que desencadena un arancel. guerra. Los bienes del país pierden el mercado del otro país, provocando daños a su propia economía (resultado de la misma traición).

Luego los dos países volvieron a alcanzar un acuerdo arancelario. (El resultado del juego repetido es que se encontrará que las dos partes obtienen el mayor beneficio de la cooperación).

Ejemplo de negocio: guerra publicitaria

Varios ejemplos del dilema del prisionero También aparecen en actividades empresariales. Tomemos como ejemplo la competencia publicitaria.

Dos empresas compiten entre sí y la publicidad de las dos empresas se afecta entre sí. Es decir, si la publicidad de una empresa es más aceptada por los clientes, le quitará parte de los ingresos a la otra. Sin embargo, si ambas empresas publican anuncios de calidad similar al mismo tiempo, sus ingresos aumentarán ligeramente pero sus costes aumentarán. Pero si no se mejora la calidad de la publicidad, la otra parte se quedará con el negocio.

Las dos empresas tienen dos opciones:

Llegar a un acuerdo entre sí para reducir el gasto en publicidad. (Cooperación)

Aumentar los gastos en publicidad e intentar mejorar la calidad de la publicidad para abrumar a la otra parte. (Traición)

Si las dos empresas no confían entre sí y no pueden cooperar, y la traición se convierte en la estrategia dominante, las dos empresas caerán en una guerra publicitaria y el aumento de los costes publicitarios dañará las ganancias. de las dos empresas. Este es el caso de estar atrapado en un dilema del prisionero. En realidad, es difícil para dos empresas competidoras llegar a un acuerdo de cooperación y la mayoría de ellas caerán en el dilema del prisionero.

Ejemplo de carrera ciclista

La estrategia de carrera de la carrera ciclista también es un juego, y sus resultados pueden explicarse por los resultados de la investigación del dilema del prisionero. Por ejemplo, en el Tour de Francia que se celebra cada año, se da la siguiente situación: los atletas suelen avanzar en un gran equipo (en inglés: Peloton) antes de la línea de meta. Adoptan esta estrategia para evitar quedarse demasiado atrás y quedarse atrás. en más esfuerzo. El jugador que va delante tiene más dificultades cuando se enfrenta al viento, por lo que elegir estar delante es la peor estrategia. Lo que suele suceder es que al principio nadie está dispuesto a avanzar (*** y traición), lo que hace que la velocidad general sea muy lenta, y luego, por lo general, dos o más jugadores viajan al frente y luego intercambian la posición delantera entre sí. por un período de tiempo Posición, para compartir la resistencia del viento (*** cooperación), de modo que la velocidad de todo el equipo aumente En este momento, si una de las personas al frente intenta mantener el frente. posición (traición), otros jugadores y el equipo grande se pondrán al día (*** Igual que traición). La situación habitual es que el jugador que más veces está delante (cooperación) suele ser alcanzado por el jugador de atrás (traición) al final, porque los jugadores de detrás van en la corriente de los jugadores de delante y tienen menos esfuerzo. .

Sucesos relacionados con el dilema del prisionero

[Editar este párrafo]

Fantasía

William Poundstone Poundstone, en su obra, utilizó un Ejemplo de Nueva Zelanda para ilustrar el dilema del prisionero. En Nueva Zelanda, los quioscos no tienen mantenimiento ni están cerrados. La gente que compra periódicos deja su dinero y se los lleva. Por supuesto, alguien podría tomar el periódico sin pagar (traición), pero esto rara vez sucede porque todos se dan cuenta de que si todos roban el periódico (lo mismo que traición) esto causará consecuencias inconvenientes y dañinas más adelante. Lo especial de este ejemplo es que los neozelandeses no se dejaron influenciar por ningún otro factor para escapar del dilema del prisionero. Nadie prestó especial atención al quiosco. La gente seguía las reglas para evitar las consecuencias de la traición gay. Este tipo de razonamiento o idea común para evitar el dilema del prisionero se llama "pensamiento mágico". [3]

El "declaración de culpabilidad" no es factible

La conclusión del dilema del prisionero es una de las razones por las que la negociación de culpabilidad (en inglés: plea-dealt) está prohibida en muchos países. La conclusión que trae el Dilema del Prisionero es: Si hay dos delincuentes, uno de los cuales comete un delito y el otro es inocente, el delincuente confesará todo para reducir la pena e incluso acusará injustamente al inocente (traición separada). El peor de los casos es que si ambos son condenados a prisión, el criminal confeso recibirá una sentencia menor y el acusado injustamente que mantiene su inocencia recibirá una sentencia mayor.

La tragedia de los bienes públicos

En realidad, hay más de una parte participando en el juego y habrá un dilema del prisionero que involucra a varias partes.

La tragedia de los comunes de Garrett James Hardin es un ejemplo: "La tragedia de los comunes es que la propiedad pública que pertenece al mayor número de personas es a menudo la cosa que menos se cuida", como la pesca. Los peces en alta mar pertenecen a la público, y si no pescan en exceso, otros también pescarán en exceso, por lo que los pescadores pescarán sin control. Como resultado, la ecología marina se destruye y el sustento de los pescadores también se ve afectado (* **Lo mismo que el resultado de la traición). Sin embargo, la formulación del dilema del prisionero multipartidista es cuestionable, porque siempre puede descomponerse en un conjunto de dilemas del prisionero bipartidistas clásicos. Es decir, sólo existen dilemas del prisionero bipartidistas, no multipartidistas. El llamado dilema del prisionero multipartidista es sólo una ilusión formada por la mezcla de múltiples dilemas del prisionero bipartidistas.

上篇: ¿Dónde se encuentra Jingdezhen? Hoteles, autobuses, metros, estacionamientos y restaurantes recomendados cerca de la estación Jingdezhen. 下篇: ¿Cuáles son los requisitos legales para utilizar la tarjeta de identificación de un compañero de clase para solicitar una tarjeta bancaria y solicitar un préstamo?
Artículos populares