| Artículos | 01 SEP 1996

¿Cooperación, traición o venganza?

Tags: Histórico
Eloy Anguiano.

El vecino ha puesto la música demasiado alta?, ¿qué hace usted, la pone también alta o se espera a una mejor ocasión para vengarse?, ¿es usted un bonachón y aguanta todo? o ¿es usted el que pone siempre la música demasiado alta?

Usted se estará preguntando qué tiene todo esto que ver con los ordenadores. En estas líneas voy a proponerle un pequeño experimento que es difícil de llevar a cabo sin un ordenador por el número de cálculos necesarios. Este experimento le servirá para determinar la mejor estrategia para salir, a largo plazo, lo menos perjudicado posible.

El cálculo que vamos a realizar con el ordenador está basado en el famoso dilema del prisionero. Hagamos un poco de memoria. Dos ladrones roban un banco, poco después los detiene la policía. En la detención se descubre que ambos llevan armas sin licencia pero no se encuentra ninguna prueba incriminatoria. La pena por posesión de armas sin licencia es de dos años. A los dos ladrones por separado se les plantea que si incriminan a su compañero, se le perdonará la pena por posesión y que al otro le caerán 5 años. Ellos no saben que si ambos confiesan la pena será de cuatro años para ambos (un año de reducción por cooperar con la justicia). ¿Qué haría usted?, ¿qué piensa que sería lo más beneficioso?

El caso de los prisioneros es muy problemático puesto que sólo hay una posibilidad de prueba (puesto que no van a ir mil veces a la cárcel). Sin embargo, el caso expuesto al principio sí que puede darse miles de veces en unos pocos años y por lo tanto, podríamos determinar qué estrategia es la menos perjudicial individual y colectivamente.

Para llevar a cabo este experimento es necesario asignar un valor a cada uno de los posibles sucesos. Supongamos que escuchar música a nuestro gusto sin que el vecino nos moleste con otra puede valorarse en 5 puntos (B), mientras que nuestro vecino se aguanta y por tanto tiene 0 puntos (M). Por otro lado, si ambos cooperamos y nos aguantamos sin escuchar música tendremos un rato tranquilo y por tanto puede ser valorable con 3 puntos (C). Si ambos ponemos música, la podemos escuchar mezclada con esa molesta música del vecino (el dirá lo mismo, por supuesto) y por tanto tenemos 1 punto porque al menos escuchamos lo que queremos aunque mal (A).

Para que exista una competencia entre los distintos comportamientos es necesario que se cumpla que

(B+M)/2A < C

donde las letras representan los valores de cada opción tal y como se muestra en el párrafo anterior.

En el caso de los presos parece que no existe dilema porque no se cumple esta ley. Sin embargo no es así; puesto que no es bueno cumplir años en la cárcel, los valores de las variables son los años con valor negativo. Siendo así, se puede comprobar que la condición se cumple.

Para el caso que nos ocupa existen muchas posibles estrategias; voy a presentar sólo algunas de ellas y las más fáciles de definir. La primera de ellas es la del BONACHÓN que es el que siempre coopera (no pone música). La segunda es también muy sencilla, la del MALVADO (siempre pone música). El LUNÁTICO es el que coopera o traiciona aleatoriamente. El RENCOROSO, que coopera siempre hasta que se le traiciona y a partir de ese momento siempre traiciona. El DEMOCRÁTICO-BONACHÓN que siempre hace lo que haya hecho más veces el adversario y en caso de empate coopera. El DEMOCRÁTICO-MALVADO, que actúa igual que el caso anterior salvo que en caso de empate traiciona. El OJO-POR-OJO, que empieza cooperando y después actúa siempre como lo ha hecho el adversario en el caso anterior. El DESCONFIADO, que empieza traicionando y se comporta como el OJO-POR-OJO después. Éstos son sólo algunas de las posibles estrategias que puede seguir un individuo; usted puede inventarse tantas como quiera para realizar el experimento.

A partir de aquí vamos a empezar a jugar una serie de partidas entre todas las posibles parejas para asociarles una puntuación. Esta serie puede ser, por ejemplo, de 1.000 partidas en las que se van sumando las puntuaciones obtenidas en cada partida.

Una vez que haya realizado todas las posibles confrontaciones podrá observar dos cosas claramente. La primera es que la actitud MALVADA siempre gana a su oponente, es decir siempre saca mejor resultado en sus confrontaciones que cualquiera de sus oponentes. Sin embargo, la suma de las puntuaciones es de las peores posibles.

El segundo resultado claro es que la táctica de OJO-POR-OJO nunca gana pero la suma de sus puntuaciones es la mejor posible.

A partir de aquí surge una duda importante y es la definición de "táctica beneficiosa".¿ La táctica más beneficiosa es la que saca una puntuación mayor independientemente de con quién se enfrente? o ¿es aquella que gana todas sus confrontaciones?

Si nos fijamos en qué significa una puntuación media mayor descubriremos cuál es la actitud más beneficiosa. Una puntuación media mayor significa, en nuestro caso, un ambiente más agradable en general sin grandes problemas con nuestros vecinos independientemente de su actitud.

Para comprobar esto con más claridad aún, vamos a desarrollar el mismo juego de tal forma que ahora se parte con 100 individuos de cada carácter. Una vez jugadas las mil partidas la población de cada estrategia crece o decrece de acuerdo con los puntos totales obtenidos. De alguna forma se está simulando un proceso natural de selección de actitudes.

Una vez realizado este proceso se presenta en una gráfica el número de individuos en cada generación. Como podrá comprobar, en tan sólo 15 generaciones todas las actitudes excesivamente malvadas o rencorosas desaparecen. También se puede comprobar que la actitud BONACHONA tiende a desaparecer pero muy lentamente y que tan sólo las actitudes de tipo OJO-POR-OJO entre las que se encuentra la DEMOCRÁTICA-BONACHONA sobreviven aumentando su población, siendo siempre la de OJO-POR-OJO pura la que crece de una forma más clara.

Este simple experimento con un ordenador puede explicar cómo se pueden asociar beneficiosamente especies animales con muy escasa inteligencia en las que sus respuestas a estímulos externos se encuentra claramente tipificada y es invariable. Supongamos por ejemplo que las anémonas y los cangrejos ermitaños se comportan con la técnica OJO-POR-OJO y que si cooperan tienen algo que ganar. Inicialmente ambas especies empiezan cooperando. Como son OJO-POR-OJO, las dos también lo harán en la siguiente interacción puesto que su oponente lo hizo en la interacción anterior. Por tanto, ambas se comportan bonachonamente sin ser esa su actitud.

Le invito a hacer una reflexión sobre estos resultados y el comportamiento humano. Este es un claro ejemplo de cómo la informática puede servir para conocernos a nosotros mismos y a lo que nos rodea.

Bibliografía

- R. Dawkins. "El Gen Egoista". Biblioteca científica Salvat, Barcelona 1985.

-J. Holland, "Les algorithmes genetiques". Pour la Science, 179, pp. 44-51. Septiembre 1992

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información