¿Conoces el Dilema del Prisionero? En pocas palabras se trata del conflicto entre el beneficio individual y el común, donde la estrategia dominante suele llevar a un resultado peor para ambos que si hubieran cooperado. Bueno, hicieron un experimento en el cual debes escoger uno de dos botones, rojo o azul. Si más del 50% de participantes eligen azul, todos sobreviven. Si menos del 50% eligen azul, solo sobreviven quienes apretaron el rojo. No hay comunicación entre participantes, ni datos sobre elecciones ajenas.
Resultados Humanos
De casi 100,000 personas que votaron, el 58% eligió azul. Eso significa que apenas una delgada mayoría de humanos optó por la elección cooperativa y altruista —apostando a que suficientes de sus semejantes harían lo mismo para inclinar la balanza hacia la supervivencia colectiva.
¿Cuál es el truco?
Las dos opciones tienen implicaciones muy distintas.
Azul es la elección cooperativa. Al apretar azul, apuestas a que los instintos cooperativos de la humanidad son lo suficientemente fuertes para superar el umbral del 50%. Aceptas un riesgo real: si menos de la mitad aprieta azul, los azul mueren mientras los rojos sobreviven. Es la apuesta altruista —solo funciona si suficientes toman el riesgo contigo.
Rojo es la elección individualmente "segura", en un sentido estrecho. Sin importar qué pase, los rojos sobreviven. Pero aquí está el truco: si todos razonan así —"aprieto rojo por estar seguro"— el voto azul colapsa, todos mueren excepto los rojos, y el resultado es catastróficamente peor para la humanidad entera. Rojo es la estrategia de deserción en el marco del Dilema del Prisionero: racional para un individuo, desastrosa para el colectivo.
La pregunta también prueba lo que los economistas llaman conocimiento común. ¿Confías en que suficientes otros razonarán como tú? Los azul apuestan por una norma cooperativa compartida. Los rojos son pesimistas sobre esa norma, o priorizan su supervivencia individual sin importar qué diga de sus valores.
¿Cómo reaccionaron las IAs?
Jan Kulveit de ACS, pasó la misma pregunta por un amplio rango de LLMs realizando 30 pruebas por modelo con un prompt estandarizado. Los resultados revelan patrones impactantes —y divisiones notables.
Si pensabas que las dudas existenciales eran propias de los humanos... llegó el tiempo de reevaluar.
.jpg)

