OpenAI explica por qué sus modelos mencionan duendes y criaturas mitológicas
La organización OpenAI admitió que el entrenamiento de la personalidad "Nerdy" provocó respuestas extrañas sobre gnomos y duendes en su modelo GPT-5.1.
El problema de ChatGPT con los orcos y goblins.
ShutterstockLa organización tecnológica OpenAI publicó un comunicado para aclarar la aparición repentina de términos relacionados con criaturas fantásticas en sus servicios. Este fenómeno técnico afectó las respuestas del modelo ChatGPT-5.1 y de la herramienta de programación. Los ingenieros detectaron que las señales de recompensa durante el entrenamiento causaron este comportamiento.
El origen de los errores en ChatGPT-5.1
La compañía detalló en su blog oficial que el inconveniente nació con la creación de la personalidad opcional denominada "Nerdy" para su chat. Esta configuración incentivó de forma involuntaria el uso de un léxico asociado a la cultura de fantasía y juegos de rol. Aunque retiraron esta personalidad en marzo, el entrenamiento previo dejó una huella persistente en la lógica del sistema.
Te puede interesar
Se cayó ChatGPT: miles de usuarios no pueden usar la IA
Varios usuarios de la plataforma X reportaron capturas de pantalla donde el asistente utilizaba frases sobre "modo duende" o "gremlins de rendimiento" en contextos estrictamente técnicos. Por ejemplo, el modelo llegó a recomendar equipos de fotografía para obtener un estilo de "duende de neón" o hablaba de "ancho de banda de duende" para referirse a la velocidad de conexión. Los investigadores de la firma advirtieron que los términos "goblin" y "gremlin" crecieron en frecuencia entre la versión inicial de ChatGPT-5.1 y las pruebas posteriores. Este caso sirve para demostrar cómo los estímulos durante el aprendizaje pueden alterar el resultado final de forma inesperada.
La restricción en Codex y el impacto en redes sociales
Para solucionar este desvío en el comportamiento del software, los desarrolladores incluyeron una instrucción restrictiva en el código fuente de Codex. El manual de instrucciones para este modelo de programación ahora indica explícitamente que el sistema no debe hablar sobre duendes, gremlins, trolls u ogros. Esta prohibición aparece cuatro veces en el código para asegurar que el modelo se mantenga en un tono profesional y no mencione animales o criaturas fuera de contexto.
El fenómeno se transformó rápidamente en un meme dentro de internet. Muchos usuarios bromearon con el término "goblin mode", que alcanzó popularidad en el año 2022. Incluso Sam Altman, director de la empresa, participó de los comentarios públicos al mencionar que Codex estaba pasando por un "momento duende". La cuenta oficial del servicio en redes sociales también modificó su descripción biográfica para incluir las advertencias de seguridad sobre estas criaturas mitológicas.
A pesar del tono humorístico de la situación, algunos analistas de mercado criticaron la gestión de la empresa y calificaron la respuesta como inusual. El incidente resalta los desafíos que enfrentan los desarrolladores para controlar la personalidad de los asistentes digitales a medida que se vuelven más complejos y creativos. Por ahora, el bloqueo estricto en Codex sigue vigente mientras el equipo técnico ajusta las futuras versiones del sistema para evitar nuevos errores de este tip




