ver más

OpenAI lanza ChatGPT Imágenes 2.0: ahora la IA puede escribir letras sin errores

La nueva herramienta de generación de imágenes de OpenAI promete mayor coherencia visual y precisión en textos densos para perfiles gratuitos y de pago.


La empresa OpenAI presentó una actualización importante para ChatGPT. El modelo permite crear piezas visuales con un nivel de precisión técnica superior en los detalles, una de las críticas más sonadas que tenía el generador de imágenes con inteligencia artificial. Esta herramienta busca resolver los fallos históricos en la reproducción de tipografías y la organización de elementos complejos.

El nuevo sistema tiene el objetivo de transformar la creación visual en una herramienta de utilidad real para el trabajo diario. La compañía, liderada por Sam Altman, sostiene que las imágenes deben funcionar como un lenguaje y no solo como una decoración estética. Por este motivo, el modelo se enfoca en resolver encargos específicos con menos margen de error y mayor intención comunicativa.

ChatGPt Japan

ChatGPT ahora puede generar textos largos y complejos dentro de las imágenes sin deformar las letras.

El razonamiento aplicado a la generación de imágenes

Una de las características más relevantes de este lanzamiento es la capacidad de razonamiento previo a la ejecución. Cuando el usuario selecciona el modo de pensamiento dentro de ChatGPT, el sistema estructura la tarea antes de empezar a dibujar. El modelo puede buscar información actualizada en la web para asegurar que los elementos del entorno sean correctos. Por ejemplo, al pedir una imagen de una calle específica de Madrid, el software revisa los detalles geográficos actuales para ganar realismo.

Esta función de "pensar antes de dibujar" permite que la IA revise sus propios resultados intermedios. El proceso asegura que la disposición de los objetos en el espacio respete las leyes de la perspectiva y las proporciones físicas. Las pruebas realizadas muestran una mejora notable en la creación de storyboards y viñetas de cómics donde la continuidad de los personajes es fundamental para la narrativa.

Nuevas capacidades técnicas de la IA de OpenAI

La actualización técnica abarca tres frentes que antes presentaban dificultades para estos modelos. Primero, la reproducción de texto denso ahora es fiable en varios idiomas, incluyendo caracteres no latinos como el japonés o el hindi. Segundo, el sistema organiza mejor los elementos dentro de la composición, evitando que los objetos se encimen de forma poco natural. Tercero, la calidad final de los archivos alcanza una resolución de 2K.

ChatGPT imágenes

La nueva función de ChatGPT permite crear carteles y gráficos con textos legibles.

La herramienta también amplía los formatos disponibles para los creadores. El sistema permite generar piezas con proporciones de hasta 3:1 o 1:3, lo que resulta útil para banners de sitios web o redes sociales. Además, OpenAI habilitó la posibilidad de crear hasta diez imágenes dentro de una misma petición. Esto facilita el prototipado de juegos o el diseño de materiales de marketing que requieren una estética unificada en toda la serie de piezas.

El despliegue de ChatGPT Imágenes 2.0 ya comenzó para las cuentas gratuitas y las versiones de pago Plus y Pro. La firma también llevó este modelo a su API para que los desarrolladores puedan integrarlo en sus propias aplicaciones. En un mercado donde Midjourney y FLUX 2 compiten por el fotorrealismo, esta propuesta busca ganar terreno mediante la utilidad práctica y el flujo de trabajo integrado.