OpenAI lanza ChatGPT Imágenes 2.0: ahora la IA puede escribir letras sin errores
La nueva herramienta de generación de imágenes de OpenAI promete mayor coherencia visual y precisión en textos densos para perfiles gratuitos y de pago.
ChatGPT optimiza finalmente la generación de imágenes y adelanta a Gemini.
ShutterstockLa empresa OpenAI presentó una actualización importante para ChatGPT. El modelo permite crear piezas visuales con un nivel de precisión técnica superior en los detalles, una de las críticas más sonadas que tenía el generador de imágenes con inteligencia artificial. Esta herramienta busca resolver los fallos históricos en la reproducción de tipografías y la organización de elementos complejos.
El nuevo sistema tiene el objetivo de transformar la creación visual en una herramienta de utilidad real para el trabajo diario. La compañía, liderada por Sam Altman, sostiene que las imágenes deben funcionar como un lenguaje y no solo como una decoración estética. Por este motivo, el modelo se enfoca en resolver encargos específicos con menos margen de error y mayor intención comunicativa.
Te puede interesar
Estados Unidos es el motivo de que todos estén desinstalando ChatGPT
El razonamiento aplicado a la generación de imágenes
Una de las características más relevantes de este lanzamiento es la capacidad de razonamiento previo a la ejecución. Cuando el usuario selecciona el modo de pensamiento dentro de ChatGPT, el sistema estructura la tarea antes de empezar a dibujar. El modelo puede buscar información actualizada en la web para asegurar que los elementos del entorno sean correctos. Por ejemplo, al pedir una imagen de una calle específica de Madrid, el software revisa los detalles geográficos actuales para ganar realismo.
-
Te puede interesar
Se cayó ChatGPT: miles de usuarios no pueden usar la IA
Esta función de "pensar antes de dibujar" permite que la IA revise sus propios resultados intermedios. El proceso asegura que la disposición de los objetos en el espacio respete las leyes de la perspectiva y las proporciones físicas. Las pruebas realizadas muestran una mejora notable en la creación de storyboards y viñetas de cómics donde la continuidad de los personajes es fundamental para la narrativa.
Nuevas capacidades técnicas de la IA de OpenAI
La actualización técnica abarca tres frentes que antes presentaban dificultades para estos modelos. Primero, la reproducción de texto denso ahora es fiable en varios idiomas, incluyendo caracteres no latinos como el japonés o el hindi. Segundo, el sistema organiza mejor los elementos dentro de la composición, evitando que los objetos se encimen de forma poco natural. Tercero, la calidad final de los archivos alcanza una resolución de 2K.
La herramienta también amplía los formatos disponibles para los creadores. El sistema permite generar piezas con proporciones de hasta 3:1 o 1:3, lo que resulta útil para banners de sitios web o redes sociales. Además, OpenAI habilitó la posibilidad de crear hasta diez imágenes dentro de una misma petición. Esto facilita el prototipado de juegos o el diseño de materiales de marketing que requieren una estética unificada en toda la serie de piezas.
El despliegue de ChatGPT Imágenes 2.0 ya comenzó para las cuentas gratuitas y las versiones de pago Plus y Pro. La firma también llevó este modelo a su API para que los desarrolladores puedan integrarlo en sus propias aplicaciones. En un mercado donde Midjourney y FLUX 2 compiten por el fotorrealismo, esta propuesta busca ganar terreno mediante la utilidad práctica y el flujo de trabajo integrado.



