22.04.2026
3

ChatGPT Images 2.0 — un salto en la evolución de los visuales de IA

Yuliia Zablotska
Autora en ApiX-Drive
Tiempo de leer: ~2 min

OpenAI ha lanzado ChatGPT Images 2.0, una importante actualización que replantea la generación de imágenes como un sistema estructurado basado en lenguaje, en lugar de una simple herramienta de salida visual. El modelo se centra en la precisión, la utilidad práctica y la capacidad de abordar tareas visuales complejas con una mínima necesidad de indicaciones.

Integrado en ChatGPT, Images 2.0 mejora el cumplimiento de instrucciones, la colocación espacial de elementos y la representación de detalles finos como tipografía pequeña, interfaces y composiciones densas. Es capaz de crear maquetaciones editoriales pulidas, páginas manuscritas fotorrealistas con imperfecciones naturales como manchas de café, o carteles cinematográficos inspirados en la estética de la Nueva Ola francesa de los años 60.

Una mejora clave es su capacidad de razonamiento, que amplía sus funciones más allá de la generación en un solo paso. Activada esta opción, puede usar información en tiempo real, generar múltiples imágenes a partir de un mismo prompt y verificar sus resultados. Esto permite crear conjuntos visuales coherentes, como secuencias de cómics o campañas publicitarias completas en una sola solicitud.

El sistema también muestra una mayor comprensión contextual, siendo especialmente eficaz para explicaciones, material educativo y resúmenes visuales donde la claridad y la estructura son tan importantes como la estética. Puede gestionar procesos completos de principio a fin, desde la interpretación de la información hasta su organización en jerarquías visuales claras.

Images 2.0 mejora además la precisión multilingüe, manejando con mayor fiabilidad sistemas de escritura no latinos como el japonés y el hindi. Junto con una mayor consistencia estilística, permite generar desde imágenes fotorrealistas hasta ilustraciones tipo manga o pósters vintage.

Con soporte para diferentes relaciones de aspecto y hasta 2K de resolución vía API, el modelo es adecuado para marketing, infografías y diseño de producto. Está disponible en ChatGPT, Codex y la API, con funciones avanzadas para usuarios Plus, Pro y Business, mientras que el precio depende de la calidad y la resolución.