ChatGPT demuestra mayor precisión y coherencia en generación de imágenes, mientras que Midjourney destaca en estilo y estética tras sus últimas actualizaciones
Descubre cómo las recientes actualizaciones de ChatGPT y Midjourney mejoran sus capacidades para crear imágenes con IA, destacando precisión y estilo.

Recientemente, tanto Midjourney en su versión 7 como ChatGPT en su tercera generación han lanzado actualizaciones que marcan un importante avance en el campo de los generadores de imágenes con inteligencia artificial. Ambos modelos se consideran referencias en su ámbito, habiendo abierto caminos innovadores en la creación visual mediante IA.
Tras realizar siete pruebas con diferentes prompts que consideraban contexto, detalles y creatividad, se pudo observar que ChatGPT muestra una mayor precisión para entender instrucciones y mantener la coherencia en las tareas solicitadas. Por otro lado, Midjourney destaca especialmente en estilo y estética, ofreciendo imágenes con alto nivel creativo y visual, aunque con ciertos errores o detalles imprecisos que aún están por perfeccionar.
En cuanto al rendimiento en detalles específicos, Midjourney ha mejorado en aspectos anatómicos y objetos en las imágenes generadas, pero continúa enfrentando dificultades para crear textos claros dentro de las escenas. ChatGPT, aún en desarrollo, logra cumplir con tareas complejas y produce retratos, posters y textos con buena calidad, aunque presenta margen de mejora en la precisión de detalles finos.
Por ejemplo, en una prueba que solicitaba una imagen fotorrealista de un fraile volando sobre un acantilado con agua y en el fondo una cadena montañosa, ChatGPT ofreció una interpretación que cumplía con la mayoría de las instrucciones de manera más precisa, mientras que Midjourney, aunque incluía todos los elementos, exhibía un tamaño exagerado del animal y un estilo más parecido a una pintura al óleo que a una fotografía realista.
En otra prueba, que pedía una escena con un mercado grande, detalles en los puestos y en la interacción humana, ChatGPT generó una imagen con alta calidad y precisión en los aspectos clave. Midjourney, aunque lograba captar la escena, presentaba detalles borrosos y caras incompletas al hacer zoom, demostrando aún limitaciones en la fidelidad en detalles finos.
En cuanto a tareas más creativas, como transformar una imagen en un retrato renacentista, ChatGPT reprodujo con fidelidad el estilo de obras como La Mona Lisa, manteniendo las características originales en un estilo clásico, mientras que Midjourney mostró dificultades para completar el estilo solicitado y presentó resultados intermedios o parcialmente adecuados.
En la creación de carteles o posters, ChatGPT se destacó por completar correctamente los textos y ofrecer un diseño coherente, en contraste con Midjourney, que generó imágenes impactantes en estilo pero con textos ilegibles y detalles poco claros, demostrando aún limitaciones en la integración de contenido textual en las escenas.
Finalmente, en pruebas específicas como la representación de manos con objetos, ambos modelos lograron avances significativos. Midjourney mostró un dominio notable en detalles anatómicos y texturas, logrando creaciones casi indistinguibles de manos humanas, mientras que ChatGPT también alcanzó buenos niveles de precisión, aunque todavía con pequeñas imprecisiones en algunos dedos.
En resumen, ambas plataformas avanzan rápidamente y, si bien cada una destaca en diferentes aspectos—estética y creatividad en Midjourney, precisión y coherencia en ChatGPT—se espera que futuras mejoras en versiones posteriores potencien aún más sus capacidades, permitiendo que ambas tecnologías puedan complementarse eficazmente en el futuro cercano.