Uno de los casos de uso de la inteligencia artificial que más interés está despertando es la generación y edición de imágenes. Los resultados son espectaculares, desde crear cambios de look hasta convertir las fotos en hologramas. En este punto hay un nombre que está brillando con luz propia: Nano Banana.
Pero no solo existe Gemini. ChatGPT también tiene mucho que decir en esta historia y también ha mejorado bastante su modelo de imágenes. Los hemos enfrentado en diferentes escenarios para ver cómo responde cada uno de ellos y cuál es, a día de hoy, la mejor opción.
Para que jueguen en igualdad de oportunidades, hemos usado en los dos casos las versiones gratuitas de ambas aplicaciones.
Gemini vs ChatGPT: así rinden cada uno para generar imágenes desde cero
En el caso de la creación de imágenes desde cero, lo mejor es enviar un prompt con el máximo de detalles posible para que la fotografía o dibujo quede exactamente como la necesitas.
Prompt: «Crea una imagen de una casa con fachada blanca, un tejado marrón a dos aguas, una chimenea, dos ventanas con rejas y una puerta. La casa está ubicada en el campo y en el cielo quiero que aparezca una nube en la parte derecha y el sol en la parte izquierda. Junto a la casa hay un buzón estilo americano y un perro».
Es curioso ver como cada IA lo interpreta a su manera. Vemos un cambio en la tonalidad del color, en la perspectiva de la imagen y en el perro. Mientras que Gemini ha elegido una opción más realista, ChatGPT ha optado por un estilo más vintage.
Comparamos cómo editan imágenes Gemini y ChatGPT
En el terreno de la edición de imágenes, también hemos querido escribir el mismo ‘prompt’ y utilizar las mismas fotografías en ambas IAs para valorar los resultados. Una tónica común que hemos encontrado es que ChatGPT es bastante más lento que Gemini.
Cambio de look:
Es uno de los usos más curioso de la inteligencia artificial: pedirle que sea tu propio estilista y te muestre cómo te quedaría un pelo diferente antes de pasar por la peluquería. En este caso, les he dado a ambos una foto mía actual y le he pedido un cambio.
Prompt: «Enséñame cómo me quedaría el pelo rizado, con mechas rubias y con flequillo».
El resultado es indiscutiblemente mejor en Gemini. No solo ha aplicado un pequeño cambio de enfoque de la cámara, el pelo se ve mucho más natural y consistente. En el caso de ChatGPT, ha cambiado las facciones del rostro haciendo que no reconozca para nada, además de aplicar un efecto de luz que ni se le ha pedido ni favorece a la imagen.
Obras de arte:
Otra de las opciones de edición de imágenes es la posibilidad de convertir fotografías en obras de arte de pintores reconocidos. Por ejemplo, he querido convertir una foto de uno de mis viajes en una obra de Andy Warhol.
Prompt: «Inspírate en la forma de pintar de Andy Warhol para editar esta foto».
Realmente ninguna de las dos opciones me parecen excepcionales, pero de nuevo vuelve a ganar Gemini por un simple detalle: ChatGPT ha añadido un efecto de puntillismo que no tiene nada que ver con el artista.
Restaura fotos antiguas:
Otra de las utilidades más interesantes de la edición de fotografías con IA es la de recuperar fotos viejas y mejorar su calidad. En este ejemplo, he probado con una fotografía de un banco de imágenes.
Prompt: «Restaura esta foto antigua y ponla a color».
Sí que me parece más realista la creación de ChatGPT, aunque se ha «inventado» imagen en la parte inferior y tiene algo más de ruido, pero teniendo en cuenta que es una restauración de una imagen antigua casi que me parece más atractivos los tonos que ha elegido respecto a la elección de Gemini.
Mi veredicto: ChatGPT lo hace muy bien (casi siempre), pero Nano Banana va un paso por delante
En general, me han gustado más los resultados de Gemini: son más realistas y se ajustan bastante mejor al prompt que le indiques. La inteligencia artificial de OpenAI no lo hace tampoco nada mal y ha mejorado mucho en los últimos meses.
Un tema importante es que la versión gratuita de Gemini tiene un límite mucho más generoso: mientras que Nano Banana permite generar y editar hasta 100 imágenes por día, ChatGPT solo te permite hacer hasta cinco imágenes por día. Solo por este punto ya está clara mi elección
En Xataka Android | Nano Banana es bestial para convertir fotografías normales y corrientes en obras de arte
En Xataka Android | Si Gemini ya era bueno haciendo stickers de WhatsApp, Nano Banana consigue maravillas. En segundos tienes tu pack
–
La noticia
Gemini es la mejor generando imágenes, pero ChatGPT no se queda atrás. Las he enfrentado para comprobarlo
fue publicada originalmente en
Xataka Android
por
Noelia Hontoria
.