¿A quién no le gustaría borrar en segundos a esa persona que arruinó la selfie, transformar un dibujo en una foto realista sin abrir Photoshop o tener una foto con Lionel Messi para publicar en redes? Google acaba de sumar a su inteligencia artificial Gemini una función llamada Nano Banana, que permite generar y editar imágenes con simples instrucciones de texto.
El curioso nombre, que empezó a circular como una broma en foros especializados de inteligencia artificial, captó rápidamente la atención de los usuarios. Detrás de esta etiqueta se esconde Gemini 2.5 Flash Image, el nuevo modelo de generación y edición de imágenes que Google integró en su IA.
La propuesta busca competir de lleno con herramientas como DALL·E de OpenAI, pero con un plus: aprovecha el conocimiento mundial de Gemini, lo que le permite no solo generar imágenes a partir de instrucciones de texto, sino también comprender el contexto de lo que se le pide.
Cómo funciona la Nano Banana

La función ya está disponible gratis en la app de Gemini, tanto en móviles como en versión web, aunque con límites de uso diarios que se renuevan. Para usos más avanzados, también se ofrece mediante la API de Gemini y Google AI Studio.
Una vez en la interfaz de Gemini en celulares o navegadores, solo habrá que subir una foto para comenzar a explotar las características de este novedoso editor. Luego, en el cuadro de diálogo, escribir la orden o prompt para cambiar algún detalle, o agregarle para generar un nueva y única imagen.
De cualquier manera, Gemini tiene la capacidad hasta de combinar fotos para crear nuevas e inexistentes con una mascota, una estrella del deporte o el espectáculo y hasta una situación fuera de lo común.
Al subirlas a la plataforma, el modelo intenta mantener en todo momento el aspecto en todas las imágenes mientras cambia de escenarios.
Esta función es tan versátil que permite cambiar el fondo de una habitación para ver cómo quedaría con un nuevo color. Por ejemplo,el modelo puede pintar virtualmente las paredes de una habitación vacía y, luego, agregar una biblioteca, algunos muebles o una mesa de café para ver el resultado final.

Incluso, aplica el estilo de una imagen a un objeto en otra. Se puede tomar el color y la textura de los pétalos de una flor y aplicarlos a un par de botas de lluvia, o diseñar un vestido con el patrón de las alas de una mariposa.
También elegir entre diferentes cortes de pelo para ver cuál es el correcto o colocar al protagonista en cualquier lugar del mundo.
Por otro lado, Google advierte que las imágenes creadas o editadas por el modelo Gemini 2.5 Flash Image que incluyen una marca de agua visible, así como una marca de agua digital invisible SynthID, para mostrar claramente que se generaron con IA.
Un nuevo paso en la carrera de la IA visual
Con Nano Banana, Google busca posicionarse frente a OpenAI –el mismo de Studio Ghibli-y otras empresas que ya ofrecen generación de imágenes. La diferencia está en la rapidez (las ediciones se hacen casi al instante), la coherencia visual y la facilidad de uso.

Josh Woodward, vicepresidente de Google Labs y Google Gemini, publicó recientemente las cifras de este furor por las imágenes virtuales en un posteo en X. Desde su lanzamiento, la app ganó más de 10 millones de usuarios y 200 millones de imágenes creadas.
Para lograr este nivel de resultados, el gigante de internet incursionó en la generación nativa de imágenes con el modelo Gemini 2.0 Flash, pero Nano Banana llevó la experiencia más lejos: mayor calidad, coherencia y control creativo.
Para los usuarios comunes, la ventaja es poder editar fotos o crear ilustraciones con la misma facilidad con la que se manda un mensaje de WhatsApp. Para empresas y desarrolladores, abre la posibilidad de generar catálogos, campañas y prototipos visuales en segundos, con un costo mucho menor al de las herramientas tradicionales.