Gemini Nano Banana mejora la consistencia y el control de la edición de imágenes a escala para empresas, pero no es perfecto

¿Quieres ideas más inteligentes en tu bandeja de entrada? Regístrese en nuestros boletines semanales para obtener solo lo que importa a los líderes de IA, datos y seguridad empresariales. Suscríbete ahora Google lanzó Gemini 2.5 Flash Image, un nuevo modelo que muchos usuarios beta conocían como nanobanana, lo que brinda a las empresas más opciones para proyectos creativos. Les permite cambiar el aspecto de las imágenes que necesitan rápidamente y con más control que los modelos anteriores ofrecidos. El modelo se integrará en la aplicación Gemini. El modelo, construido sobre Gemini 2.5 Flash, agrega más capacidades a la edición de imágenes nativas en la aplicación Gemini. La imagen flash Gemini 2.5 mantiene las semejanzas de caracteres entre diferentes imágenes y tiene más consistencia al editar imágenes. Si un usuario carga una foto de su mascota y luego le pide al modelo que cambie el fondo o agregue un sombrero a su perro, la imagen flash Gemini 2.5 lo hará sin alterar el tema de la imagen. «Sabemos que al editar fotos de usted o personas que conoces bien, las fallas sutiles son importantes, una representación que está» cercana pero no igual «no se siente bien», dijo Google en una publicación de blog escrita por Gemini Apps Generation Multimodal Generation Lead David Sharon y Google DeepMind Gemini Image Product Nicole Brichtova. «Es por eso que nuestra última actualización está diseñada para hacer fotos de sus amigos, familiares e incluso sus mascotas se parecen constantemente a sí mismas». AI Scaling alcanza sus límites de potencia de límites, el aumento de los costos de los tokens y los retrasos de inferencia están remodelando Enterprise AI. Únase a nuestro salón exclusivo para descubrir cómo son los mejores equipos: convertir la energía en una ventaja estratégica arquitectando una inferencia eficiente para las ganancias de rendimiento real que desbloquean el ROI competitivo con sistemas de IA sostenibles asegura su lugar para mantenerse a la vanguardia: https://bit.ly/4MWGNGO One One One Enterprise y algunos usuarios individuales tuvieron que cuando avisar las ediciones en imágenes generadas por AI, alteran los pisos que alteran los fotos demasiado. Por ejemplo, alguien puede instruir al modelo para que mueva la posición de una persona en la imagen, y aunque el modelo hace lo que se le dice, la cara de la persona se altera ligeramente. Todas las imágenes generadas en Gemini incluirán la marca de agua Synthid de Google. El modelo está disponible para todos los usuarios pagados y gratuitos de la aplicación Gemini. La especulación de que Google planea lanzar un nuevo modelo de imagen funcionó rampante en las plataformas de redes sociales. Los usuarios de LM Arena vieron un nuevo modelo misterioso llamado Nanobanana que siguió «instrucciones complejas y de varios pasos con una precisión impresionante», como lo expresó la socia de Andressen Horowitz, Justine Moore. El misterioso modelo de edición de imágenes llegó a la arena? «Nano-Banana» te permite subir dos imágenes y indicarlas para combinarlas. Puede seguir instrucciones complejas y de varios pasos con una precisión impresionante. pic.twitter.com/ylu54w7Ge4— Justine Moore (@Venturetwins) 17 de agosto de 2025 Las personas pronto notaron que el modelo de Nanobanana parecía provenir de Google antes de que varios evaluadores tempranos lo confirmaron. Aunque en ese momento, Google no confirmó lo que planeaba hacer con el modelo en LM Arena. ¡Nano-Banana son plátanos! ? En serio, tomó solo mi foto de perfil y este aviso: «Media Shot of the Man frente a la cámara tocando la guitarra en un escenario en un bar» ¿Qué modelo es este? ¡Apuesto a Imagen 5! ? ¿Alguna suposición? pic.twitter.com/saqrcdw2zl— Anis Aydar (@anisaydar) 15 de agosto de 2025 Nanobanana de Google? se trata de la caída de un modelo de IA que ofrece ediciones de Photoshop de nivel Pro en segundos, con solo texto. Esta es la próxima generación de lo que «filtros» se nos ha prometido para siempre. Este es un hilo de 10 ejemplos: cambiar las expresiones faciales y el clima.1/11 pic.twitter.com/m8wcf7jftnt-deedia (@deedyDas) 23 de agosto, 2025 hasta esta semana, lo que saldría el modelo, lo que continuará, lo que continuará, lo que saldría el modelo, lo que saldría el modelo, el 23 de agosto) hasta esta semana, lo que saldría el modelo. es profético en cierto modo. Gran parte de la emoción se produce como la lucha entre los proveedores de modelos para ofrecer imágenes y ediciones más capaces y realistas, mostrando cuán poderosos se han vuelto los modelos multimodales. Sin embargo, Google todavía necesita luchar contra rivales como Qwen y su recientemente lanzado Qwen-Image Edit y OpenAI, que agregó edición de imágenes de IA nativa a ChatGPT y también puso el modelo a disposición de API. Por supuesto, Adobe, considerado durante mucho tiempo uno de los líderes en el espacio de edición de imágenes, agregó su modelo insignia Firefly a Photoshop y sus otras plataformas de edición de fotos. La edición de imágenes nativas de Gemini agregó la edición de imágenes de IA nativas en Gemini en marzo, que ofreció a los usuarios gratuitos de la plataforma de chat. Llevar funciones de edición de imágenes directamente a la plataforma de chat permitiría a las empresas arreglar imágenes o gráficos sin mover Windows. Los usuarios pueden subir una foto a Gemini, luego decirle al modelo qué cambios desean. Una vez que están satisfechos, las nuevas imágenes se pueden volver a cargar a Géminis y convertirse en un video. Además de agregar un disfraz o un cambio de ubicación, la imagen flash Gemini 2.5 puede combinar diferentes fotos, ofrece edición de múltiples vueltas y mezclar estilos de una imagen a otra. Insights diarias sobre casos de uso de negocios con VB diariamente Si desea impresionar a su jefe, VB Daily lo tiene cubierto. Le damos la cuenta interior de lo que las empresas están haciendo con la IA generativa, desde cambios regulatorios hasta implementaciones prácticas, por lo que puede compartir ideas para el ROI máximo. Lea nuestra Política de privacidad Gracias por suscribirse. Mira más boletines de VB aquí. Ocurrió un error.

Todo lo que necesitas saber sobre tecnología

Gemini Nano Banana mejora la consistencia y el control de la edición de imágenes a escala para empresas, pero no es perfecto

Deja una respuesta Cancelar la respuesta

Gemini Nano Banana mejora la consistencia y el control de la edición de imágenes a escala para empresas, pero no es perfecto

Mejor Lock Smart 2025: para puertas frontales, alquileres y casas inteligentes

Citrix parches tres fallas de NetScaler, confirma la explotación activa de CVE-2025-7775

Deja una respuesta Cancelar la respuesta