Google ha introducido Gemini 2.5 Flash Image, una generación de imágenes y el modelo de edición que habilita las capacidades, incluida la combinación de múltiples imágenes en una sola imagen. Los desarrolladores pueden usar el modelo para la creatividad multimodal para aplicaciones visuales. Introducido el 26 de agosto y también identificado como «Nano Banana», la imagen Flash Gemini 2.5 permite a los desarrolladores mantener el carácter de consistencia, hacer transformaciones específicas utilizando el lenguaje natural y usar el conocimiento de Gemini para generar y editar imágenes. El modelo está disponible a través de Gemini API y Google AI Studio para desarrolladores y Vertex AI para Enterprise. Para ayudar con la construcción con Gemini 2.5 Flash Image, Google ha realizado actualizaciones en el modo de compilación de Google AI Studio. Los desarrolladores pueden probar rápidamente las capacidades del modelo con aplicaciones personalizadas con AI y remezclarlas o dar vida a las ideas con un solo mensaje, según Google. Las aplicaciones se pueden compartir desde Google AI Studio o código guardado en GitHub. La imagen flash Gemini 2.5 permite la transformación específica y las ediciones locales precisas con lenguaje natural, dijo Google. Por ejemplo, el modelo puede difuminar el fondo de una imagen, eliminar una mancha en una camiseta, eliminar a una persona completa de una foto, alterar la pose de un sujeto, agregar color a una foto en blanco y negro, todo con un mensaje simple. Las características clave del modelo incluyen:
Deja una respuesta