B. Viñetas resumidas de Valle: • El evento I/O de Google para desarrolladores incluyó los anuncios del Proyecto Astra, Gemini 1.5 Flash y una nueva arquitectura de unidad de procesamiento tensorial (TPU). • Google también actualizó Gemini 1.5 Pro, ampliando su ventana contextual de uno a dos millones de tokens y refinando sus capacidades de razonamiento y generación de código. Google I/O 2024 incluyó una impresionante variedad de anuncios de IA generativa (GenAI), como actualizaciones de Google Gemini (Gemini), un asistente de IA llamado Proyecto Astra y una nueva arquitectura de chipset. El lanzamiento de Trillium, la sexta generación de Google Cloud TPU confirma la posición de Google en el disputado mercado del silicio, donde una arquitectura de microprocesador competitiva se ha convertido en un elemento esencial en el arsenal de cada hiperescalador que intenta reforzar su estrategia GenAI. Esto quedó demostrado una vez más cuando Microsoft anunció recientemente una nueva colaboración con AMD. Como pionero original de semiconductores patentados y personalizados para IA, Google mantiene la plataforma actualizada mediante el lanzamiento de actualizaciones oportunas. La nueva arquitectura incluye la próxima generación de SparseCore, un acelerador para procesar las incrustaciones que se encuentran en los sistemas de clasificación y recomendación basados ​​en IA. En el ámbito del software de inteligencia artificial, uno de los anuncios más interesantes fue el Proyecto Astra, un asistente de inteligencia artificial desarrollado por Google DeepMind que utiliza video y reconocimiento de voz para brindar respuestas contextuales. Una demostración pregrabada muy comentada mostró las capacidades de comprensión visual del Proyecto Astra, ayudando a una humana a encontrar dónde había dejado sus gafas y describiendo en detalle un proyecto en el que estaba trabajando un desarrollador de software mirando la pantalla de su computadora. Sin embargo, el lanzamiento estuvo rodeado de controversia ya que OpenAI acababa de lanzar otro asistente multimodal sólo unos días antes, GPT-4o, un modelo que puede razonar a través de audio, visión y texto con una latencia mínima. Gemini 1.5 Flash también estuvo disponible en versión preliminar pública. El modelo Gemini más rápido servido en la API, está optimizado para tareas de gran volumen y alta frecuencia y es más rentable que otros modelos. Al igual que otros sistemas de la plataforma, se beneficia de la multimodalidad nativa. La familia Gemini llegó al mercado un poco más tarde que las ofertas de la competencia, aprovechando así la madurez relativamente mayor de las tecnologías GenAI en ese momento. Este nuevo modelo tiene una ventana de contexto muy grande de un millón de tokens, que aún se reduce en comparación con la nueva y gigantesca ventana de contexto de dos millones de su primo, Gemini Pro 1.5. Parece que fue ayer (de hecho, hace unos seis meses) cuando la compañía lanzó Gemini Pro con una ventana de contexto de 32k. Al actualizar el Gemini Pro de gama alta de esta manera, Google avergüenza incluso al Claude 3 de Anthropic. Debido a que la nueva versión de Gemini 1.5 Pro está disponible globalmente a través de Google Workspace Labs, los desarrolladores que utilizan Google Cloud Platform ahora tienen acceso a más potencia informática en Gemini que la que obtienen con cualquier LLM de la competencia. Además, Google lanzó un nuevo modelo Gemini personalizado para su icónica plataforma de búsqueda. Para finales de 2024, los usuarios deberían esperar obtener una versión mejorada de AI Overviews de Google, una característica cuyas nuevas capacidades significan que el principal navegador de búsqueda del mundo cambiará irrevocablemente. Los resúmenes de búsqueda de IA se implementarán en todo el mundo a fines de 2024, lo que alterará para siempre la forma en que todos usan Internet y chocará con un modelo comercial tradicional basado en los ingresos por publicidad. El negocio de las búsquedas es existencial para Google y su razón de ser. No es de extrañar que la revolución GenAI haya tomado por sorpresa a la empresa, a pesar de haberle dado al mundo algunos de sus mejores ingenieros y creadores de arquitectura de transformadores. En lugar de una lista de enlaces, se producirá una descripción general generada por IA con respuestas resumidas, empujando los enlaces más abajo en la página, donde es menos probable que obtengan tráfico. Otros anuncios incluyeron actualizaciones de la plataforma Gemma de código abierto de Google y la herramienta de marca de agua SynthID, que se utilizará en texto y video, así como actualizaciones del modelo de video generativo Veo. Incluso en el mundo increíblemente rápido de GenAI, algunos de estos anuncios son notables, pero Google parece carecer de cierta confianza, lo que socava sus ambiciosos objetivos. La compañía está adoptando el enfoque correcto al nutrir a la comunidad de desarrolladores y mantener una cartera de herramientas variadas a través de un grupo de investigadores de larga data, pero debería promover el rendimiento y las capacidades que ofrece a los desarrolladores con mayor vigor. Las implicaciones de las actualizaciones impulsadas por la IA en su plataforma de búsqueda también son enormes, lo que demuestra que está muy invertido en el futuro de la IA.