Google anunció el jueves que ha reconstruido y rebautizado su chatbot Bard, ahora llamado Gemini, para ofrecer a empresas y consumidores la primera plataforma de IA generativa multimodal (genAI) de la industria que ya no depende únicamente del texto para proporcionar respuestas similares a las humanas. representa un desafío directo al Copilot de Microsoft, que se basa en ChatGPT de OpenAI, y a cualquier otro chatbot basado únicamente en la tecnología de modelo de lenguaje grande (LLM). [Gemini] «Es actualmente el único modelo nativo de IA generativa multimodal disponible», dijo Chirag Dekate, vicepresidente analista de Gartner. “Google ya no se está poniendo al día. Ahora es al revés”. Dekate llamó a Gemini “un gran problema” porque con un modelo multimodal, un único motor genAI realiza tareas individuales con mayor precisión porque aprende de un conjunto de conocimientos mucho mayor. Básicamente, catapulta a Google a la cabeza del paquete genAI. Google presentó por primera vez su modelo Gemini AI en diciembre, promocionando capacidades multimodales que le permiten combinar diferentes tipos de información (entradas y salidas), incluidos texto, código, audio, imágenes y video. A diferencia de los motores de inteligencia artificial exclusivos de LLM, como GPT de OpenAI, Llama 2 de Meta o incluso el propio PaLM 2 de Google, todos los cuales impulsan los chatbots actuales, Gemini no depende de esa misma tecnología. En cambio, se puede entrenar utilizando todo tipo de medios y contenidos. Esto es importante porque una empresa ahora puede crear un chatbot que ya no se limita a cargar respuestas a consultas a partir de un texto en el que se ha entrenado su LLM. “Cuando veo una película, veo el video, leo el texto ( subtítulos), estoy escuchando el audio y todo sucede simultáneamente, creando una experiencia hiperinmersiva», dijo Dekate. «Esto es multimodalidad en pocas palabras. Compare esto con experimentar una película leyendo solo su guión (LLM); la diferencia entre LLM y multimodalidad”. El año pasado, dijo Dekate, fue un año de ideas, ya que las empresas y los consumidores aprendieron sobre genAI y chatbots tras el lanzamiento de ChatGPT a finales de 2022. Ahora, las empresas comprenden mejor las posibilidades de genAI y están abriendo sus billeteras para gastar una cantidad significativa en infundirlo en los sistemas back-end y front-end. Si, por ejemplo, usted es una empresa de atención médica y intenta diseñar un chatbot más inmersivo para médicos, un motor genAI multimodal puede absorber fragmentos de audio, imágenes radiológicas y videos de resonancia magnética de un médico. escaneos para crear pronósticos y resultados de tratamiento mucho más precisos. «Esto crea una experiencia personal hiperinmersiva. Nada de esto es posible utilizando una simple experiencia de LLM», dijo Dekate. «Si Google puede permitir que las empresas y los consumidores experimenten esta experiencia multimodal , entonces Google tiene la oportunidad de cambiar la cuota de mercado”. En 2024, se espera que el gasto en soluciones genAI alcance los 40.000 millones de dólares, frente a los 19.400 millones de dólares de 2023. Para 2027, se espera que el gasto en genAI alcance los 143.000 millones de dólares, con un período de cinco años. tasa de crecimiento anual compuesta del 73,3%, según la firma de investigación IDC. «Lo que vimos el año pasado fue el surgimiento de modelos de tareas específicas: texto a texto, texto a imagen, texto a video, imagen a texto, etc.», dijo Dekate. “Cada tarea tenía su propio modelo. Por lo tanto, si tiene una tarea limitada de texto a texto, entonces los LLM funcionan bien”. El modelo de suscripción Gemini de Google de $20 por mes también parece apuntar a quitarle participación de mercado al líder Microsoft. Los clientes estadounidenses pueden suscribirse por $19,99 al mes para acceder Gemini Advanced, que incluye un modelo de IA Ultra 1.0 más potente. Los suscriptores recibirán dos terabytes de almacenamiento en la nube, que normalmente cuestan 9,99 dólares al mes, y pronto obtendrán acceso a Gemini en Gmail y a la suite de productividad de Google. El nuevo plan One AI Premium de Google es su respuesta a Microsoft y su socio genAI OpenAI, que desarrolló el GPT. LLM que impulsa ChatGPT. «Parte de esto es competir con Microsoft, y parte es ofrecer servicios premium a sus clientes premium». [customers]en su mayoría usuarios de oficinas comerciales que ya están pagando», dijo Jack Gold, analista principal de J.Gold Associates. «Además, si cobra una tarifa, limita el número de usuarios que se habrían registrado de forma gratuita. Eso le da la oportunidad de solucionar cualquier problema visto por un número más limitado de usuarios y proporciona un flujo de ingresos para mantener la ingeniería, en lugar de depender de los anuncios para pagarla». También está la cuestión del costo para Google, porque no es barato entrenar un gran modelo de IA en centros de datos. «No estoy seguro de cómo les pagan por ejecutar toda esa IA en segundo plano, lo que requiere mucha más potencia de procesamiento, y la potencia es uno de los mayores gastos de ejecutar una nube. /centro de datos», dijo Gold. «Lo sorprendente de Gemini es que es tan bueno en tantas cosas», dijo Dennis Hassabis, director ejecutivo de DeepMind de Google. «A medida que empezábamos a llegar al final de la capacitación, empezamos a ver que Gemini era mejor «Hace un año, ChatGPT Plus de OpenAI fue pionero en el mercado de comprando acceso temprano a modelos de IA y otras funciones, mientras que Microsoft anunció recientemente una suscripción competitiva para IA en programas como Word y Excel. Ambas suscripciones cuestan 20 dólares al mes en Estados Unidos. Copyright © 2024 IDG Communications, Inc.

Source link