Únase a los líderes en Boston el 27 de marzo para una noche exclusiva de networking, conocimientos y conversaciones. Solicite una invitación aquí. Los investigadores de Apple han desarrollado nuevos métodos para entrenar grandes modelos de lenguaje tanto en texto como en imágenes, permitiendo sistemas de IA más potentes y flexibles, en lo que podría ser un avance significativo para la inteligencia artificial y para futuros productos de Apple. El trabajo, descrito en un artículo de investigación titulado «MM1: Métodos, análisis e ideas del pre-entrenamiento multimodal de LLM» que se publicó discretamente en arxiv.org esta semana, demuestra cómo combinar cuidadosamente diferentes tipos de datos de entrenamiento y arquitecturas de modelos puede conducir a Rendimiento de última generación en una variedad de puntos de referencia de IA. “Demostramos que para el preentrenamiento multimodal a gran escala, el uso de una combinación cuidadosa de datos de imagen-texto, imagen-texto intercalado y solo texto es crucial para lograr resultados de última generación en pocas tomas en múltiples puntos de referencia. ”, explican los investigadores. Al entrenar modelos en un conjunto de datos diverso que abarca información visual y lingüística, los modelos MM1 pudieron sobresalir en tareas como subtítulos de imágenes, respuesta visual a preguntas e inferencia del lenguaje natural. Escalar los componentes visuales es clave. Los investigadores también descubrieron que la elección del codificador de imágenes y la resolución de las imágenes de entrada tenían un impacto importante en el rendimiento del modelo. «Demostramos que el codificador de imágenes junto con la resolución de la imagen y el recuento de tokens de imagen tienen un impacto sustancial, mientras que el diseño del conector de visión y lenguaje tiene una importancia comparativamente insignificante», dijeron. Esto sugiere que la ampliación continua y el refinamiento de los componentes visuales de estos modelos multimodales serán clave para desbloquear mayores beneficios. Evento VB The AI ​​Impact Tour – Atlanta Continuando con nuestro recorrido, nos dirigimos a Atlanta para la parada del AI Impact Tour el 10 de abril. Este evento exclusivo al que solo se puede acceder por invitación, en asociación con Microsoft, incluirá debates sobre cómo la IA generativa está transformando la fuerza laboral de seguridad. El espacio es limitado, así que solicite una invitación hoy. Solicite una invitación Sorprendentemente, el modelo MM1 más grande de 30 mil millones de parámetros exhibió fuertes capacidades de aprendizaje en contexto, lo que le permitió realizar un razonamiento de varios pasos sobre múltiples imágenes de entrada utilizando indicaciones de “cadena de pensamiento” de pocos disparos. Esto apunta al potencial de los grandes modelos multimodales para abordar problemas complejos y abiertos que requieren una comprensión y generación de lenguaje fundamentada. La apuesta de Apple por la IA de miles de millones de dólares La investigación MM1 se produce cuando Apple ha estado aumentando sus inversiones en inteligencia artificial en un esfuerzo por alcanzar a rivales como Google, Microsoft y Amazon, que se han adelantado en la integración de capacidades de IA generativa en sus productos. La compañía está en camino de gastar mil millones de dólares al año en el desarrollo de la IA, según un informe reciente de Bloomberg. Las fuentes dicen que Apple está trabajando en un marco de modelo de lenguaje grande llamado «Ajax», así como en un chatbot conocido internamente como «Apple GPT». El objetivo es integrar estas tecnologías en Siri, Messages, Apple Music y otras aplicaciones y servicios. Por ejemplo, la IA podría usarse para generar automáticamente listas de reproducción personalizadas, ayudar a los desarrolladores a escribir código o participar en conversaciones abiertas y completar tareas. Consideramos que la IA y el aprendizaje automático son tecnologías fundamentales y son parte integral de prácticamente todos los productos que comercializamos”, dijo el director ejecutivo de Apple, Tim Cook, durante una reciente conferencia telefónica sobre resultados. “No voy a entrar en detalles sobre qué es porque, como saben, realmente no hacemos eso. Pero pueden apostar a que estamos invirtiendo, estamos invirtiendo bastante, lo haremos de manera responsable y así será. Verán avances en los productos con el tiempo y esas tecnologías están en el centro de ellos. » Lo que está en juego en la carrera armamentista de la IA Apple tiene un historial de ser un seguidor rápido en lugar de ser el primero en actuar cuando se trata de cambios tecnológicos importantes. Pero con la IA preparada para transformar todos los aspectos del panorama digital, hay mucho en juego para que el fabricante del iPhone siga siendo competitivo. La investigación de MM1 muestra que Apple tiene el talento y los recursos para realizar avances de vanguardia. Pero aún está por verse si la empresa notoriamente reservada puede moverse lo suficientemente rápido como para mantener el ritmo en la creciente carrera armamentista de la IA. Muchos ojos estarán puestos en la Conferencia Mundial de Desarrolladores de Apple en junio, donde se espera que la compañía revele nuevas funciones y herramientas para desarrolladores impulsadas por IA. Mientras tanto, pequeños avances de la IA, como la herramienta de animación Keyframer y las mejoras de rendimiento que surgen de los laboratorios de investigación de Apple, muestran que se están logrando progresos constantes entre bastidores. Como insinuó Cook recientemente durante una llamada sobre resultados del primer trimestre: «Estamos entusiasmados de compartir detalles de nuestro trabajo en curso en IA a finales de este año». Ahora está claro que ese trabajo incluye esfuerzos ambiciosos para dominar la inteligencia multimodal a las escalas más grandes. La era de la IA omnipresente, útil y parecida a la humana, puede llegar antes de lo que pensamos, y Apple tiene la intención de desempeñar un papel importante en darle forma. La misión de VentureBeat es ser una plaza digital para que los tomadores de decisiones técnicas adquieran conocimientos sobre tecnología empresarial transformadora y realicen transacciones. Descubra nuestros Briefings.

Source link