Únase a nosotros en Atlanta el 10 de abril y explore el panorama de la fuerza laboral de seguridad. Exploraremos la visión, los beneficios y los casos de uso de la IA para los equipos de seguridad. Solicite una invitación aquí. Los investigadores de Apple han desarrollado un nuevo sistema de inteligencia artificial que puede comprender referencias ambiguas a entidades en pantalla, así como contextos conversacionales y de fondo, permitiendo interacciones más naturales con asistentes de voz, según un artículo publicado el viernes. El sistema, llamado ReALM (Resolución de referencia como modelado de lenguaje), aprovecha grandes modelos de lenguaje para convertir la compleja tarea de resolución de referencia, incluida la comprensión de referencias a elementos visuales en una pantalla, en un problema de modelado de lenguaje puro. Esto permite a ReALM lograr mejoras sustanciales de rendimiento en comparación con los métodos existentes. «Ser capaz de comprender el contexto, incluidas las referencias, es esencial para un asistente conversacional», escribió el equipo de investigadores de Apple. «Permitir al usuario realizar consultas sobre lo que ve en su pantalla es un paso crucial para garantizar una verdadera experiencia de manos libres en los asistentes de voz». Mejora de los asistentes de conversación Para abordar las referencias basadas en pantalla, una innovación clave de ReALM es reconstruir la pantalla utilizando entidades en pantalla analizadas y sus ubicaciones para generar una representación textual que capture el diseño visual. Los investigadores demostraron que este enfoque, combinado con el ajuste de los modelos de lenguaje específicamente para la resolución de referencia, podría superar a GPT-4 en la tarea. Evento VB The AI ​​Impact Tour – Atlanta Continuando con nuestro recorrido, nos dirigimos a Atlanta para la parada del AI Impact Tour el 10 de abril. Este evento exclusivo al que solo se puede acceder por invitación, en asociación con Microsoft, incluirá debates sobre cómo la IA generativa está transformando la fuerza laboral de seguridad. El espacio es limitado, así que solicite una invitación hoy. Solicite una invitación El sistema de inteligencia artificial de Apple, ReALM, puede comprender referencias a entidades en pantalla como la lista «Venta de muestra de 260» que se muestra en esta maqueta, lo que permite interacciones más naturales con los asistentes de voz. (Crédito de la imagen: arxiv.org) «Demostramos grandes mejoras con respecto a un sistema existente con funcionalidad similar en diferentes tipos de referencias, y nuestro modelo más pequeño obtuvo ganancias absolutas de más del 5% para las referencias en pantalla», escribieron los investigadores. «Nuestros modelos más grandes superan sustancialmente al GPT-4». Aplicaciones prácticas y limitaciones El trabajo destaca el potencial de los modelos de lenguaje enfocados para manejar tareas como la resolución de referencias en sistemas de producción donde el uso de modelos masivos de un extremo a otro es inviable debido a la latencia o restricciones informáticas. Al publicar la investigación, Apple está señalando sus continuas inversiones para hacer que Siri y otros productos estén más familiarizados y sean más conscientes del contexto. Aun así, los investigadores advierten que confiar en el análisis automatizado de pantallas tiene limitaciones. Manejar referencias visuales más complejas, como distinguir entre múltiples imágenes, probablemente requeriría incorporar visión por computadora y técnicas multimodales. Apple se apresura a cerrar la brecha de la IA mientras sus rivales se disparan Apple está logrando silenciosamente avances significativos en la investigación de la inteligencia artificial, incluso cuando está a la zaga de sus rivales tecnológicos en la carrera por dominar el panorama de la IA en rápido movimiento. Desde modelos multimodales que combinan visión y lenguaje, hasta herramientas de animación impulsadas por IA y técnicas para construir IA especializada de alto rendimiento con un presupuesto, un constante ritmo de avances de los laboratorios de investigación de la compañía sugiere que sus ambiciones en IA están aumentando rápidamente. Pero el famoso gigante tecnológico reservado enfrenta una dura competencia de empresas como Google, Microsoft, Amazon y OpenAI, que han producido agresivamente IA generativa en búsquedas, software de oficina, servicios en la nube y más. Apple, que durante mucho tiempo fue un seguidor rápido en lugar de un pionero, ahora enfrenta un mercado que se está transformando a una velocidad vertiginosa gracias a la inteligencia artificial. En su muy seguida Conferencia Mundial de Desarrolladores en junio, se espera que la compañía presente un nuevo marco de modelo de lenguaje grande, un chatbot “Apple GPT” y otras características impulsadas por IA en todo su ecosistema. «Estamos entusiasmados de compartir detalles de nuestro trabajo en curso en IA a finales de este año», insinuó recientemente el director ejecutivo Tim Cook en una llamada sobre ganancias. A pesar de su opacidad característica, está claro que los esfuerzos de Apple en materia de IA tienen un alcance amplio. Sin embargo, a medida que la batalla por la supremacía de la IA se intensifica, el retraso del fabricante del iPhone en la fiesta lo ha puesto en una posición de debilidad inusual. Las arcas profundas, la lealtad a la marca, la ingeniería de élite y una cartera de productos estrechamente integrada le dan una gran oportunidad, pero no hay garantías en esta competencia de alto riesgo. Una nueva era de computación ubicua y verdaderamente inteligente está en el horizonte. Cuando llegue junio, veremos si Apple ha hecho lo suficiente para asegurarse de participar en su configuración. VB Daily ¡Manténgase informado! Reciba las últimas noticias en su bandeja de entrada diariamente. Al suscribirse, acepta los Términos de servicio de VentureBeat. Gracias por suscribirte. Consulte más boletines de VB aquí. Ocurrió un error.

Source link