Únase a los líderes en San Francisco el 10 de enero para una noche exclusiva de networking, conocimientos y conversaciones. Solicite una invitación aquí. Un nuevo sistema de inteligencia artificial desarrollado por investigadores de la Universidad de Stanford logra avances impresionantes en el entrenamiento de robots móviles que pueden realizar tareas complejas en diferentes entornos. Llamado Mobile ALOHA (un sistema de hardware de código abierto de bajo costo para teleoperación bimanual), el sistema aborda los altos costos y los desafíos técnicos de entrenar robots bimanuales móviles que requieren una guía cuidadosa por parte de operadores humanos. Cuesta una fracción de los sistemas disponibles en el mercado y puede aprender de tan solo 50 demostraciones humanas. Este nuevo sistema se produce en el contexto de una aceleración de la robótica, posible en parte por el éxito de los modelos generativos. Evento VB The AI ​​Impact Tour Cómo llegar a un plan de gobernanza de AI: solicite una invitación para el evento del 10 de enero. Más información Límites de los sistemas robóticos actuales La mayoría de las tareas de manipulación robótica se centran en la manipulación de mesa. Esto incluye una ola reciente de modelos que se han construido basándose en transformadores y modelos de difusión, arquitecturas ampliamente utilizadas en la IA generativa. Sin embargo, muchos de estos modelos carecen de la movilidad y destreza necesarias para tareas generalmente útiles. Muchas tareas en entornos cotidianos requieren movilidad coordinada y capacidades de manipulación diestra. «Con grados de libertad adicionales añadidos, la interacción entre los brazos y las acciones de la base puede ser compleja, y una pequeña desviación en la postura de la base puede provocar grandes desviaciones en la postura del efector final del brazo», escriben los investigadores de Stanford en su artículo, añadiendo que trabajos anteriores no han ofrecido «una solución práctica y convincente para la manipulación móvil bimanual, tanto desde el punto de vista del hardware como del aprendizaje». ALOHA móvil El nuevo sistema desarrollado por investigadores de Stanford se basa en ALOHA, un sistema de teleoperación de cuerpo entero y de bajo costo para recopilar datos de manipulación móvil bimanual. Un operador humano demuestra tareas manipulando los brazos del robot a través de un control teleoperado. El sistema captura los datos de demostración y los utiliza para entrenar un sistema de control mediante el aprendizaje por imitación de un extremo a otro. Mobile ALOHA amplía el sistema montándolo sobre una base con ruedas. Está diseñado para proporcionar una solución rentable para el entrenamiento de sistemas robóticos. La configuración completa, que incluye cámaras web y una computadora portátil con una GPU de consumo, cuesta alrededor de 32.000 dólares, que es mucho más barato que los robots bimanuales disponibles en el mercado, que pueden costar hasta 200.000 dólares. Configuración de Mobile ALOHA (fuente: arxiv) Mobile ALOHA está diseñado para teleoperar todos los grados de libertad simultáneamente. El operador humano está atado al sistema por la cintura y lo conduce por el entorno de trabajo mientras opera los brazos con controladores. Esto permite que el sistema de control del robot aprenda simultáneamente el movimiento y otros comandos de control. Una vez que recopila suficiente información, el modelo puede repetir la secuencia de tareas de forma autónoma. El sistema de teleoperación es capaz de varias horas de uso consecutivo. Los resultados son impresionantes y muestran que una receta de entrenamiento simple permite al sistema aprender tareas complejas de manipulación móvil. Las demostraciones muestran al robot entrenado cocinando una comida de tres platos con tareas delicadas como romper huevos, picar ajo, verter líquido, desempacar verduras y voltear el pollo en una sartén. Mobile ALOHA también puede realizar una variedad de tareas domésticas, incluyendo regar plantas, usar una aspiradora, cargar y descargar un lavavajillas, sacar bebidas del refrigerador, abrir puertas y operar lavadoras. Aprendizaje por imitación y co-entrenamiento. Como muchos trabajos recientes. En robótica, Mobile ALOHA aprovecha los transformadores, la arquitectura utilizada en grandes modelos de lenguaje. El sistema ALOHA original utilizaba una arquitectura llamada Action Chunking with Transformers (ACT), que toma imágenes desde múltiples puntos de vista y posiciones conjuntas como entrada y predice una secuencia de acciones. Action Chunking with Transformers (ACT) (fuente: página web de ALOHA) Mobile ALOHA extiende ese sistema agregando señales de movimiento al vector de entrada. Esta formulación permite a Mobile ALOHA reutilizar algoritmos de aprendizaje de imitación profundo anteriores con cambios mínimos. «Observamos que simplemente concatenar las acciones de la base y el brazo y luego entrenar mediante el aprendizaje por imitación directa puede producir un rendimiento sólido», escriben los investigadores. «Específicamente, concatenamos las posiciones conjuntas de 14 DoF de ALOHA con la velocidad lineal y angular de la base móvil, formando un vector de acción de 16 dimensiones». El trabajo también se beneficia del éxito de métodos recientes que entrenan previamente modelos en diversos conjuntos de datos de robots de otros proyectos. De especial interés es RT-X, un proyecto de DeepMind y 33 instituciones de investigación, que combinaron varios conjuntos de datos robóticos para crear sistemas de control que podrían generalizarse mucho más allá de sus datos de entrenamiento y morfologías de robots. «A pesar de las diferencias en las tareas y la morfología, observamos una transferencia positiva en casi todas las tareas de manipulación móvil, logrando un rendimiento y una eficiencia de datos equivalentes o mejores que las políticas entrenadas utilizando únicamente datos de Mobile ALOHA», escriben los investigadores. El uso de los datos existentes permitió a los investigadores entrenar a Mobile ALOHA para tareas complejas con muy pocas demostraciones humanas. “Con el entrenamiento conjunto, podemos lograr más del 80 % de éxito en estas tareas con solo 50 demostraciones humanas por tarea, con un promedio del 34 %. mejora absoluta en comparación con ningún co-entrenamiento”, escriben los investigadores. No está listo para producción A pesar de sus impresionantes resultados, Mobile ALOHA tiene desventajas. Por ejemplo, su volumen y su forma difícil de manejar no lo hacen adecuado para entornos reducidos. En el futuro, los investigadores planean mejorar el sistema añadiendo más grados de libertad y reduciendo el volumen del robot. También vale la pena señalar que este no es un sistema completamente autónomo que pueda aprender a explorar nuevos entornos por sí solo. Todavía requiere demostraciones completas por parte de operadores humanos en su entorno, aunque aprende las tareas con menos ejemplos que los métodos anteriores, gracias a su sistema de coentrenamiento. Los investigadores explorarán cambios en el modelo de IA que permitirán al robot mejorarse y adquirir nuevos conocimientos. Dada la tendencia reciente de entrenar sistemas de inteligencia artificial de control en diferentes conjuntos de datos y morfologías, este trabajo puede acelerar aún más el desarrollo de robots móviles versátiles. E, idealmente, conducir a robots útiles para empresas y consumidores, un campo que se está calentando rápidamente gracias al trabajo de otros investigadores y empresas como Tesla con su robot humanoide Optimus aún en desarrollo y Hyundai con su división Boston Dynamics. que ofrece el perro robótico Spot a la venta por unos 74.000 dólares. La misión de VentureBeat es ser una plaza digital para que los tomadores de decisiones técnicas adquieran conocimientos sobre tecnología empresarial transformadora y realicen transacciones. Descubra nuestros Briefings.

Source link