El mes pasado, 1X (anteriormente Halodi Robotics), con sede en Oslo, Noruega, anunció una enorme Serie B de 100 millones de dólares, y claramente han estado trabajando en ello. Un nuevo video publicado la semana pasada muestra una [insert collective noun for humanoid robots here] de manipuladores móviles tipo Android de EVE que realizan una amplia variedad de tareas aprovechando las redes neuronales de un extremo a otro (píxeles a acciones). Y lo mejor de todo es que el vídeo parece ser más o menos honesto: una sola toma, a (apropiadamente) velocidad 1X y total autonomía. ¡Pero todavía teníamos preguntas! Y 1X tiene respuestas. Si, como yo, tenías algunas preguntas muy importantes después de ver este video, incluido si esa planta está realmente muerta y el destino del cubo pesado que lo acompaña, querrás leer estas preguntas y respuestas con Eric Jang, Vicepresidente. Presidente de Inteligencia Artificial en 1X.IEEE Spectrum: ¿Cuántas tomas se necesitaron para obtener esta toma? Eric Jang: Alrededor de 10 tomas que duraron más de un minuto; Esta era la primera vez que hacíamos un video como este, así que se trataba más de aprender a coordinar al equipo de filmación y preparar el rodaje para que se viera impresionante. ¿Entrenaste a tus robots específicamente en cosas flexibles y transparentes? Jang: ¡No! Entrenamos nuestra red neuronal para que recoja todo tipo de objetos, tanto rígidos como deformables y transparentes. Debido a que entrenamos la manipulación de un extremo a otro a partir de píxeles, recoger objetos deformables y transparentes es mucho más fácil que una tubería de agarre clásica, donde tienes que descubrir la geometría exacta de lo que estás tratando de agarrar. ¿Qué impide que tus robots hagan? ¿Estas tareas son más rápidas? Jang: Nuestros robots aprenden de las demostraciones, por lo que van exactamente a la misma velocidad a la que los teleoperadores humanos demuestran la tarea. Si reunimos demostraciones en las que nos movemos más rápido, también lo harían los robots. ¿Cuántos cubos complementarios pesados resultaron dañados al realizar este vídeo? Jang: A 1X, los cubos complementarios pesados no tienen derechos. Ese es un método genial para cargar, pero Parece mucho más complicado que algún tipo de interfaz de acceso directo a la base. ¿Por qué utilizar la manipulación en su lugar? Jang: Tienes razón en que esta no es la forma más sencilla de cargar el robot, pero si vamos a tener éxito en nuestra misión de construir robots generalmente capaces y confiables que puedan manipular todo tipo de objetos, nuestro Las redes neuronales deben poder realizar esta tarea como mínimo. Además, ¡reduce bastante los costos y simplifica el sistema! ¿Qué animal se supone que es ese peluche azul? Jang: Es un tiburón obeso, creo. ¿Cuántos robots diferentes hay en este video? Jang: ¿17? Y más que son estacionarios. ¿Cómo se distinguen los robots? Jang: Tienen pequeños números impresos en la base. ¿Esa planta está muerta? Jang: Sí, la pusimos allí porque ningún video renderizado CGI/3D jamás pasaría por el problema de agregar una planta muerta. ¿Qué tipo de crisis existencial está teniendo el robot en la ventana? Jang: Se suponía que debía estar abriendo y cerrando la ventana repetidamente (bueno para probar la significancia estadística). Si uno de los robots fuera en realidad un humano con un casco y un traje con pinzas y de pie sobre una base móvil, ¿podría saberlo? Jang: Me sentí muy halagado por este comentario en el video de Youtube: Pero si nos fijamos en el área donde la parte superior del brazo se estrecha en la hombro, es demasiado delgado para que un humano quepa dentro y al mismo tiempo tenga hombros tan anchos: ¿Por qué tus robots están tan felices todo el tiempo? ¿Estás planeando hacer cosas más complejas de HRI con sus caras? Jang: Sí, ¡se están preparando cosas más complejas de HRI! ¿Tus robots pueden colaborar entre sí de forma autónoma? Jang: ¡Estén atentos! ¿Es el tetrominó sesgado el tetrominó más difícil para la manipulación robótica? Jang: ¡Buen partido! Sí, el verde es el peor de todos porque hay muchas formas válidas de pellizcarlo con la pinza y levantarlo. En el aprendizaje robótico, si hay varias formas de captar algo, en realidad puede confundir el modelo de aprendizaje automático. Algo así como pedirle a un automóvil que gire a la izquierda y a la derecha al mismo tiempo para evitar un árbol. Los robots de todos los demás están haciendo café. ¿Tus robots pueden hacer café? Jang: ¡Sí! Estábamos planeando incluir algo de preparación de café en este video como huevo de Pascua, pero la máquina de café se rompió justo antes del rodaje de la película y resulta que es imposible conseguir un Keurig K-Slim en Noruega mediante envío al día siguiente. Actualmente, 1X es Contratar investigadores de IA (aprendizaje por imitación, aprendizaje por refuerzo, capacitación a gran escala, etc.) y operadores de Android (!), lo que en realidad suena como un trabajo súper divertido e interesante. Más aquí. Artículos de su sitio Artículos relacionados en la Web
Source link
Deja una respuesta