Peter Chen, director ejecutivo de la empresa de software para robots Covariant, se sienta frente a una interfaz de chatbot similar a la que se utiliza para comunicarse con ChatGPT. “Muéstrame el bolso que tienes delante”, escribe. En respuesta, aparece un video que revela un brazo robótico sobre un contenedor que contiene varios artículos: un par de calcetines, un tubo de papas fritas y una manzana, entre ellos. El chatbot puede discutir los artículos que ve, pero también manipularlos. Cuando WIRED sugiere que Chen le pida que tome una fruta, el brazo se agacha, agarra suavemente la manzana y luego la mueve a otro contenedor cercano. Este chatbot práctico es un paso para brindar a los robots el tipo de capacidades generales y flexibles. exhibido por programas como ChatGPT. Existe la esperanza de que la IA finalmente pueda solucionar la antigua dificultad de programar robots y hacer que hagan más que un conjunto reducido de tareas. “No es nada controvertido en este momento decir que los modelos básicos son el futuro de la robótica”, dijo Chen. dice, utilizando un término para modelos de aprendizaje automático de propósito general y gran escala desarrollados para un dominio en particular. El práctico chatbot que me mostró funciona con un modelo desarrollado por Covariant llamado RFM-1, por Robot Foundation Model. Al igual que los que están detrás de ChatGPT, Gemini de Google y otros chatbots, ha sido entrenado con grandes cantidades de texto, pero también ha recibido control de video y hardware y datos de movimiento de decenas de millones de ejemplos de movimientos de robots provenientes del trabajo en el mundo físico. mundo. Incluir esos datos adicionales produce un modelo que no solo domina el lenguaje sino también la acción y que es capaz de conectar los dos. RFM-1 no sólo puede chatear y controlar un brazo robótico, sino también generar vídeos que muestran robots realizando diferentes tareas. Cuando se le solicite, RFM-1 mostrará cómo un robot debe agarrar un objeto de un contenedor desordenado. «Puede aceptar todas estas modalidades diferentes que son importantes para la robótica y también puede generar cualquiera de ellas», afirma Chen. «Es un poco alucinante». Vídeo generado por el modelo de IA RFM-1. Cortesía de Covariant Vídeo generado por el modelo de IA RFM-1. Cortesía de Covariant El modelo también ha demostrado que puede aprender a controlar hardware similar que no está en su entrenamiento. datos. Con mayor capacitación, esto podría incluso significar que el mismo modelo general podría operar un robot humanoide, dice Pieter Abbeel, cofundador y científico jefe de Covariant, pionero en el aprendizaje de robots. En 2010, dirigió un proyecto que entrenó a un robot para doblar toallas, aunque lentamente, y también trabajó en OpenAI antes de que dejara de investigar con robots. Covariant, fundada en 2017, actualmente vende software que utiliza el aprendizaje automático para permitir que los brazos robóticos seleccionen artículos. de contenedores en los almacenes, pero normalmente se limitan a la tarea para la que han estado entrenando. Abeel dice que modelos como RFM-1 podrían permitir que los robots utilicen sus pinzas para realizar nuevas tareas con mucha más fluidez. Compara la estrategia de Covariant con la forma en que Tesla utiliza datos de los automóviles que ha vendido para entrenar sus algoritmos de conducción autónoma. «Es más o menos lo mismo que estamos sucediendo aquí», dice. Abeel y sus colegas de Covariant están lejos de ser los únicos expertos en robótica que esperan que las capacidades de los grandes modelos de lenguaje detrás de ChatGPT y programas similares puedan provocar una revolución en robótica. Proyectos como RFM-1 han mostrado resultados iniciales prometedores. Pero la cantidad de datos que se pueden necesitar para entrenar modelos que fabriquen robots con capacidades mucho más generales (y cómo recopilarlos) es una cuestión abierta.
Source link
Etiqueta: robots
Cada año en el CES, empresas de todo el mundo se reúnen para mostrar sus productos. Algunos de estos productos son cosas que realmente puedes comprar, y algunos de ellos son pruebas de conceptos que permiten a las empresas mostrar su tecnología y las cosas en las que están trabajando. Con tantos dispositivos, automóviles, algunos electrodomésticos y gadgets, hemos reunido algunos de nuestros favoritos de CES 2024. Entonces, si está buscando lo mejor de CES 2024, ¡siga leyendo para descubrirlo! El ASUS ROG Phone 8 es el sucesor del ROG Phone 7. El nuevo teléfono inteligente para juegos de la compañía viene con un diseño actualizado más «adulto» que se ve más elegante y menos estridente. Está impulsado por el último chipset Qualcomm Snapdragon 8 Gen 3 y viene con funciones de juego como disparadores de hombro incorporados y un accesorio de ventilador de refrigeración. Cuando pensamos en IA, pensamos en el software que se encuentra en nuestros teléfonos o en la web. Con Rabbit r1, la compañía ha creado un dispositivo portátil impulsado por IA que puede hacer todo lo que se podría esperar de un asistente de IA. Esto incluye reservar vuelos, reproducir música, enviar mensajes, controlar electrodomésticos inteligentes y más. Uno de los beneficios de Rabbit r1 es que los usuarios no tendrán que interactuar con aplicaciones individuales para que funcione, ya que puede aprender directamente de la forma en que las usas. The Frame TV de Samsung tomó el concepto de marco de imagen y lo transformó en un televisor. La compañía ha ampliado eso utilizando un concepto similar, excepto que lo han aplicado a un altavoz. Esto permite a los usuarios colgar el altavoz en sus paredes como una obra de arte y, cuando se combina con los televisores de Samsung, puede ayudar a crear un efecto de sonido envolvente sin ocupar demasiado espacio en su hogar. El Xgimi Horizon Max es un proyector inteligente de largo alcance que viene con la certificación IMAX mejorada. Cuenta con un cardán motorizado que permitirá al proyector determinar la mejor ubicación para proyectar su contenido. El proyector utiliza una tecnología Dual Light 2.0 actualizada con un sistema de láser triple para una gama de colores ampliada y una luz de fósforo para reducir las imperfecciones. En términos generales, la mayoría de los fabricantes de teléfonos inteligentes prestan atención al diseño de sus dispositivos, pero en su mayor parte puede resultar aburrido. Los usuarios pueden personalizar el aspecto de sus teléfonos a través de fundas, pero la tecnología E-Color Shift de Infinix le da la vuelta al utilizar la tecnología de pantalla E Ink Prism 3. Esto permite a los usuarios personalizar la parte posterior de sus teléfonos en cualquier momento que quieran con todo tipo de patrones y colores únicos. Si extrañas los viejos tiempos de BlackBerry, Clicks está aquí para llevar esa experiencia de un teclado físico al iPhone. Clicks es básicamente un accesorio de iPhone que permite a los usuarios escribir usando un teclado físico. Uno de los beneficios es que permitirá a los usuarios utilizar la pantalla completa de su iPhone, que de otro modo estaría oculta con el teclado en pantalla. Algunas personas llevan consigo tanto portátiles como tabletas. Las computadoras portátiles podrían usarse para la escuela o el trabajo, mientras que las tabletas podrían usarse para entretenimiento. Con el Lenovo ThinkBook Plus Gen 5 Hybrid, combina ambas tecnologías en un solo dispositivo. La mejor parte es que se ejecuta tanto en Windows como en Android, por lo que si necesita una tableta Android para acceder a sus juegos y aplicaciones, puede hacerlo, pero también puede ejecutarse en Windows si necesita usar aplicaciones de productividad. ¡Muy genial! Debido a problemas médicos/de salud o a la edad, nuestra vista puede verse afectada y concentrarse en las cosas se vuelve más difícil. Aquí es donde entra en juego el ViXion01. Se trata de un par de gafas inteligentes que enfocan por el usuario cuando las lleva puestas. Esto te resultará de gran utilidad cuando estés en casa y necesites leer un libro o una página web, leer las etiquetas de productos alimenticios, mirar televisión, etc. Las lavadoras, secadoras y robots aspiradores suelen ser dispositivos separados, pero Eureka desafía esa noción con el Eureka Dual Washing Bot. ¡Esta es una lavadora que cumple una triple función como secadora y también alberga un robot aspirador y un trapeador! Esto significa que si necesitas lavar y secar tu ropa Y asegurarte de que tus pisos estén impecables, este dispositivo 4 en 1 es la solución perfecta. Dado que las lavadoras y secadoras deben estar conectadas a su sistema de drenaje y agua, significa que pueden drenar y rellenar el agua del robot aspirador y trapeador por sí solo. Hay docenas de cepillos de dientes eléctricos, pero si quieres uno que tenga un aspecto moderno y asequible, el Laifen Wave podría ser el adecuado. Con un diseño moderno y elegante, Wave es un cepillo de dientes eléctrico inteligente que viene con una aplicación que permite a los usuarios controlar la fuerza y los modos del cepillo de dientes. El cepillo de dientes también ofrece oscilación y vibración que mejorarán la eficiencia del cepillado hasta 3 veces.
Como editores de IEEE Spectrum, nos enorgullecemos de detectar tecnologías prometedoras y seguirlas desde la fase de investigación hasta el desarrollo y, en última instancia, la implementación. En cada edición de enero, nos centramos en las tecnologías que ahora están preparadas para alcanzar hitos importantes en el nuevo año. Este número fue curado por el editor senior Samuel K. Moore, nuestro experto interno en semiconductores. Por eso no sorprende que haya incluido una historia sobre el plan de Intel para lanzar dos tecnologías de chips trascendentales en los próximos meses. Para “Intel espera superar a sus competidores”, Moore pidió a nuestra pasante editorial, Gwendolyn Rak, que informara sobre el riesgo que está asumiendo el gigante de los chips al introducir dos tecnologías a la vez. Comenzamos a rastrear la primera tecnología, los transistores nanosheet, en 2017. Cuando brindamos todos los detalles en un artículo destacado de 2019, estaba claro que este dispositivo estaba destinado a ser el sucesor del FinFET. Moore detectó por primera vez la segunda tecnología, la entrega de energía trasera, en la Reunión Internacional de Dispositivos Electrónicos del IEEE en 2019. Menos de dos años después, Intel se comprometió públicamente a incorporar la tecnología en 2024. Hablando de compromiso, los Proyectos de Investigación Avanzada de Defensa del ejército de EE. UU. La agencia ha desempeñado un papel enorme en la financiación de algunos de los avances fundamentales que aparecen en estas páginas. Muchos de nuestros lectores estarán familiarizados con los robots que el editor senior Evan Ackerman cubrió durante el desafío humanoide de DARPA hace casi 10 años. Esos robots eran esencialmente proyectos de investigación, pero, como informa Ackerman en “El año del humanoide”, algunas empresas iniciarán proyectos piloto en 2024 para ver si esta generación de humanoides está lista para arremangarse metafóricamente y ponerse manos a la obra. Más recientemente, el cifrado totalmente homomórfico (FHE) ha irrumpido en escena. Moore, que ha estado cubriendo la explosión cámbrica en arquitecturas de chips para IA y otras modalidades informáticas alternativas desde mediados de la adolescencia, señala que, al igual que el desafío de la robótica, DARPA fue el impulsor inicial. «Uno esperaría que las tres empresas financiadas por DARPA crearan un chip, aunque no había garantía de que lo comercializarían», dice Moore, quien escribió «Están llegando chips para computar con datos cifrados». «Pero lo que no se esperaría es que tres nuevas empresas más, independientemente de DARPA, lancen sus propios chips FHE al mismo tiempo». La historia del editor senior Tekla S. Perry sobre los OLED fosforescentes, “Un cambio detrás de las pantallas para OLED”, es en realidad un corte profundo para nosotros. Uno de los primeros artículos que Moore editó en Spectrum allá por el año 2000 fue el artículo de Stephen Forrest sobre electrónica orgánica. Su laboratorio desarrolló los primeros materiales OLED fosforescentes, que son mucho más eficientes que los fluorescentes. Forrest fue uno de los fundadores de Universal Display Corp., que ahora, después de más de dos décadas, finalmente ha comercializado el último de su trío de colores fosforescentes: el azul. Luego está nuestro artículo de portada sobre los deepfakes y su impacto potencial en docenas de elecciones nacionales a finales de este año. Hemos estado siguiendo el aumento de los deepfakes desde mediados de 2018, cuando publicamos una historia sobre investigadores de inteligencia artificial que apostaban sobre si un video deepfake sobre un candidato político recibiría más de 2 millones de visitas durante las elecciones intermedias de EE. UU. de ese año. Como informa la editora senior Eliza Strickland en “Este año electoral, busque credenciales de contenido”, varias empresas y grupos industriales están trabajando arduamente para garantizar que los deepfakes no destruyan la democracia. Mis mejores deseos para un año nuevo próspero y saludable, y disfrute de las previsiones tecnológicas de este año. Han pasado años preparándolo. Este artículo aparece en la edición impresa de enero de 2024.
Source link