Únase a los líderes en Boston el 27 de marzo para una noche exclusiva de networking, conocimientos y conversaciones. Solicite una invitación aquí. Hoy, Cognition, una startup de inteligencia artificial recientemente formada y respaldada por el Fondo de Fundadores de Peter Thiel y líderes de la industria tecnológica, incluidos el ex ejecutivo de Twitter Elad Gil y el cofundador de Doordash, Tony Xu, anunció un ingeniero de software de inteligencia artificial totalmente autónomo llamado «Devin». Si bien existen múltiples asistentes de codificación, incluido el famoso Github Copilot, se dice que Devin se destaca entre la multitud por su capacidad para manejar proyectos de desarrollo completos de un extremo a otro, desde escribir el código y corregir los errores asociados con él. hasta la ejecución definitiva. Esta es la primera oferta de este tipo e incluso es capaz de gestionar proyectos en Upwork, según ha demostrado la startup. El anuncio de Devin marca un cambio significativo en el espacio del desarrollo asistido por IA, brindando a los ingenieros un trabajador de IA de pleno derecho para sus proyectos, en lugar de un copiloto que podría simplemente escribir código básico o sugerir fragmentos. Sin embargo, a partir de ahora, Devin no es público y la compañía abre el acceso solo a unos pocos clientes selectos, incluida la periodista de Bloomberg Ashlee Vance, quien escribió sobre su experiencia al usarlo aquí. Evento VB The AI Impact Tour – Boston Estamos emocionados por la próxima parada del AI Impact Tour en Boston el 27 de marzo. Este evento exclusivo al que solo se puede acceder por invitación, en asociación con Microsoft, incluirá debates sobre las mejores prácticas para la integridad de los datos en 2024 y más allá. El espacio es limitado, así que solicite una invitación hoy. Solicitar una invitación ¿Qué puede hacer Devin exactamente? En una publicación de blog hoy en el sitio web de Cognition, Scott Wu, fundador y director ejecutivo de Cognition y codificador de deportes galardonado, explicó que Devin puede acceder a herramientas de desarrollo comunes, incluido su propio shell, editor de código y navegador, dentro de un entorno informático de espacio aislado para planificar y ejecutar tareas de ingeniería complejas que requieren miles de decisiones. El usuario humano simplemente escribe un mensaje en lenguaje natural en la interfaz estilo chatbot de Devin, y el ingeniero de software de IA lo toma desde allí y desarrolla un plan detallado paso a paso para abordar el problema. Luego comienza el proyecto utilizando sus herramientas de desarrollo, tal como las usaría un humano, escribiendo su propio código, solucionando problemas, probando e informando sobre su progreso en tiempo real, lo que permite al usuario vigilar todo mientras funciona. . Si algo no le parece bien al observador humano, el usuario también puede acceder a la interfaz de chat y darle a la IA una orden para arreglarlo. Esto, dice Cognition, permite a los equipos de ingeniería delegar algunos de sus proyectos a la IA y centrarse en tareas más creativas que requieren inteligencia humana. De esta manera, Devin ofrece un nuevo paradigma que puede ser un vistazo de la forma en que todo el desarrollo de software (y el trabajo informático en general) podrá realizarse en un futuro cercano: por trabajadores de IA supervisados por supervisores/usuarios humanos. Capaz de manejar una amplia gama de tareas de desarrollo Según las demostraciones compartidas por Wu, Devin es capaz de manejar una variedad de tareas en su forma actual. Esto incluye proyectos de ingeniería comunes, como implementar y mejorar aplicaciones/sitios web de un extremo a otro y encontrar y corregir errores en bases de código hasta cosas más complejas, como configurar ajustes para un modelo de lenguaje grande usando el enlace a un repositorio de investigación en GitHub o aprendizaje. cómo utilizar tecnologías desconocidas. En un caso, aprendió en una publicación de blog cómo ejecutar el código para producir imágenes con mensajes ocultos. Mientras tanto, en otro, manejó un proyecto Upwork para ejecutar un modelo de visión por computadora escribiendo y depurando el código correspondiente. En la prueba de banco SWE, que desafía a los asistentes de IA con problemas de GitHub de proyectos de código abierto del mundo real, el ingeniero de software de IA pudo resolver correctamente el 13,86% de los casos de un extremo a otro, sin ninguna ayuda humana. En comparación, Claude 2 podría resolver sólo el 4,80%, mientras que SWE-Llama-13b y GPT-4 podrían resolver el 3,97% y el 1,74% de los problemas, respectivamente. Todos estos modelos incluso necesitaron asistencia, donde se les dijo qué archivo debía repararse. Desempeño de Devin en la prueba de banco SWE La tecnología central sigue sin ser descrita La IA en el desarrollo de software no es una hazaña nueva. Ha habido herramientas en este espacio desde hace bastante tiempo, desde los populares GitHub Copilot y StarCoder hasta Replit, que tiene algunos pequeños modelos de codificación de IA en Hugging Face, y Codeium, que recientemente obtuvo una financiación serie B de 65 millones de dólares con una valoración de 500 millones de dólares. Sin embargo, la mayoría de estas ofertas se han centrado en gran medida en el uso de IA para ayudar con la codificación. Pueden generar código básico a partir de mensajes de texto, resumirlo con el contexto IDE relevante o recuperar fragmentos, acelerando el flujo de trabajo del equipo. Con Devin, Cognition AI parece ir un paso (o varios pasos) más allá, brindando un trabajador de IA de pleno derecho para manejar proyectos completos. Si bien la herramienta aún no se ha probado, su capacidad para manejar múltiples pasos (sin perder el rumbo) para completar un proyecto de ingeniería de software es el mayor atractivo de venta. Cognition no ha compartido exactamente cómo logró esta hazaña y si está utilizando su propio modelo propietario o el de un tercero, pero sí señala que el trabajo es el resultado de sus «avances en el razonamiento y la planificación a largo plazo». Actualmente, la empresa está en el proceso de aumentar la capacidad y ofrecer acceso temprano a Devin solo a usuarios seleccionados. Dice que las partes interesadas que deseen mejorar su trabajo de ingeniería pueden comunicarse por correo electrónico para obtener acceso. Se espera que en una etapa posterior se abra un acceso más amplio. Cognition también señala en su sitio web que la codificación es “sólo el comienzo”, lo que parece indicar que puede aprovechar sus avances en el razonamiento para lanzar agentes/trabajadores de IA similares para otras disciplinas también. La empresa ha recibido 21 millones de dólares en financiación hasta el momento. La misión de VentureBeat es ser una plaza digital para que los tomadores de decisiones técnicas adquieran conocimientos sobre tecnología empresarial transformadora y realicen transacciones. Descubra nuestros Briefings.
Source link
Deja una respuesta