Un nuevo modelo de lenguaje de código abierto se ha adjudicado el trono de los mejores del mundo, según las últimas clasificaciones de Hugging Face, una de las plataformas líderes en investigación y aplicaciones del procesamiento del lenguaje natural (PNL). El modelo, llamado «Smaug-72B», fue lanzado públicamente hoy por la startup Abacus AI, que ayuda a las empresas a resolver problemas difíciles en el espacio de la inteligencia artificial y el aprendizaje automático. Smaug-72B es técnicamente una versión perfeccionada de «Qwen-72B», otro potente modelo de lenguaje que fue lanzado hace apenas unos meses por Qwen, un equipo de investigadores del Grupo Alibaba. Lo más notable del lanzamiento de hoy es que Smaug-72B supera a GPT-3.5 y Mistral Medium, dos de los modelos de lenguaje grande de código abierto más avanzados desarrollados por OpenAI y Mistral, respectivamente, en varios de los puntos de referencia más populares. Smaug-72B también supera al Qwen-72B, el modelo del que se deriva, por un margen significativo en muchas de estas evaluaciones. Crédito: Abacus AI Según la tabla de clasificación Hugging Face Open LLM, que mide el rendimiento de modelos de lenguaje de código abierto en una variedad de tareas de generación y comprensión del lenguaje natural, Smaug-72B es ahora el primer y único modelo de código abierto que tiene un Puntaje promedio de más de 80 en todas las evaluaciones principales de LLM. Evento VB The AI ​​Impact Tour – Nueva York Estaremos en Nueva York el 29 de febrero en asociación con Microsoft para discutir cómo equilibrar los riesgos y las recompensas de las aplicaciones de IA. Solicite una invitación al evento exclusivo a continuación. Solicitar una invitación Si bien el modelo aún no alcanza el promedio de 90-100 puntos indicativo de desempeño a nivel humano, su nacimiento indica que la IA de código abierto pronto podría rivalizar con las capacidades de las grandes tecnologías, que durante mucho tiempo han estado envueltas en secreto. En resumen, el lanzamiento del Smaug-72B podría remodelar fundamentalmente la forma en que se desarrolla el progreso de la IA, aprovechando el ingenio de quienes van más allá de un puñado de empresas ricas. La ventaja del código abierto “Smaug-72B de Abacus AI ya está disponible en Hugging Face, está en la cima de la clasificación de LLM y es el primer modelo con una puntuación promedio de 80. En otras palabras, es el mejor modelo de base de código abierto del mundo”, dijo Bindu Reddy, director ejecutivo de Abacus AI, en una publicación en X.com. «Nuestro próximo objetivo será publicar estas técnicas como un artículo de investigación y aplicarlas a algunos de los mejores modelos Mistral, incluido el miqu (un 70B de punta fina de LLama-2)», añadió. “¡Las técnicas que utilizamos apuntan específicamente a las habilidades de razonamiento y matemáticas, lo que explica las altas puntuaciones de GSM8K! Nuestro próximo artículo explicará más”. Smaug-72B: el mejor modelo de código abierto del mundo: ¡en lo más alto de la tabla de clasificación de LLM de Hugging! Smaug72B de Abacus AI ya está disponible en Hugging Face, está en la cima de la clasificación de LLM y es el primer modelo con una puntuación promedio de 80. !!En otras palabras, es el mejor del mundo… pic.twitter.com/CGHawmLhqI— Bindu Reddy (@bindureddy) 6 de febrero de 2024 Con el lanzamiento de hoy, Smaug-72B se convierte en el primer modelo de código abierto en lograr una puntuación promedio de 80 en la clasificación de Hugging Face Open LLM, lo que se considera una hazaña notable en el campo del procesamiento del lenguaje natural y la inteligencia artificial de código abierto. Smaug-72B destaca especialmente en tareas de razonamiento y matemáticas, gracias a las técnicas que Abacus AI aplicó al proceso de ajuste. Estas técnicas, que se detallarán en un próximo artículo de investigación, apuntan a las debilidades de los modelos de lenguaje grandes y mejoran sus capacidades. Smaug-72B no es el único modelo de lenguaje de código abierto que ha aparecido en los titulares recientemente. Qwen, el grupo detrás de Qwen-72B, también lanzó Qwen 1.5, un conjunto de modelos de lenguaje pequeños y potentes que van desde 0.5B a 72B de parámetros. Qwen 1.5 supera a los modelos populares de código abierto como Mistral-Medium y GPT-3.5, tiene una longitud de contexto de 32k y funciona con varias herramientas y plataformas para una inferencia local rápida. Qwen también abrió Qwen-VL-Max, un nuevo modelo de lenguaje de visión grande que rivaliza con Gemini Ultra y GPT-4V, dos de los modelos de lenguaje de visión patentados más avanzados desarrollados por Google y OpenAI, respectivamente. Implicaciones para el futuro de la IA La aparición de Smaug-72B y Qwen 1.5 ha provocado mucho entusiasmo y debate en la comunidad de IA y más allá. Muchos expertos e influencers han elogiado los logros de Abacus AI y Qwen, y han expresado su admiración por su contribución a la IA de código abierto. «Es difícil creer que hace menos de un año, todos nos entusiasmáramos con modelos como Dolly», dijo Sahar Mor, un influyente y analista de IA, en una publicación de Linkedin, deleitándose con el progreso de los modelos de código abierto en el último año. Smaug-72B y Qwen 1.5 están actualmente disponibles en Hugging Face, donde cualquiera puede descargarlos, usarlos y modificarlos. Abacus AI y Qwen también han anunciado sus planes de enviar sus modelos a la tabla de clasificación de evaluación humana de llmsys, que es un nuevo punto de referencia que evalúa el desempeño de los modelos de lenguaje en tareas y escenarios similares a los humanos. Abacus AI y Qwen también han insinuado sus proyectos y objetivos futuros, que incluyen la creación de más modelos de código abierto y su aplicación a diversos dominios y aplicaciones. Smaug-72B y Qwen 1.5 son sólo los últimos ejemplos de la rápida y notable evolución de la IA de código abierto este año. Representan una nueva ola de innovación y democratización de la IA que está desafiando el dominio y el monopolio de las grandes empresas tecnológicas y abriendo nuevas posibilidades y oportunidades para todos. Sólo el tiempo dirá cuánto tiempo permanecerá Smaug-72B en la cima de la clasificación de Hugging Face, pero por ahora, es seguro decir que la IA de código abierto está teniendo un gran momento para comenzar el año. La misión de VentureBeat es ser una plaza digital para que los tomadores de decisiones técnicas adquieran conocimientos sobre tecnología empresarial transformadora y realicen transacciones. Descubra nuestros Briefings.


Source link