Primer LLM de código abierto "verdaderamente" de AI2 para impulsar un "cambio crítico" en el desarrollo de la IA

El Instituto Allen para la IA (AI2), un instituto de investigación sin fines de lucro fundado en 2014 por el fallecido cofundador de Microsoft, Paul Allen, anunció hoy que ha presentado el OLMo de código abierto, al que llama el «primer marco y LLM verdaderamente abierto». ”, creando una “alternativa a los modelos actuales que son restrictivos y cerrados” e impulsando un “cambio crítico” en el desarrollo de la IA. Mientras que otros modelos han incluido el código del modelo y los pesos del modelo, OLMo también proporciona el código de entrenamiento, los datos de entrenamiento y los kits de herramientas asociados, así como los kits de herramientas de evaluación. Además, OLMo se lanzó bajo una licencia aprobada por la iniciativa de código abierto (OSI), y AI2 dijo que «todo el código, los pesos y los puntos de control intermedios se publican bajo la licencia Apache 2.0». La noticia llega en un momento en que la IA de código abierto/ciencia abierta, que ha estado tratando de ponerse al día con los LLM cerrados y propietarios como GPT-4 de OpenAI y Claude de Anthropic, está logrando avances significativos. Por ejemplo, ayer el director ejecutivo de Mistral, una startup de inteligencia artificial de código abierto con sede en París, confirmó la «fuga» de un nuevo modelo de inteligencia artificial de código abierto que se acerca al rendimiento de GPT-4. Y el lunes, Meta lanzó una versión nueva y mejorada de su modelo de generación de código, Code Llama 70B, mientras muchos esperan ansiosamente la tercera versión de su Llama LLM. Evento VB The AI Impact Tour – Nueva York Estaremos en Nueva York el 29 de febrero en asociación con Microsoft para discutir cómo equilibrar los riesgos y las recompensas de las aplicaciones de IA. Solicite una invitación al evento exclusivo a continuación. Solicitar una invitación Sin embargo, la IA de código abierto sigue siendo objeto de críticas por parte de algunos investigadores, reguladores y formuladores de políticas; por ejemplo, un artículo de opinión reciente y ampliamente compartido en IEEE Spectrum se titula “La IA de código abierto es excepcionalmente peligrosa”. Las herramientas de desarrollo de IA «completamente abiertas» del marco OLMo, disponibles para el público, incluyen datos completos de preentrenamiento, código de entrenamiento, pesos de modelo y evaluación. Proporciona código de inferencia, métricas de capacitación y registros de capacitación, así como el conjunto de evaluación utilizado en el desarrollo: más de 500 puntos de control por modelo, «de cada 1000 pasos durante el proceso de capacitación y código de evaluación bajo el paraguas del proyecto Catwalk». Los investigadores de AI2 dijeron que continuarán iterando en OLMo con diferentes tamaños de modelos, modalidades, conjuntos de datos y capacidades. «Muchos modelos de lenguaje hoy en día se publican con transparencia limitada», dijo Hanna Hajishirzi, líder del proyecto OLMo, directora senior de Investigación de PNL en AI2 y profesora de la Universidad de Washington, en un comunicado de prensa. “Sin tener acceso a los datos de entrenamiento, los investigadores no pueden entender científicamente cómo funciona un modelo. Es el equivalente al descubrimiento de fármacos sin ensayos clínicos o al estudio del sistema solar sin un telescopio», afirmó. «Con nuestro nuevo marco, los investigadores finalmente podrán estudiar la ciencia de los LLM, que son fundamentales para construir la próxima generación de tecnologías seguras y confiables. AI.» Nathan Lambert, científico de ML en AI2, publicó en LinkedIn diciendo que “OLMo representará un nuevo tipo de LLM que permitirá nuevos enfoques para la investigación y la implementación de ML, porque en un eje clave de apertura, OLMo representa algo completamente diferente. OLMo está diseñado para que los científicos puedan desarrollar direcciones de investigación en cada punto del proceso de desarrollo y ejecutarlas, lo que antes no estaba disponible debido a la información y las herramientas incompletas”. Jonathan Frankle, científico jefe de MosaicML y Databricks, calificó el lanzamiento de OLMa de AI2 como «un salto gigante para la ciencia abierta», mientras que el CTO de Hugging Face publicó en X que el modelo/marco está «empujando los límites de la IA de código abierto». Y el científico jefe de Meta, Yann LeCun, contribuyó con una cita al comunicado de prensa de AI2: «Los modelos de base abierta han sido fundamentales para impulsar una explosión de innovación y desarrollo en torno a la IA generativa», dijo. «La vibrante comunidad que surge del código abierto es la forma más rápida y eficaz de construir el futuro de la IA». La misión de VentureBeat es ser una plaza digital para que los tomadores de decisiones técnicas adquieran conocimientos sobre tecnología empresarial transformadora y realicen transacciones. Descubra nuestros Briefings.

Source link

Todo lo que necesitas saber sobre tecnología

Primer LLM de código abierto «verdaderamente» de AI2 para impulsar un «cambio crítico» en el desarrollo de la IA

Deja una respuesta Cancelar la respuesta

Primer LLM de código abierto «verdaderamente» de AI2 para impulsar un «cambio crítico» en el desarrollo de la IA

El gasto en construcción aumentó un 0,9% en diciembre

Revisión de la máquina de café De’Longhi Rivelia: café cada vez más inteligente

Deja una respuesta Cancelar la respuesta