Getty Images/Westend61A pesar del retraso inicial de Apple en entrar en el espacio de la IA, después de la Conferencia Mundial de Desarrolladores de Apple, la empresa se ha volcado por completo en la IA. Apple Intelligence ofrecerá soluciones de IA para casi todas las ofertas de Apple, y la empresa no se detendrá allí. En cambio, Apple ahora está avanzando más en los modelos de lenguaje de IA. El jueves pasado, Apple lanzó DCLM-Baseline-7B, un modelo de lenguaje de 7 mil millones de parámetros, en Hugging Face. El modelo es parte del benchmark DataComp for Language Models (DCLM), una iniciativa para mejorar la calidad de los conjuntos de datos de entrenamiento para modelos de lenguaje. Además: ¿Quieres probar GPT-4o mini? 3 formas de acceder al modelo de IA más inteligente y económico, y 2 son gratis Con 7 mil millones de parámetros, este modelo es comparable a modelos populares como Llama 2, Gemma y más. Cuando se probó en el benchmark Massive Multitask Language Understanding (MMLU) contra modelos populares de aproximadamente el mismo tamaño, DCLM-Baseline-7B tuvo un rendimiento competitivo, incluso superando a Mistral 7B, como se ve a continuación. Apple/Hugging FaceA pesar de su impresionante rendimiento, uno de los puntos más destacados del DCLM-Baseline-7B es que el modelo es verdaderamente de código abierto, con «datos abiertos, modelos de peso abiertos, código de entrenamiento abierto», como destacó Vaishaal Shankar, un científico investigador de Apple. ¡Hemos publicado nuestros modelos DCLM en huggingface! Hasta donde sabemos, estos son, con diferencia, los modelos verdaderamente de código abierto con mejor rendimiento (datos abiertos, modelos de peso abiertos, código de entrenamiento abierto) 1/5— Vaishaal Shankar (@Vaishaal) 18 de julio de 2024 Muchos elogian a Apple por este enfoque, ya que permite a otros investigadores y desarrolladores desarrollar los modelos y seguir haciendo avances en este espacio. El modelo se entrenó con los datos de DCLM-BASELINE, combinados con los datos de StarCoder y ProofPile2, para alcanzar la competencia en otras tareas como codificación y matemáticas. Además: Todos los modelos de iPhone que se pueden actualizar a iOS 18 de Apple (y cuáles no) Además de lanzar DCLM-Baseline-7B, pesos del modelo, código de entrenamiento y conjunto de datos, Apple también incluyó una poderosa versión de 1.4 mil millones de parámetros en el paquete. Esta no es la primera vez que Apple incursiona en los modelos de IA, ya que ha lanzado otros como Ferret-UI, un modelo de lenguaje grande multimodal (MLLM) y Reference Resolution As Language Modeling (ReALM), un sistema de IA conversacional. En otoño, cuando iOS 18 y Apple Intelligence estén disponibles, podremos ver a Apple competir en el espacio de la IA y evaluar mejor el éxito potencial de sus esfuerzos en IA.