La generación de código impulsada por IA generativa es cada vez más potente y compacta. Stability AI, el proveedor que quizás todavía sea mejor conocido por su tecnología de IA generativa de difusión estable de texto a imágenes, anunció hoy su primer nuevo modelo de IA de 2024: el Stable Code 3B con licencia comercial (a través de membresía). Como lo indica el nombre del modelo, Stable Code 3B es un modelo de 3 mil millones de parámetros y se centra en capacidades de finalización de código para el desarrollo de software. Con solo 3 mil millones de parámetros, Stable Code 3B puede ejecutarse localmente en computadoras portátiles sin GPU dedicadas y al mismo tiempo brindar rendimiento y capacidades competitivas frente a modelos más grandes como CodeLLaMA 7B de Meta. El impulso hacia modelos más pequeños, compactos y capaces es algo que Stability AI comenzó a impulsar a finales de 2023 con modelos como StableLM Zephyr 3B para generación de texto. Stability AI presentó por primera vez una vista previa de Stable Code en agosto de 2023 con el lanzamiento inicial del LLM de generación de código y ha estado trabajando constantemente para mejorar la tecnología desde entonces. Cómo Stability AI mejoró Stable Code 3B Stability AI ha mejorado Stable Code de varias maneras desde el lanzamiento inicial. Con el nuevo Stable Code 3B, el modelo no solo sugiere nuevas líneas de código, sino que también puede completar secciones más grandes que faltan en el código existente. La capacidad de completar secciones de código faltantes es una capacidad avanzada de finalización de código conocida como Completar en el medio (FIM). El entrenamiento para el modelo también se optimizó con un tamaño de contexto ampliado utilizando una técnica conocida como Rotary Position Embeddings (RoPE), que permite opcionalmente una longitud de contexto de hasta 100 000 tokens. La técnica RoPE es una que también utilizan otros LLM, incluido Meta’s Llama 2 Long. Stable Code 3B se basa en el modelo de lenguaje natural Stable LM 3B de Stability AI. Con una capacitación adicional centrada en datos de ingeniería de software, el modelo adquirió habilidades para completar código y al mismo tiempo mantuvo fortalezas en tareas de lenguaje general. Sus datos de capacitación incluían repositorios de códigos, foros de programadores y otras fuentes técnicas. También se capacitó en 18 lenguajes de programación diferentes, y Stability AI afirma que Stable Code 3B demuestra un rendimiento líder en pruebas comparativas en varios lenguajes. El modelo cubre lenguajes populares como Python, Java, JavaScript, Go, Ruby y C++. Los primeros puntos de referencia indican que iguala o supera la calidad de finalización de modelos de más del doble de su tamaño. El mercado de herramientas de generación de código de IA generativa es competitivo y múltiples herramientas, incluida CodeLLaMA 7B de Meta, son una de las opciones más grandes y populares. En el lado de los parámetros de 3 mil millones, StarCoder LLM, desarrollado conjuntamente como un esfuerzo de código abierto con la participación de IBM, HuggingFace y ServiceNow, es otra opción popular. Stability AI afirma que Stable Code 3B supera a StarCoder en los lenguajes de programación Python, C++, JavaScript, Java, PHP y Rust. Parte de la oferta de suscripción de membresía de Stability AI, Stable Code 3B, está disponible para uso comercial como parte del nuevo servicio de suscripción de membresía de Stability AI que se anunció por primera vez en diciembre. Los miembros obtienen acceso a Stable Code 3B junto con otras herramientas de inteligencia artificial en la cartera de Stability AI, incluidas las herramientas de generación de imágenes de difusión estable SDXL, StableLM Zephyr 3B para generación de contenido de texto, Stable Audio para generación de audio y Stable Video para generación de video. Imagen/crédito: Estabilidad La misión de AI VentureBeat es ser una plaza digital para que los tomadores de decisiones técnicas adquieran conocimientos sobre tecnología empresarial transformadora y realicen transacciones. Descubra nuestros Briefings.
Source link
Deja una respuesta