Meta lanza una bomba de inteligencia artificial: los modelos de predicción de múltiples tokens ahora están abiertos a la investigación

¡Queremos saber de ti! Responde nuestra encuesta rápida sobre IA y comparte tus ideas sobre el estado actual de la IA, cómo la estás implementando y qué esperas ver en el futuro. Más información Meta ha lanzado el guante en la carrera por una inteligencia artificial más eficiente. El gigante tecnológico lanzó el miércoles modelos preentrenados que aprovechan un novedoso enfoque de predicción de múltiples tokens, lo que podría cambiar la forma en que se desarrollan e implementan los modelos de lenguaje grande (LLM). En abril, publicamos un artículo sobre un nuevo enfoque de entrenamiento para LLM mejores y más rápidos utilizando la predicción de múltiples tokens. Para permitir una mayor exploración por parte de los investigadores, hemos publicado modelos preentrenados para completar código utilizando este enfoque en @HuggingFace ⬇️https://t.co/OnUsGcDpYx— AI at Meta (@AIatMeta) 3 de julio de 2024 Esta nueva técnica, descrita por primera vez en un artículo de investigación de Meta en abril, rompe con el método tradicional de entrenamiento de LLM para predecir solo la siguiente palabra en una secuencia. En cambio, el enfoque de Meta encarga a los modelos la predicción simultánea de múltiples palabras futuras, lo que promete un rendimiento mejorado y tiempos de entrenamiento drásticamente reducidos. Las implicaciones de este avance podrían ser de largo alcance. A medida que los modelos de IA crecen en tamaño y complejidad, su voraz apetito por el poder computacional ha generado preocupaciones sobre el costo y el impacto ambiental. El método de predicción de múltiples tokens de Meta podría ofrecer una forma de frenar esta tendencia, haciendo que la IA avanzada sea más accesible y sostenible. Democratizar la IA: la promesa y los peligros de los modelos de lenguaje eficientes El potencial de este nuevo enfoque se extiende más allá de las meras ganancias de eficiencia. Al predecir múltiples tokens a la vez, estos modelos pueden desarrollar una comprensión más matizada de la estructura y el contexto del lenguaje. Esto podría conducir a mejoras en tareas que van desde la generación de código hasta la escritura creativa, lo que podría cerrar la brecha entre la IA y la comprensión del lenguaje a nivel humano. Cuenta regresiva para VB Transform 2024 Únase a los líderes empresariales en San Francisco del 9 al 11 de julio para nuestro evento insignia de IA. Conéctese con colegas, explore las oportunidades y los desafíos de la IA generativa y aprenda a integrar aplicaciones de IA en su industria. Regístrate ahora Sin embargo, la democratización de herramientas de IA tan poderosas es un arma de doble filo. Si bien podría nivelar el campo de juego para los investigadores y las empresas más pequeñas, también reduce la barrera para un posible uso indebido. La comunidad de IA ahora enfrenta el desafío de desarrollar marcos éticos sólidos y medidas de seguridad que puedan seguir el ritmo de estos rápidos avances tecnológicos. La decisión de Meta de lanzar estos modelos bajo una licencia de investigación no comercial en Hugging Face, una plataforma popular para investigadores de IA, se alinea con el compromiso declarado de la empresa con la ciencia abierta. Pero también es un movimiento estratégico en el panorama de IA cada vez más competitivo, donde la apertura puede conducir a una innovación más rápida y la adquisición de talento. El lanzamiento inicial se centra en las tareas de finalización de código, una elección que refleja el creciente mercado de herramientas de programación asistida por IA. A medida que el desarrollo de software se entrelaza cada vez más con la IA, la contribución de Meta podría acelerar la tendencia hacia la codificación colaborativa entre humanos e IA. Sin embargo, el lanzamiento no está exento de controversia. Los críticos argumentan que los modelos de IA más eficientes podrían exacerbar las preocupaciones existentes sobre la desinformación generada por IA y las amenazas cibernéticas. Meta ha intentado abordar estas cuestiones haciendo hincapié en la naturaleza exclusivamente de investigación de la licencia, pero quedan dudas sobre la eficacia con la que se pueden aplicar dichas restricciones. Los modelos de predicción de múltiples tokens forman parte de un conjunto más amplio de artefactos de investigación de IA publicados por Meta, que incluyen avances en la generación de imágenes a texto y la detección de voz generada por IA. Este enfoque integral sugiere que Meta se está posicionando como líder en múltiples dominios de IA, no solo en modelos de lenguaje. A medida que se asiente el polvo de este anuncio, la comunidad de IA debe lidiar con sus implicaciones. ¿Se convertirá la predicción de múltiples tokens en el nuevo estándar en el desarrollo de LLM? ¿Puede cumplir sus promesas de eficiencia sin comprometer la calidad? ¿Y cómo dará forma al panorama más amplio de la investigación y la aplicación de la IA? Los propios investigadores reconocen el impacto potencial de su trabajo y afirman en el artículo: «Nuestro enfoque mejora las capacidades del modelo y la eficiencia del entrenamiento al tiempo que permite velocidades más rápidas». Esta afirmación audaz prepara el escenario para una nueva fase del desarrollo de la IA, donde la eficiencia y la capacidad van de la mano. Una cosa está clara: el último movimiento de Meta ha añadido combustible a la ya ardiente carrera armamentista de la IA. A medida que los investigadores y desarrolladores se adentran en estos nuevos modelos, el siguiente capítulo de la historia de la inteligencia artificial se escribe en tiempo real. VB Daily ¡Manténgase informado! Reciba las últimas noticias en su bandeja de entrada todos los días Al suscribirse, acepta los Términos de servicio de VentureBeat. Gracias por suscribirse. Consulte más boletines de VB aquí. Se produjo un error.

Todo lo que necesitas saber sobre tecnología

Meta lanza una bomba de inteligencia artificial: los modelos de predicción de múltiples tokens ahora están abiertos a la investigación

Deja una respuesta Cancelar la respuesta

Meta lanza una bomba de inteligencia artificial: los modelos de predicción de múltiples tokens ahora están abiertos a la investigación

La FCC quiere que los operadores móviles desbloqueen todos los teléfonos inteligentes dentro de los 60 días posteriores a su activación

Cómo elegir el tratamiento facial adecuado para tu tipo de piel: guía completa

Deja una respuesta Cancelar la respuesta