La startup de IA Anthropic ha lanzado Claude 3, la última versión de su modelo de lenguaje grande, que, según afirma, es más potente que el GPT-4 de OpenAI. Anunciado el lunes, Claude 3 viene en tres tamaños diferentes: Opus, Sonnet y Haiku. [badly formatted PDF]. Opus es el más poderoso de los tres y está disponible para desarrolladores y usuarios a través de la API de Anthropic y la suscripción Claude Pro. Los desarrolladores pueden acceder a Sonnet a través de una API y actualmente impulsa el chatbot web gratuito de Anthropic. El modelo más pequeño, Haiku, aún no está disponible. En las pruebas de referencia académicas, que evalúan la capacidad de los LLM para retener conocimientos comunes, resolver problemas matemáticos, generar código y mostrar habilidades de razonamiento, Opus obtuvo una puntuación más alta que el GPT-4 de OpenAI y el Gemini Ultra de Google, informa Anthropic. El desarrollador llegó incluso a alardear de que Opus «exhibe niveles casi humanos de comprensión y fluidez en tareas complejas, liderando la frontera de la inteligencia general». Mientras tanto, Sonnet y Haiku son más potentes que el modelo GPT-3.5 anterior de OpenAI, pero menos capaces que los modelos Gemini Ultra y Pro de Google. Anthropic explicó que la ventana de contexto (la cantidad de entrada que puede procesar a la vez) será de 200.000 tokens al principio, pero es capaz de llegar hasta un millón de tokens. Opus es costoso y está diseñado para usuarios que buscan utilizar IA para tareas que requieren altos niveles de comprensión y generación de datos, como investigaciones científicas o análisis de informes largos y complejos. Cuesta $15 procesar un mensaje de entrada que se extiende a un millón de tokens, y $75 generar un millón de tokens para la salida. A modo de comparación, OpenAI cobra entre 10 y 30 dólares por procesar y generar un millón de tokens en su modelo GPT-4 Turbo. Sonnet está dirigido a usuarios empresariales convencionales que necesitan un modelo capaz pero rápido que pueda hacer cosas como buscar y recuperar información, escribir textos de marketing o generar código. Ha sido optimizado para implementaciones a gran escala y cuesta $3 y $15 para manejar un millón de tokens en entrada y salida, respectivamente. Haiku será aún más barato, costará 0,25 dólares y 1,25 dólares procesar y generar un millón de tokens. Debería ser útil para cosas como moderación de contenido, traducción de idiomas o servicio al cliente. Amazon anunció que albergará los modelos Claude 3 de Anthropic en su plataforma en la nube Bedrock: Sonnet hoy y Opus y Haiku pronto. Es una historia similar para Vertex AI Model Garden de Google Cloud: Sonnet está disponible hoy en una vista previa privada, y pronto llegará el acceso API a los tres modelos. Claude 3 también es menos cauteloso que su predecesor. Claude 2.1 a menudo se negaba a cumplir con indicaciones que no eran necesariamente dañinas, como solicitudes para escribir una historia de ficción. El anuncio del desarrollador aseguró a los usuarios: «Hemos logrado avances significativos en esta área: Opus, Sonnet y Haiku son mucho menos propensos a negarse a responder a solicitudes que rozan las barreras del sistema que las generaciones anteriores de modelos». Sin embargo, el mayor problema que afecta a los LLM es su tendencia a generar información inexacta o inventar cosas con tanta confianza que los usuarios bien podrían creerlo. Los errores, conocidos como alucinaciones, hacen que sea difícil confiar en el resultado del software de IA y mucho menos dar a las computadoras más autonomía en las tareas. Anthropic prometió que Opus ofrece una «mejora doble» en precisión en comparación con Claude 2.1, e introducirá una función que citará fuentes en los resultados generados por sus últimos modelos para que los usuarios las inspeccionen. Es similar a decir Google Gemini, que también dice de dónde obtuvo su información en algunas de sus respuestas a las preguntas. «No creemos que la inteligencia del modelo esté cerca de sus límites y planeamos lanzar actualizaciones frecuentes para la familia de modelos Claude 3 durante los próximos meses. También estamos entusiasmados de lanzar una serie de funciones para mejorar las capacidades de nuestros modelos. , particularmente para casos de uso empresarial e implementaciones a gran escala», concluyó el anuncio de Anthropic. Curiosamente, Anthropic ha optado por no hacer de Claude 3 un sistema multimodal. Aunque puede procesar imágenes, no puede producirlas y no puede manejar entradas de audio o vídeo, a diferencia de ChatGPT o Gemini. ®

Source link