Tendencias de radar a seguir: agosto de 2023 – O'Reilly

La Inteligencia Artificial sigue dominando las noticias. El mes pasado, vimos una serie de actualizaciones importantes en los modelos de lenguaje: Claude 2, con su límite de contexto de 100.000 tokens; LLaMA 2, con restricciones de uso (relativamente) liberales; y Stable Diffusion XL, una versión significativamente más capaz de Stable Diffusion. ¿El enorme contexto de Claude 2 realmente cambia lo que el modelo puede hacer? ¿Y qué papel tendrán los modelos de lenguaje de código abierto y de acceso abierto a medida que se desarrollen las aplicaciones comerciales? Inteligencia Artificial Stable Diffusion XL es un nuevo modelo generativo que amplía las capacidades de Stable Diffusion. Promete indicaciones más breves y sencillas; la capacidad de generar texto dentro de imágenes correctamente; la capacidad de recibir formación sobre datos privados; y, por supuesto, resultados de mayor calidad. Pruébelo en clipdrop. OpenAI ha retirado OpenAI Classifier, una herramienta que se suponía detectaba texto generado por IA, porque no era lo suficientemente precisa. ChatGPT ha agregado una nueva función llamada «Instrucciones personalizadas». Esta función permite a los usuarios especificar un mensaje inicial que ChatGPT procesa antes de cualquier otro mensaje generado por el usuario; Básicamente, es un «mensaje del sistema» personal. Algo para hacer que la inyección rápida sea más divertida. Qualcomm está trabajando con Facebook/Meta para ejecutar LLaMA 2 en dispositivos pequeños como teléfonos, permitiendo que las aplicaciones de IA se ejecuten localmente. La distinción entre código abierto y otras licencias resultará mucho menos importante que el tamaño de la máquina en la que se ejecuta el objetivo. StabilityAI ha lanzado dos nuevos modelos de lenguaje de gran tamaño, FreeWilly1 y FreeWilly2. Están basados en LLaMA y LLaMA 2 respectivamente. Se llaman Open Access (a diferencia de Open Source) y afirman tener un rendimiento similar al GPT 3.5 para algunas tareas. Chatbot Arena permite que los chatbots luchen entre sí. Los usuarios ingresan mensajes, que se envían a dos modelos de lenguaje sin nombre (¿elegidos al azar?). Una vez generadas las respuestas, los usuarios pueden declarar un ganador y descubrir qué modelos han estado compitiendo. La capacidad de GPT-4 para generar respuestas correctas a problemas puede haberse degradado en los últimos meses, en particular, su capacidad para resolver problemas matemáticos. y generar código Python correcto parece haber sufrido. Por otro lado, es más robusto contra ataques de jailbreak. Facebook/Meta ha lanzado Llama 2. Si bien hay menos restricciones en su uso que otros modelos, no es de código abierto a pesar de las afirmaciones de Facebook. Autochain es una alternativa liviana y más simple a Cadena larga. Permite a los desarrolladores crear aplicaciones complejas sobre grandes modelos de lenguajes y bases de datos. Elon Musk ha anunciado su nueva empresa de inteligencia artificial, xAI. Si esto realmente contribuirá a la IA o será otro espectáculo secundario es una incógnita. Anthropic ha anunciado Claude 2, una nueva versión de su modelo de lenguaje grande. Hay una interfaz de chat disponible en claude.ai y el acceso API está disponible. Claude 2 permite solicitudes de hasta 100.000 tokens, mucho más que otros LLM, y puede generar resultados de hasta «unos pocos miles de tokens» de longitud. Parsel es un marco que ayuda a los modelos de lenguaje grandes a hacer un mejor trabajo en tareas que involucran múltiples jerarquías. razonamiento por pasos y resolución de problemas.gpt-prompt-engineer es una herramienta que lee una descripción de la tarea que desea que realice una IA, además de una serie de casos de prueba. Luego genera una gran cantidad de mensajes sobre un tema, prueba los mensajes y califica los resultados. LlamaIndex es un marco de datos (a veces llamado «marco de orquestación») para modelos de lenguaje que simplifica el proceso de indexar los datos de un usuario y usarlos. datos para crear indicaciones complejas para modelos de lenguaje. Se puede utilizar con Langchain para crear aplicaciones complejas de IA. OpenAI está lanzando gradualmente su intérprete de código, que permitirá a ChatGPT ejecutar cualquier código que cree, utilizando los datos proporcionados por el usuario y enviando la salida al usuario. El intérprete de código reduce las alucinaciones, los errores y las malas matemáticas. Los humanos ahora pueden vencer a la IA en Go encontrando y explotando las debilidades en el juego del sistema de IA, engañando a la IA para que cometa errores graves. Es hora de preguntas existenciales: ¿Existe un solo plátano? Midjourney no lo cree así. En serio, este es un artículo excelente sobre la dificultad de diseñar indicaciones que brinden resultados adecuados. Jolly Roger Telephone Company ha desarrollado robots de voz basados en GPT-4 que puede contratar para contestar su teléfono cuando llaman los vendedores telefónicos. Si quieres escucharlo, los resultados pueden ser divertidísimos. Apache Spark ahora tiene un SDK en inglés. Va un paso más allá de herramientas como CoPilot, permitiéndole usar inglés directamente al escribir código. Es más probable que los humanos crean en la información errónea generada por la IA, posiblemente porque el texto generado por la IA está mejor estructurado que la mayoría del texto humano. O tal vez porque las IA son muy buenas para convencer. OpenOrca es otro conjunto de datos y modelo de lenguaje de código abierto basado en LLaMA. Su objetivo es reproducir los datos de entrenamiento de Orca de Microsoft, que se entrenó utilizando indicaciones y respuestas de cadena de pensamiento de GPT-4. La afirmación de ambos modelos de Orca es que puede reproducir los procesos de «razonamiento» de GPT-4. En su cumbre de desarrolladores, Snowflake anunció Document AI: consultas en lenguaje natural de colecciones de documentos no estructurados. Este producto se basa en su propio modelo de lenguaje amplio, no en un proveedor de inteligencia artificial. Programar «Funciona en mi máquina» se ha convertido en «Funciona en mi contenedor»: este artículo tiene algunas buenas sugerencias sobre cómo evitar un problema que ha afectado a los usuarios de computadoras durante décadas. StackOverflow está integrando IA en sus productos. StackOverflow para Teams ahora tiene un chatbot para ayudar a resolver problemas técnicos, junto con un nuevo GenAI StackExchange para discutir la IA generativa, escritura rápida y problemas relacionados. No es ninguna novedad que GitHub pueda filtrar claves privadas y secretos de autenticación. Pero un estudio de los contenedores disponibles en DockerHub muestra que los contenedores Docker también filtran claves y secretos, y muchas de estas claves están en uso activo. Firejail es una herramienta de Linux que puede ejecutar cualquier proceso en un entorno limitado privado y seguro. Complejo y complicado: ¿cual es la diferencia? Tiene que ver con información y es importante comprenderla en una era de «sistemas complejos». El primero de una serie.npm-manifest-check es una herramienta que verifica el contenido de un paquete en NPM con el manifiesto del paquete. Es una solución parcial al problema de los paquetes maliciosos en NPM. Facebook ha descrito su plataforma de desarrollo de software, gran parte del cual es de código abierto. Pocos desarrolladores tienen que trabajar con proyectos de software de este tamaño, pero vale la pena investigar sus herramientas (que incluyen marcos de prueba, control de versiones y un sistema de compilación). Polyrhythmix es un programa de línea de comandos para generar partes de batería polirrítmica. No hay IA involucrada. “Programación en el mundo real con ChatGPT” de Philip Guo muestra cómo es usar ChatGPT para realizar una tarea de programación real: qué funciona bien y qué no. Seguridad Un grupo de investigación ha encontrado una manera de generar automáticamente cadenas de ataque que obligan a los modelos de lenguaje grandes a generar contenido dañino. Estos ataques funcionan contra modelos de código abierto y cerrado. No está claro que los proveedores de IA puedan defenderse de ellos. El sindicato de delitos cibernéticos Lazarus Group está llevando a cabo un ataque de ingeniería social contra los desarrolladores de criptomonedas JavaScript. Se invita a los desarrolladores a colaborar en un proyecto de Github que depende de paquetes NPM maliciosos. Los modelos de lenguaje son la próxima gran novedad en materia de ciberdelincuencia. Se ha desarrollado un gran modelo de lenguaje llamado WormGPT para que lo utilicen los ciberdelincuentes. Está basado en GPT-J. WormGPT está disponible en la web oscura junto con miles de credenciales de ChatGPT robadas. Según una investigación de MITRE, las escrituras fuera de límites se encuentran entre los errores de seguridad más peligrosos. También son los más comunes y siempre ocupan los primeros lugares de la lista. Una solución sencilla al problema es utilizar Rust. Web ¿Otro framework web? Mejore las afirmaciones para que sean HTML primero, con JavaScript solo si lo necesita. La realidad puede no ser tan simple, pero al menos es evidencia de una creciente insatisfacción con las aplicaciones web complejas e infladas. ¿Otro navegador nuevo? Arc replantea la experiencia de navegación con la capacidad de cambiar entre grupos de pestañas y personalizar sitios web individuales. HTMX proporciona una forma de utilizar atributos HTML para crear muchas funciones avanzadas de páginas web, incluidos WebSockets y lo que solíamos llamar Ajax. Toda la complejidad parece estar empaquetada en una biblioteca de JavaScript. Hay una oficina de abogados en el Metaverso, junto con un incipiente Colegio de Abogados del Metaverso. Es un buen lugar para reuniones, aunque los abogados no pueden tener licencia para ejercer en el Metaverso. El Tribunal de Justicia Europeo (TJUE) ha dictaminado que el enfoque de Meta respecto del cumplimiento del RGPD es ilegal. Meta no puede utilizar datos para nada que no sea la funcionalidad principal sin un consentimiento explícito y gratuito; El consentimiento oculto en el documento de términos de uso no es suficiente. Criptomoneda Google ha actualizado su política sobre aplicaciones de Android para permitir que las aplicaciones proporcionen activos basados en blockchain, como NFT. ChatGPT se puede programar para enviar pagos de Bitcoin. Como señala el primer comentarista, esta es una aplicación bastante sencilla de Langchain. Pero es algo que ciertamente iba a suceder. Pero surge la pregunta: ¿cuándo tendremos arbitraje de criptomonedas basado en GPT? Biología Google ha desarrollado Med-PaLM M, un intento de construir una IA multimodal «generalista» que ha sido entrenada para aplicaciones biomédicas. Med-PaLM M sigue siendo un proyecto de investigación, pero puede representar un paso adelante en la aplicación de grandes modelos de lenguaje a la medicina. Materiales Superconductores de presión ambiente a temperatura ambiente: esta afirmación ha suscitado mucho escepticismo, pero como siempre, es mejor esperar hasta que otro equipo tenga éxito o no pueda duplicar los resultados. Si esta investigación se sostiene, será un gran paso adelante. Aprende más rápido. Excavar más hondo. Ver más lejos.

Source link

Todo lo que necesitas saber sobre tecnología

Tendencias de radar a seguir: agosto de 2023 – O’Reilly

Deja una respuesta Cancelar la respuesta

Tendencias de radar a seguir: agosto de 2023 – O’Reilly

3 razones por las que abandoné mi Samsung Galaxy plegable por el OnePlus Open

¿Cómo es tu relación con el trabajo? En Estados Unidos, podría ser mejor

Deja una respuesta Cancelar la respuesta