Tendencias de radar a tener en cuenta: julio de 2024

¿Puede cualquier cosa programable tener un LLM incorporado? Aparentemente sí. llama.ttf es una fuente común y corriente que se parece a Open Sans: se puede descargar e instalar. No sabemos si se trata de una vulnerabilidad masiva o de una forma de incorporar IA en casi cualquier aplicación basada en texto. Probablemente ambas cosas. Puede que sea solo una coincidencia, pero varios lenguajes de programación nuevos han aparecido en escena en el último mes o dos. ¿Por qué? Probablemente no se trate de una reacción contra la programación automatizada. (Obviamente, no se puede entrenar un LLM para un lenguaje sin mucho código fuente público). Aprende más rápido. Profundiza. Ve más lejos. IA Esto es una locura. llama.ttf es una fuente que incorpora un modelo de lenguaje grande (pequeño). La fuente en sí puede generar texto automáticamente. Se basa en el motor de modelado de fuentes HarfBuzz, que utiliza Wasm. Funciona en Gimp; también puede funcionar en Chrome y Firefox. Todo se ejecuta localmente. Los investigadores están descubriendo que las conversaciones con una IA pueden ayudar a disipar las creencias en las teorías de la conspiración. (Este artículo señala que es preliminar y aún no ha sido revisado por pares. Todos los datos de su investigación se publicarán cuando esté completo). El laboratorio de IA de Podman es una buena forma para que los usuarios de Linux experimenten con la ejecución de IA localmente. Como era de esperar, Podman está basado en contenedores, lo que simplifica el traslado de modelos de un entorno de escritorio a un entorno de producción. Los investigadores han desarrollado un modelo basado en BERT para detectar mensajes LLM maliciosos que le indican al LLM que genere sitios web o correos electrónicos de phishing. Anthropic ha lanzado una nueva versión de su modelo de lenguaje de tamaño mediano, Claude 3.5 Sonnet. Afirma un rendimiento similar a GPT-4o y Gemini 1.5. Una nueva ventana de Artefactos permite la interacción con la salida de Claude. ¿Qué pasaría si los personajes no jugadores de los juegos pudieran conversar contigo y entre ellos? ¿Qué pasaría si la estructura de un juego se desarrollara dinámicamente en respuesta a la jugada, en lugar de estar escrita de antemano? Eso es algo que la IA generativa podría aportar a los juegos. Se ha entrenado a un sistema de IA para contar flores. Esta capacidad tiene importantes aplicaciones en la agricultura: si puedes contar las flores, puedes predecir el rendimiento de los cultivos. Anthropic ha proporcionado documentación sobre la creación de evaluaciones y casos de prueba para Claude. Meta ha desarrollado AudioSeal, un sistema para marcar con marcas de agua el contenido de audio generado por IA. Es entre un 90% y un 100% fiable y puede identificar pequeños clips insertados en un archivo más grande. AudioSeal es gratuito y está disponible en GitHub, aunque Meta todavía no lo utiliza. El último modelo de Cohere, Command R, puede utilizar varias herramientas externas para responder a las indicaciones. Es capaz de utilizar herramientas en varios pasos, en los que crea un plan para resolver el problema, utiliza API (descritas en un documento JSON) para acceder a herramientas externas y genera un resultado. ¿Puede un modelo de lenguaje grande escribir comedia? Aparentemente no. Las ideas no son originales, los modelos tienen problemas con la incongruencia y la sorpresa, y no tienen sentido para el arco más largo de un diálogo. La Dream Machine de Luma es una impresionante herramienta de IA generativa para crear videos cortos a partir de un mensaje de texto. NVIDIA ha anunciado un conjunto de modelos para generar datos de entrenamiento sintéticos. El uso de los modelos está regido por un nuevo Acuerdo de Licencia de Modelo Abierto, que especifica que los modelos se pueden usar comercialmente, los modelos derivados se pueden distribuir libremente y NVIDIA no reclama propiedad alguna sobre los resultados de los modelos. Los detectores de IA, la mayoría de los cuales tienen tasas de error muy altas a pesar de las afirmaciones de los proveedores, se están utilizando para eliminar incorrectamente a los escritores profesionales. Una nueva estrategia para dividir el contenido en fragmentos para RAG es usar el método BERT de oraciones (SBERT) para calcular las incrustaciones de cada oración y luego usar la incrustación para detectar cambios en el tema. Si está creando una aplicación de IA con RAG, considere el uso de bases de datos de gráficos (GraphRAG) en lugar de bases de datos vectoriales. Los gráficos son más difíciles de trabajar, pero son mejores para proporcionar un contexto apropiado para responder consultas complejas. Illuminate, la herramienta experimental de Google, convierte los artículos académicos en debates similares a entrevistas que resumen los puntos importantes. Actualmente se encuentra en versión beta privada. El ensayo de Anthropic sobre el personaje de Claude es un artículo reflexivo sobre cómo le están dando a Claude 3 rasgos de carácter y cómo los rasgos de carácter afectan la forma en que Claude interactúa con el mundo. El vicepresidente de ingeniería de Honeycomb sugiere que la IA será más útil para desarrollar código frontend que backend y que los chats suelen ser una interfaz de usuario ineficiente. OpenAI y Anthropic han publicado una investigación sobre la extracción de características de sus modelos GPT y Claude. Esto representa un paso significativo hacia la interpretabilidad o la comprensión de por qué un modelo da una respuesta específica a una solicitud. ¿Qué está tratando de decir tu perro? Un proyecto de investigación está utilizando IA para decodificar las vocalizaciones de los perros. Aquí hay un vistazo al modelo de lenguaje basado en transformadores que Apple está incorporando a macOS. Es muy pequeño (aparentemente 34M de parámetros) y parece estar basado en GPT-2, claramente diseñado para ejecutarse en dispositivos como teléfonos sin agotar la batería. Codestral es un nuevo modelo de lenguaje de Mistral que se especializa en la generación de código. Ha sido entrenado en más de 80 lenguajes y afirma producir mejores resultados que otros modelos de lenguaje. Los modelos de lenguaje pueden crear esquemas de bases de datos, pero los esquemas rara vez permanecen inalterados para siempre. ¿Qué tan bien pueden los modelos de lenguaje modificar un esquema? ¿Puede la IA ayudar a los investigadores a digitalizar olores? La digitalización ha funcionado bien para la vista y el sonido. El olfato queda muy rezagado. ¿Se podría utilizar la IA para mejorar la privacidad? Los investigadores han desarrollado aplicaciones para eliminar partes sensibles de imágenes y reemplazarlas con algo similar pero diferente, una especie de Photoshop automatizado. El uso de gráficos de conocimiento en el contexto de RAG tiene sentido intuitivo. En una comparación entre «GraphRAG» y «RAG tradicional», GraphRag sale en primer lugar porque el gráfico codifica las relaciones entre los datos. Programación Gleam es un nuevo lenguaje funcional de tipo seguro. Se compila a Erlang y JavaScript. Su objetivo es permitir a los desarrolladores construir grandes sistemas concurrentes. OpenTofu, la bifurcación de código abierto de Terraform, ahora tiene cifrado de estado, una característica muy solicitada que ha estado en la cola de Terraform durante casi una década. Starlark es un pequeño lenguaje similar a Python para describir cómo construir código. Los principios de diseño de Starlark incluyen el determinismo y la seguridad; ejecutar un programa varias veces da resultados idénticos y no puede acceder a la red, el sistema de archivos o el reloj del sistema. Uno de los cocreadores de WebAssembly ha desarrollado un nuevo lenguaje de programación llamado Virgil. Está diseñado como un lenguaje de programación de sistemas, aunque no está destinado a competir con Zig (lo que sea que eso signifique). El telescopio espacial James Webb es un paso adelante para la tecnología de gemelos digitales. Se utilizó un modelo digital del telescopio para coreografiar su autoensamblaje en el espacio exterior. El gemelo continúa monitoreando el telescopio y prediciendo los efectos de las actualizaciones de software. Mesop es un marco de Python muy liviano para el desarrollo rápido de aplicaciones web. Es bueno para demostraciones, probablemente no bueno para producción. Desarrollado por Google pero no compatible. Las puertas de enlace de IA son como puertas de enlace de API, pero especializadas para acceder a las API de los modelos de lenguaje. Facilitan la monitorización, la elección del modelo que atenderá una solicitud, el almacenamiento en caché, la seguridad y muchas otras funciones. El último zine de Julia Evans (@b0rk), How Git Works, es una lectura obligada para cualquiera que no entienda Git. Que es prácticamente todo el mundo. Los desarrolladores de lenguajes han estado ocupados. El lenguaje Grain fue diseñado para la compilación en WebAssembly. Se inspiró en OCaml; la coincidencia de patrones es una característica clave. GoFr es un marco para crear microservicios en Go. Incorpora herramientas para la observabilidad y admite el uso de muchas fuentes de datos diferentes. Infrastructure from Code afirma que los requisitos de infraestructura de un sistema se pueden inferir del propio código y que se puede generar automáticamente una especificación para la infraestructura necesaria. Seguridad Si bien no está claro qué está sucediendo, parece que ha habido un ataque a la cadena de suministro contra el servicio CDN Polyfill.io. Polyfill afirma que ha sido difamado y se ha mudado a un nuevo nombre de dominio. Los expertos en seguridad recomiendan precaución. Una nueva vulnerabilidad crítica en el producto MoveIT de Progress Software está siendo explotada activamente. Los atacantes pueden hacerse pasar por cualquier usuario legítimo de SFTP, lo que les da la capacidad de copiar, eliminar o crear archivos. Los atacantes también pueden obtener hashes criptográficos para las contraseñas de los usuarios. Estados Unidos prohibirá las ventas del software antivirus de Kaspersky a partir de julio. ¿Malware de Linux controlado por emojis enviados desde Discord? Eso es creativo. El malware, que se propaga a través de phishing, usa emojis para enviar comandos. Los emojis aparentemente evaden el software de seguridad que espera que los comandos sean cadenas de texto. Un nuevo tipo de phishing usa el protocolo Windows Search para descargar malware. Otro nuevo phishing usa aplicaciones web progresivas (PWA) para robar credenciales. Después de las críticas generalizadas a su función Recall para Windows 11 habilitado con IA, Microsoft ha anunciado que estaría deshabilitada de forma predeterminada. El lanzamiento de Recall se ha retrasado; Se entregará primero al Programa Windows Insider, esencialmente una versión beta privada. A medida que la importancia de la IA ha crecido, Hugging Face se ha convertido en un objetivo para los actores de amenazas. Más recientemente, los atacantes han robado tokens de autorización de Spaces. ¿Web Sim City en el navegador con WebAssembly? Impresionante. UIX es un nuevo marco de desarrollo web de pila completa. Es parte de un proyecto Unyt más grande, que tiene el ambicioso objetivo de desarrollar la Internet descentralizada de próxima generación. BBC Ventures está invirtiendo en una plataforma de transmisión de video en 3D. Hotwire es un enfoque para crear aplicaciones web (específicamente, aplicaciones de una sola página o SPA) que envía HTML para encapsular datos complejos en lugar de JSON. Su objetivo es minimizar la necesidad de JavaScript. Cobalt es una plataforma muy liviana para ejecutar aplicaciones creadas a partir de HTML5, CSS y JavaScript. Google, su creador, menciona YouTube como una aplicación típica, pero sospecho que se puede utilizar para trabajos más interesantes. Soundslice de Adrian Holovaty ha incorporado el escaneo de música: puedes cargar un PDF o una foto de una partitura musical y Soundslice la analizará. Luego puedes editarla, reorganizarla y reproducirla. Hardware ¿Un estándar abierto para conectores? Eso es importante si quieres un rendimiento muy alto sin tener que licenciar diseños propietarios. Energy Meter es una herramienta para medir la energía consumida por las CPU de Intel. Podría ser útil en estos días de aplicaciones de IA que consumen mucha energía, aunque no puede dar cuenta de las GPU. Funciona en Linux, pero eso es lo que hacen la mayoría de los servidores del mundo. Mitsubishi ha construido un robot que resuelve el cubo de Rubik en 0,305 segundos. Su mejor tiempo es de 0,204 segundos, pero según Guinness, eso no fue en condiciones adecuadas. Los robots salvavidas se utilizan en el lago Michigan para ayudar a las personas que se están ahogando a mantenerse a flote hasta que pueda llegar un socorrista. Biology Precision Neuroscience ha implantado con éxito un conjunto de 4.096 electrodos miniaturizados en un cerebro humano. De este modo, han conseguido una mayor resolución de la actividad neuronal que con implantes anteriores, incluido el de Neuralink.

Todo lo que necesitas saber sobre tecnología

Tendencias de radar a tener en cuenta: julio de 2024 – O’Reilly

Deja una respuesta Cancelar la respuesta

Tendencias de radar a tener en cuenta: julio de 2024 – O’Reilly

Estos teléfonos Samsung recibirán Android 15

¿Vale la pena una Mac mini en comparación con otras Mac?

Deja una respuesta Cancelar la respuesta