Este mes, le daremos un descanso a la IA. Alex Russell ha terminado una excelente serie de publicaciones titulada “Reckoning”. Es una lectura obligada para los desarrolladores web. Si quieres entender por qué nuestras redes y computadoras portátiles son mucho más rápidas que hace 15 o 20 años, pero la web es más lenta, todo se reduce a una cosa: JavaScript inflado. Alex ofrece una salida. El último festival XOXO terminó y lamento haberme perdido. XOXO ha sido un lugar de reunión para artistas experimentales y otras personas que viven y trabajan en línea. A juzgar por los muchos comentarios en Mastodon, Bluesky y Twitter, fue genial. Un tema clave fue construir redes que sean saludables y donde las personas sean respetadas. Busca los videos cuando se publiquen; sin duda los incluiré en las tendencias del próximo mes. Aprende más rápido. Profundiza. Ve más lejos. Y tenemos una sección legal poco común con artículos sobre la regulación de la IA, Telegram y licencias de código abierto. AI Anthropic ha publicado los mensajes del sistema para sus modelos Claude. Es interesante que Claude prefiera respuestas breves, evite palabras como «por supuesto» y pueda dividir una tarea más larga en partes, ejecutando cada una de ellas por separado. Muchos desarrolladores informan de un enorme ahorro de tiempo al utilizar la IA generativa para comprender o actualizar el código heredado. Andy Jassy, ​​director ejecutivo de Amazon, ha afirmado que ahorraron 4.500 años de desarrollo al utilizar la IA para actualizar 30.000 aplicaciones Java de Java 8 a Java 17. La IA generativa se puede utilizar para mejorar la calidad de los datos al automatizar el proceso de etiquetado de datos con metadatos. Andrew Ng ha publicado un modelo que permite experimentar con geoingeniería simulando la inyección de aerosoles reflectantes en la atmósfera. Alibaba ha publicado dos nuevos modelos, Qwen2-Math y Qwen2-Audio, que están (como era de esperar) diseñados para trabajar con matemáticas y audio. Nos gustaría ver el modelo Math en un enfrentamiento con AlphaProof de DeepMind. La Iniciativa de Código Abierto (OSI) ha publicado la versión 0.0.9 de su definición de IA de Código Abierto. Su definición requiere que los datos de entrenamiento se reconozcan como parte de un sistema de código abierto. Se anunciará una versión estable de la definición en octubre de 2024. Google ha lanzado Imagen 3, su modelo de texto a imagen de última generación. Puedes probarlo en ImageFX o Vertex. Ideogram 2 es otro modelo de texto a imagen impresionante. Hay una aplicación para iOS y una IA. La «indicación mágica» te permite cargar una imagen y generar una descripción, y luego usar la descripción como base para indicaciones futuras. Eso es muy útil, aunque podría ser la base de problemas de derechos de autor. Claude ahora tiene almacenamiento en caché de indicaciones controlable por el usuario: usando la API, los usuarios pueden marcar partes de indicaciones largas (incluidos los datos) para que se almacenen en caché. Los elementos almacenados en caché no necesitan volver a calcularse. Los avisos que reutilizan los datos en la memoria caché cuestan mucho menos de ejecutar. El científico de IA, un sistema de IA diseñado para realizar investigación científica autónoma, modificó inesperadamente su propio código para darle más tiempo para ejecutarse. Nick Hobbs sostiene que necesitamos diseñadores de IA (diseñadores que se especialicen en diseñar para IA, que estén íntimamente familiarizados con la IA y sus capacidades) para crear nuevos productos genuinamente innovadores. La discusión de Simon Willison sobre la tarjeta del sistema GPT-4o es fascinante. Entre otras cosas, probaron si podía superar los desafíos de Capture the Flag contra un sistema Linux. Falló (en su mayoría). DeepMind ha desarrollado un jugador de ping pong robótico impulsado por IA. Es bueno, pero aún no es una amenaza para los jugadores humanos avanzados. La API de GPT ahora cuenta con salidas estructuradas, lo que hace que entregue resultados de acuerdo con un esquema JSON especificado por el usuario. Además de simplificar el desarrollo de software, la restricción de que GPT solo puede generar tokens de salida que se ajusten al esquema mejora su precisión. Durante aproximadamente un año, OpenAI ha tenido un sistema de marca de agua para GPT que puede detectar si un texto fue escrito por su IA. No lo han implementado. Aparentemente es fácil de vencer (reescribiendo el texto con otro LLM); también creen que haría que el uso de GPT sea menos atractivo. Flux.1 es una nueva familia de modelos de texto a imagen de peso abierto que afirma tener un rendimiento de vanguardia. Whisper-Medusa es un modelo de voz a texto que afirma ser el doble de rápido que Whisper de OpenAI con una precisión equivalente. Google ha lanzado Gemma 2 2B, el más pequeño de su familia Gemma de modelos de lenguaje pequeños. Google también ha lanzado ShieldGemma, un modelo especializado para detectar entradas y salidas dañinas, y Gemma Scope, un conjunto de codificadores automáticos dispersos diseñados para ayudar a los investigadores a comprender lo que sucede dentro de los modelos de lenguaje. OpenAI finalmente lanzó el bot ChatGPT habilitado por voz a un grupo limitado de suscriptores de ChatGPT+. El lanzamiento general para todos los suscriptores debería tener lugar este otoño. La función se anunció en mayo, pero se retuvo para seguir trabajando en seguridad. OpenAI ha anunciado SearchGPT, un motor de búsqueda basado en IA. Todavía no está disponible, pero puede registrarse en una lista de espera. Angels and Cows es una novela de ciencia ficción/fantasía que se escribió para ayudar a las personas a pensar en la aplicación de la inteligencia artificial a cuestiones de justicia social. Es un intento de un nuevo tipo de comunicación científica. Hay disponible un PDF gratuito. Las hojas de cálculo son difíciles para los modelos de lenguaje; su estructura no se presta a la codificación para su procesamiento por LLM. Microsoft ha desarrollado un SpreadsheetLLM que ha sido diseñado para trabajar con hojas de cálculo. Programación Si te gusta la programación visual bidimensional, puede que te guste Turnstyle, un nuevo lenguaje esotérico. Es desafiante, extraño y divertido (si te gusta ese tipo de diversión). La nueva versión de Istio, una parte del ecosistema de Kubernetes, ya no requiere sidecars para administrar la red y la seguridad de cada servicio. La nueva alternativa se llama «malla ambiental» y se basa en un túnel de confianza cero. ¿Es esto realmente más simple y rápido? Lo averiguaremos. Para los usuarios de la línea de comandos, aquí hay una lista de herramientas modernas de Unix. La mayoría de los elementos son replanteamientos de herramientas familiares: bat es cat con resaltado de sintaxis, atuin es el historial del shell respaldado por una base de datos. Definitivamente vale la pena explorarlo. Si no entiendes por qué las cosas no siempre cuadran cuando usas números de punto flotante, y en particular, si no entiendes por qué nunca deberías usar el punto flotante cuando trabajas con dinero, deberías leer la Guía del punto flotante. AudioFlux es una biblioteca de herramientas para analizar música y otros tipos de audio. Postgres.new te ofrece la base de datos PGlite ejecutándose en un sandbox de navegador con soporte de IA generativa. PGlite es una implementación de Postgres en WebAssembly. Los desarrolladores prometen que, pronto, será posible implementarlo en AWS S3. Un nuevo programa de DARPA, Translating All C to Rust (TRACTOR), pretende desarrollar herramientas de IA para hacer que el código C heredado sea seguro para la memoria traduciéndolo a Rust. Si bien esa traducción ya es posible, es propensa a errores. TRACTOR tiene como objetivo mejorar la calidad y confiabilidad de las traducciones. WhenFS convierte tu Google Calendar en un sistema de archivos montable. Nadie sabe realmente por qué querrías hacer esto. Archive esto en el mismo espacio mental que los lenguajes de programación esotéricos. “age es una herramienta, formato y biblioteca de Go de cifrado de archivos simple, moderna y segura”. El repositorio de GitHub lo dice todo. No escriba la a con mayúscula. age puede generar claves para ssh y puede interoperar con Yubikey. Netflix ha abierto el código fuente de Maestro, un motor de servicios de datos. Maestro admite flujos de trabajo de datos a gran escala, como canalizaciones de datos. AWS está descontinuando silenciosamente los servicios que tienen un uso insuficiente, de los cuales CodeCommit es el más notable. No están agregando nuevos usuarios ni actualizarán los servicios, excepto los parches de seguridad. Este es un cambio significativo en las políticas de AWS. Score es una nueva herramienta para el desarrollo centrado en la infraestructura. Permite a los desarrolladores escribir software mientras reduce la necesidad de comprender la implementación. Asegura que el nuevo código sea compatible con la infraestructura, por ejemplo, administrando la transición de Docker a Kubernetes. Chattr es una utilidad de comandos de Linux que le permite manipular los permisos de archivos de formas que van más allá del chmod estándar de Unix. Entre otras cosas, puede evitar la sobrescritura accidental de archivos. Orca es un entorno de ejecución para WebAssembly (Wasm) que no requiere la web. Te permite escribir aplicaciones Wasm que se ejecutan en una computadora portátil. Seguridad ¿Otro paso hacia el fin de las contraseñas? Docker está desaprobando el uso de contraseñas. En septiembre, requerirán inicio de sesión único (SSO) y tokens de acceso personal (PAT) para el acceso a la línea de comandos. La revisión de ransomware de Palo Alto Networks para la primera mitad de 2024 muestra que el aumento de los ataques de ransomware que informó a principios de 2024 no fue una casualidad; han continuado. Una charla en Defcon 2024, Living off Microsoft Copilot, demostró una serie de exploits contra Copilot. Incluían ejecución de código remoto, exfiltración de datos y generación de phishing. El repositorio de riesgos de IA incluye una base de datos de riesgos de IA conocidos, una taxonomía de causas de riesgo de IA y una taxonomía de los riesgos en sí. Es gratis copiarlo y usarlo. Una charla en Black Hat ha demostrado que los bots de Microsoft Copilot son inseguros debido a valores predeterminados inadecuados y otros problemas que los dejan expuestos a ataques. Muchos de estos problemas se han solucionado desde la charla, pero los cambios solo afectan a las nuevas instalaciones. Google ha anunciado que solicitará a los usuarios que hayan habilitado la navegación segura mejorada que le proporcionen las contraseñas necesarias para decodificar archivos protegidos con contraseña para que puedan examinarse. Los archivos protegidos con contraseña se utilizan a menudo para distribuir malware. Web ¿Quién te está vigilando? El proyecto Surveillance Watch ha publicado un mapa de empresas dedicadas a la recopilación y vigilancia de datos, sus afiliados, sus objetivos y más. Es un mapa impresionante de la industria de la vigilancia. Google está implementando una función experimental en Chrome para Android que eliminará datos de tarjetas de crédito, contraseñas y otra información confidencial cuando se comparta una pantalla. Reckoning, la serie de cuatro partes de Alex Russell sobre la cultura de los marcos de JavaScript y el daño que ha causado a la web, es una lectura obligada. Russell recomienda el Manual de servicio de gov.uk, en particular su página sobre mejoras progresivas, como guía para crear servicios responsivos. El Proyecto Wallace parece un excelente conjunto de herramientas de análisis para desarrolladores web que trabajan con CSS. Google está facilitando a las víctimas solicitar la eliminación de imágenes deep fake no consentidas. Su algoritmo de búsqueda también se está modificando para rebajar la clasificación de las imágenes deep fake. Los científicos de hardware de la Universidad de Pekín han desarrollado una unidad de procesamiento tensorial (TPU) altamente eficiente basada en nanotubos de carbono. Looking Glass tiene una pantalla holográfica 3D del tamaño de un teléfono celular a un precio razonable ($299), además de modelos del tamaño de un portátil y un monitor. Puede mostrar imágenes 3D de Vision Pro de Apple. ¿Podemos imaginar la realidad virtual sin auriculares? ¿Palancas de cambio inalámbricas para bicicletas? Si las tienes (y algunas bicicletas de alta gama las tienen), pueden ser pirateadas. Eso podría convertirse en un problema si eres un corredor. NVIDIA puede tener competencia. Groq, una startup que fabrica unidades de procesamiento de lenguaje (LPU), tiene ofertas de hardware y nube que parecen muy competitivas para hacer inferencias con modelos de lenguaje grandes. Privacy Lens es una nueva cámara que mejora la privacidad con dos lentes: una lente tradicional y una lente térmica. Utiliza la lente térmica para convertir imágenes humanas en monigotes con información de identificación (por ejemplo, color de piel, cabello) eliminada. Law OpenAI y Anthropic acordaron dar acceso avanzado a sus modelos al Instituto de Seguridad de IA Artificial de EE. UU. para que puedan probarse en cuanto a seguridad. La legislatura del estado de California aprobó un proyecto de ley que regula el desarrollo de IA. El proyecto de ley tiene como objetivo defenderse contra las amenazas a la seguridad pública y requiere la implementación de un «interruptor de apagado». Pavel Durov, el fundador de la aplicación de mensajería Telegram, ha sido arrestado y acusado en Francia. Los cargos incluyen difundir imágenes de abuso infantil y tráfico de drogas utilizando la aplicación. Un tribunal ha desestimado las partes relacionadas con la DMCA de la denuncia del demandante en una demanda histórica que involucra el uso de código fuente abierto por parte de IA generativa. Las reclamaciones sobre incumplimiento de contrato por violaciones de licencias de código abierto aún están en juego. Biología El proyecto GROVER intenta tratar el ADN como un lenguaje y utiliza IA para decodificar ese lenguaje.