El tren de lanzamiento de modelos continúa, con el Pixtral 12B multimodal de Mistral, los modelos o1 de OpenAI y el modelo de Roblox para construir escenas 3D. También tenemos otra importante herramienta de programación habilitada para IA: Cursor es una alternativa a GitHub Copilot que está recibiendo excelentes críticas. La seguridad nunca dejará de ser un problema, pero este mes parece particularmente problemático. La botnet Mirai está infectando una cámara de vigilancia ampliamente utilizada que no se puede reparar; la única mitigación conocida es reemplazar la cámara. Y los atacantes se dirigen a los participantes en proyectos de GitHub, les dicen que su proyecto tiene vulnerabilidades y los envían a un sitio de malware para obtener más información. Aprende más rápido. Profundiza más. Ver más lejos. La inteligencia artificial Simon Willison utiliza la utilidad curl para descubrir cómo funcionan las API de transmisión para modelos de lenguaje grandes. La pérdida de Goldfish es una nueva función de pérdida que los modelos de lenguaje pueden usar para minimizar la «memorización» de pasajes largos durante el entrenamiento. Es menos probable que los modelos entrenados de esta manera generen el material en el que fueron entrenados. OpenAI ha puesto dos modelos en versión limitada (vista previa): OpenAI o1-mini y o1-preview. Ambos reducen los errores y las alucinaciones mediante la implementación del razonamiento en cadena de pensamientos. o1-preview dedica más esfuerzo a razonar los problemas antes de generar una respuesta; o1-mini afirma ser un modelo rentable y más preciso para el razonamiento científico. Mistral ha lanzado Pixtral 12B, su primer modelo multimodal. Permite mezclar imágenes con texto y documentos como entrada. No parece crear resultados de imágenes, pero puede generar código (por ejemplo, para un sitio web) a partir de un boceto. El chat está disponible a través de Le Chat de Mistral, el código y los pesos a través de GitHub y Hugging Face. Pixtral tiene licencia Apache 2.0 y se puede ajustar y usar sin restricciones. Roblox ha creado un modelo generativo que crea escenas 3D a partir de indicaciones de texto. Dejando a un lado el potencial de trampa, conectar una calculadora gráfica TI-84 a ChatGPT es uno de los mejores trucos. lo hemos visto durante bastante tiempo. Anthropic ha anunciado Claude for Enterprise, que ofrece ventanas de contexto más grandes, integración de GitHub y funciones de seguridad (inicio de sesión único, acceso basado en roles, registros de auditoría y gestión de identidades). mejores para simular humanos, ¿necesitaremos “credenciales de personalidad” para demostrar nuestra humanidad? (¿Y qué pasa si las agencias emisoras, que podrían incluir a los gobiernos, deciden utilizar las credenciales de personalidad como herramienta política?) Los chatbots no saben cuándo decir “ayuda”, un punto muy importante. Una fuente importante de errores en la IA es la incapacidad de afirmar que no sabe la respuesta. OpenAI y Anthropic han acordado dar acceso avanzado a sus modelos al Instituto de Seguridad de la IA Artificial de EE. UU. para que se pueda probar su seguridad. pueden jugar videojuegos son algo obsoleto. Ahora pueden ser el juego, no sólo jugarlo. Un proyecto de Google ha creado un modelo que puede simular el juego Doom de los años 90, utilizando técnicas desarrolladas para Stable Diffusion. ¿Podría usarse para generar nuevos juegos, no solo para emular los más antiguos? Google ha vuelto a habilitar la generación de imágenes humanas del modelo Gemini. Anthropic ha habilitado el intercambio de solicitudes de origen cruzado (CORS) para las API JSON de los modelos Claude. Este cambio significa que las aplicaciones que se ejecutan en un navegador pueden interactuar directamente con Claude. Programación Con la adición de multitarea preventiva al kernel, Linux ahora puede ser un verdadero sistema operativo en tiempo real. ¿Quiere implementar Lisp en las macros de Rust? Aquí está. Otro lenguaje de programación interesante: Fennel tiene macros y sintaxis similar a Lisp pero se integra con Lua. Está compilado y se puede utilizar para sistemas integrados. lwIP es una pila de IP de código abierto, pequeña y liviana. Está diseñado para ejecutarse en sistemas con muy poca memoria, por ejemplo, pequeños sistemas integrados. La Unión Europea está construyendo e implementando una billetera digital estandarizada e interoperable. Handoff es un nuevo proyecto de código abierto que permite a los desarrolladores de software utilizar tokens de diseño Figma en el código. sin requerir una licencia Figma. Ayuda a integrar el trabajo de los diseñadores con el desarrollo de software. Tres años después de cambiar su licencia de código abierto a fuente comercial, Elastic ha devuelto sus productos, ElasticSearch y Kibana, a una licencia de código abierto. El editor de código Cursor AI ha recibido excelentes críticas. . Es similar a GitHub Copilot pero integrado con Claude 3.5 Sonnet. Aquí tienes una buena introducción. ¡Visita el nuevo sitio web de Dynamicland! Dynamicland de Bret Victor demuestra una forma convincente de utilizar las computadoras para facilitar la colaboración entre personas y máquinas. Se trata de computar con personas del mundo real, con materiales reales. El sitio de Dynamicland no había cambiado en años; este nuevo sitio actualiza la visión de Dynamicland. Microsoft ha donado el proyecto Mono, la implementación multiplataforma de .Net, al proyecto Wine. Valkey, la bifurcación de código abierto del antiguo almacén de valores clave Redis de código abierto, está ganando impulso. en parte porque está realizando mejoras que los usuarios de Redis querían. Un nuevo algoritmo “absurdamente rápido” promete acelerar el tráfico a través de las redes. Seguridad Una campaña de malware llamada “GitHub Scanner” envía correos electrónicos a los participantes en proyectos específicos afirmando que su proyecto tiene vulnerabilidades de seguridad. Los correos electrónicos parecen provenir de GitHub. Se pide a las víctimas que visiten un sitio que instala malware. Microsoft ha actualizado su biblioteca criptográfica principal, SymCrypt, con algoritmos criptográficos poscuánticos. Las redes WiFi, ya sea en la oficina, el hogar o una cafetería, son sorprendentemente fáciles de atacar. A continuación se ofrecen algunos buenos consejos para mantener a los intrusos fuera de su red. Un investigador de seguridad compró, de forma algo accidental, el dominio (caducado) del antiguo servidor WHOIS para el dominio .mobi. Descubrieron que las autoridades de certificación (CA) todavía utilizaban el servidor antiguo para verificar la propiedad del dominio. Todo ha vuelto a la normalidad, pero ¿realmente necesitamos decir nuevamente que la pila de IP tiene vulnerabilidades profundas y fundamentales? RAMBO es un nuevo ataque que roba datos de sistemas aislados manipulando la RAM de manera que genere señales de radio decodificables. Otro ataque contra sistemas aislados aprovecha el ruido acústico generado por las pantallas. Los atacantes están utilizando comentarios en GitHub para recomendar soluciones falsas que instalan malware. El rock and roll nunca morirá. Tampoco lo hará la botnet Mirai. Se ha estado extendiendo entre un modelo de cámara de seguridad ampliamente utilizado y que no se puede reparar. La única mitigación sería que los usuarios de la cámara de seguridad la reemplacen, y eso no es probable. La ingeniería del caos, una técnica de prueba que introduce fallas aleatoriamente en un sistema, se ha utilizado para medir la vulnerabilidad de un sistema a la denegación de acceso distribuida. ataques de servicio (DDOS) y evaluar la respuesta del sistema, lo que permite a los operadores mitigar las vulnerabilidades. El autor de Web O’Reilly, Holden Karau, ha desarrollado una plataforma que utiliza inteligencia artificial para ayudar a las personas a luchar contra las denegaciones de reclamaciones de seguros médicos. La plataforma ayuda a generar las muchas cartas y formularios necesarios para protestar por un rechazo. A juzgar por la charla en línea sobre Mastodon y Bluesky, el festival final de XOXO fue claramente el evento que no debía perderse. Los vídeos de 2024 aún no están online. ¿Qué puedes esconder en un millón de casillas de verificación? Un montón de cosas: URL, imágenes, animaciones… Aquí hay una historia sobre creatividad, juego, subversión y software que vale la pena leer. La revuelta contra los complejos marcos de JavaScript continúa. ¿Habrá un resurgimiento de PHP? Quizás no sea sorprendente, pero GPT es bueno para desminificar código; el resultado es bastante claro y legible. Minimizar significa reemplazar nombres significativos por nombres cortos y sin sentido y hacer otros trucos para reducir el tamaño del código (y ofuscar su significado). Se utiliza principalmente para JavaScript. Hardware Flow Computing es una nueva arquitectura para CPU de uso general que combina núcleos diseñados para procesamiento paralelo con núcleos de uso general. Cerebras, fabricante de algunos de los chips más grandes del mundo, ha anunciado Cerebras Inference, un procesador que puede realizar inferencias en aproximadamente 20 veces la velocidad y una quinta parte del costo por token de NVIDIA H100. A 1.800 tokens por segundo, Llama 3.1-8B es casi instantáneo. Computación cuántica Microsoft afirma haber resuelto un problema químico del mundo real utilizando un sistema híbrido compuesto por procesadores clásicos y cuánticos. Los investigadores de Google afirman haber creado un único qubit lógico con tasas de error reducidas. La tasa de error disminuye aún más a medida que se agregan más qubits físicos al qubit lógico. Vale la pena leer la discusión de Scott Aaronson. Los Laboratorios Nacionales de Oak Ridge, que actualmente cuentan con la supercomputadora más rápida del mundo, están experimentando con la adición de un acelerador cuántico. Robótica Un nuevo diseño de piernas robóticas se centra en la construcción de músculos artificiales. Las piernas que incorporan este diseño parecen ser mucho más capaces y eficientes que las extremidades tradicionales accionadas por motor. Se recomienda ser escépticos ante los videos que muestran robots humanoides haciendo cosas asombrosas. Hay muchos trucos: selección selectiva, por supuesto, pero también operadores humanos fuera de campo, terrenos cuidadosamente elegidos que no son realistas y muchos otros. Biología