Julio fue un gran mes para los lanzamientos de modelos: hay nuevos modelos grandes de Mistral y Meta, modelos multilingües más pequeños de Mistral y DeepL, otro modelo de Mistral que se especializa en la generación de código y una versión pequeña de GPT-4o. El mundo de la seguridad fue testigo de otro desastre en la cadena de suministro de software cuando CrowdStrike lanzó una mala actualización de software que deshabilitó muchas máquinas Windows en todo el mundo. Si bien el lanzamiento de CrowdStrike no fue «hostil», estrictamente hablando, demuestra que no hay una diferencia real entre un ataque hostil o un error que deshabilite su infraestructura de TI. También estamos viendo un aumento en el tráfico de malware, junto con informes de vulnerabilidad falsos en CVE. La inteligencia artificial AlphaProof y Alpha Geometry de Google resolvieron cuatro de los seis problemas de las Olimpiadas de Matemáticas, un desempeño que habría ganado una medalla de plata en una competencia real. Esto es, con mucho, lo mejor que una IA ha logrado jamás. Sin embargo, fue significativamente más lento que los humanos. Mistral ha lanzado Mistral Large 2, un modelo de 123 mil millones de parámetros que (como otros modelos) afirma tener un rendimiento similar a GPT-4o. Es particularmente fuerte en la generación de código. Mistral también destaca sus capacidades multilingües. Large 2 está disponible en Hugging Face. Facebook/Meta ha lanzado Llama 3.1, un modelo de 405 mil millones de parámetros que afirma tener un rendimiento superior a GPT-4 y Claude 3.5 Sonnet (al menos en los puntos de referencia). Es semiabierto: el código fuente y los pesos están disponibles, pero no los datos de entrenamiento, y hay restricciones en su uso. Google ha desarrollado nuevas técnicas para predecir el clima que combinan la IA y el modelado físico tradicional. El nuevo modelo produce predicciones a largo plazo más precisas y reduce el consumo de energía. Es un buen día para lanzar modelos. NeMo de Mistral es un pequeño modelo de lenguaje multilingüe de código abierto. Tiene una gran ventana de contexto (128K) y funciona bien en inglés, francés, alemán, español, italiano, portugués, chino, japonés, coreano, árabe e hindi. GPT-4o Mini, una versión pequeña del buque insignia GPT-4o de OpenAI, ya está disponible. El rendimiento de Mini supera al de GPT-3.5 Turbo y es mucho más económico por token. OpenAI también afirma que GPT es resistente a los jailbreaks y a la inyección de código. Los expertos en seguridad no están de acuerdo. El último modelo de lenguaje grande de DeepL, que está entrenado para especializarse en traducción, supera a Google Translate y GPT-4 en tareas de traducción. Mistral ha lanzado Codestral Mamba, un nuevo modelo para la generación de código que utiliza la nueva arquitectura Mamba en lugar de Transformers. Mamba es significativamente más rápido que Transformers y se escala linealmente con el tamaño de la entrada. RTNet, un nuevo tipo de red neuronal, parece tomar decisiones de la misma manera que lo haría un humano. Andrej Karpathy reproduce GPT-2 (el modelo completo de 1.600 millones de parámetros) en 24 horas por menos de 700 dólares. Una startup llamada Textgain ha creado un modelo de lenguaje que detecta el discurso de odio en los 24 idiomas de la Unión Europea. Maggie Appleton presenta un excelente argumento sobre el papel de la IA en la habilitación de «desarrolladores descalzos»: programadores no profesionales que resuelven problemas reales e importantes que no están a la escala necesaria para interesar a la industria del software. Microsoft ha lanzado GraphRAG en GitHub. GraphRAG es un conjunto de herramientas para la generación aumentada de recuperación (RAG) que utiliza tecnología de gráficos en lugar de incrustaciones vectoriales para almacenar y recuperar documentos. Con las indicaciones adecuadas, los modelos de lenguaje grandes pueden detectar imágenes falsas casi tan bien como el software personalizado. Los LLM también pueden explicar por qué creen que una imagen es falsa. Figma, la herramienta de diseño colaborativo en línea, ha presentado IA para diseñadores. Las herramientas sirven para buscar ideas, explorar diferentes direcciones y automatizar tareas repetitivas. Estas funciones están actualmente en versión beta y son gratuitas para todos los usuarios hasta fin de año. Toys “R” Us ha creado un anuncio que fue generado en gran parte por SORA, la IA de generación de videos de OpenAI. Claude Projects se suma a las capacidades de Anthropic. Le permite cargar documentos y otros datos que se comparten en todos los chats asociados con el proyecto. Puede compartir proyectos con otras personas de su equipo. (Solo planes Team y Pro). ¿Es este el fin de la GPU? Los investigadores han desarrollado una forma de entrenar modelos de lenguaje sin multiplicación de matrices (MatMul), lo que requiere mucho menos energía. Sus modelos también requieren menos memoria y funcionan de manera similar a los modelos entrenados con MatMul. EspañolProgramación Inrupt, una empresa que comercializa software basado en el protocolo abierto Solid, ha anunciado una billetera de datos para almacenar y compartir de forma segura datos personales.¡El juego de cartas Pipe de Unix debería haber existido hace mucho tiempo!eBPF, que pronto será compatible con Windows, proporciona una función de ejecución segura del núcleo. Si hubiera estado disponible, habría evitado los fallos de CrowdStrike.PythonMonkey permite que los programas Python ejecuten código JavaScript y viceversa. También le da a Python la capacidad de ejecutar módulos WebAssembly (Wasm).1JPM (1 Java Project Manager) presenta un enfoque diferente para la gestión de compilaciones. Es un solo archivo de código fuente de Java, que se edita para reflejar las dependencias de su proyecto y otras personalizaciones. Es una alternativa interesante al ampliamente utilizado y odiado Maven.Un artículo académico analiza los patrones de diseño para aplicaciones de baja latencia en C++. Si bien se centra en el comercio de alta frecuencia, las ideas de este artículo son sin duda útiles para muchos tipos de aplicaciones.The Principles Wiki es una gran fuente de información y debate sobre los principios de diseño de software. Parece ser nuevo; ¡ayúdelo a crecer! Julia Evans (@b0̷rk) da algunos buenos recordatorios de por qué el control de trabajos de shell es útil, y uno de los más importantes es terminar un programa que no responde a CTRL-C. Marimo es un cuaderno de Python que se ejecuta completamente en el navegador usando Wasm y Pyodide. Los elementos del cuaderno, incluidos los elementos de la interfaz de usuario, se ejecutan automáticamente siempre que los modifique o interactúe con ellos. Seguridad El principio del mínimo privilegio en el control de acceso es crucial, pero en la práctica, rara vez se implementa bien. ¿Puede la IA hacer un mejor trabajo al determinar quién debe acceder a qué y cuándo? Una mala actualización de CrowdStrike provocó que muchos sistemas Windows fallaran, lo que provocó graves interrupciones del servicio para aerolíneas, hospitales y otras organizaciones. La seguridad de la cadena de suministro no se trata solo de código abierto; los proveedores comerciales también son un problema. La actualización de 2024 de Cloudflare a su informe de seguridad de aplicaciones afirma que está viendo un aumento sustancial en el tráfico malicioso, que ahora es aproximadamente el 7% de todo el tráfico. El tráfico de bots es un factor importante. Un análisis de un ataque a la cadena de suministro de software muestra cómo el código malicioso se oculta en imágenes aparentemente normales. La ingeniería de estos ataques es cada vez más sofisticada. Blast-RADIUS es un nuevo ataque de intermediario contra el protocolo RADIUS, ampliamente utilizado para autenticación, autorización y contabilidad. Entre otras cosas, RADIUS se utiliza para la autenticación por parte de VPN, ISP y Wi-Fi. Ente Auth es un autenticador de código abierto que proporciona 2FA, copias de seguridad cifradas en la nube y sincronización multiplataforma. Su criptografía ha sido auditada externamente. Una vulnerabilidad recién descubierta en OpenSSH permite la ejecución remota de código no autenticado. Si no se mantiene al día con los parches, es hora de empezar. El sistema CVE, que informa y archiva las vulnerabilidades de seguridad, se ha utilizado cada vez más para informes de vulnerabilidades falsos. Algunos de estos son errores de buena fe, pero un número cada vez mayor proviene de cazarrecompensas y otras personas que intentan enriquecer sus currículums. Los hipervínculos secuestrables son un problema. Estos enlaces tienen URL mal escritas, URL de marcador de posición para sitios que aún no existen y más. Estos errores con frecuencia no se solucionan antes de que el sitio se publique. Cualquiera que descubra estos enlaces puede registrar su nombre de dominio y crear un sitio hostil. SnailLoad es un ataque sorprendente contra la privacidad en línea. Después de que un usuario descarga el malware, que no hace nada abiertamente hostil, SnailLoad monitorea la latencia de Internet. Pequeñas variaciones en la latencia se utilizan como firmas para detectar qué medios está utilizando el usuario. Web Google está abandonando su plan de eliminar la compatibilidad con cookies de terceros en Chrome. En su lugar, habrá controles configurables por el usuario para el uso de cookies. Si bien los defensores de la privacidad se oponen a abandonar el plan de eliminar las cookies, es justo informar que los defensores de la privacidad también se han opuesto a las alternativas propuestas por Google. El Salón de la Vergüenza tiene un catálogo de patrones oscuros que los diseñadores web utilizan para engañar o manipular a los usuarios. Tanto si eres un desarrollador web como un usuario, es una buena idea familiarizarte con los tipos de abusos que existen. WebVM es una emulación virtual de Linux que se ejecuta en el navegador. Se basa en una capa de emulación x86 escrita en WebAssembly. Transfer Thought es una plataforma de código abierto para desarrollar experiencias WebXR (VR, AR, cualquier otro tipo de R). El proyecto Ladybird Browser está recibiendo mucha atención. Es un intento de construir un navegador web compatible con estándares completamente desde cero, sin depender del código de Google u otros proveedores. No se espera una versión alfa hasta 2026. Moonbit es el segundo lenguaje nuevo diseñado específicamente para WebAssembly. Está inspirado en Rust, pero diseñado para ser una buena combinación para la semántica de Wasm. Computación cuántica PsiQuantum, una startup de computación cuántica, planea construir una computadora cuántica de un millón de cúbits en 10 años. A diferencia de otros equipos cuánticos, que se han centrado en construir sistemas pequeños, PsiQuantum está saltando directamente a una computadora que es capaz de realizar un trabajo útil. No es una computadora cuántica personal, pero Quokka es un emulador de computadora cuántica personal con 30 qubits tolerantes a fallas. Es una plataforma para aprender a programar computadoras cuánticas útiles antes de que obtengamos la cosa real. Robótica Un perro robótico con aspiradoras en sus pies puede usarse para limpiar playas. Entrenar a robots humanoides para que bailen puede hacerlos mejores trabajando con humanos. Se vuelven más capaces de aprender nuevos movimientos y gestos. Los investigadores están trabajando en robots que aprenden escuchando. Aunque el audio proporciona pistas importantes para muchas tareas que se les pide a los robots que realicen, rara vez se usa como fuente de datos de entrenamiento. Hardware Tenstorrent ha desarrollado un nuevo conjunto de chips de IA que son mucho menos costosos que los de NVIDIA. Están disponibles como tarjetas PCIe o como componentes de estaciones de trabajo completas. Aprenda más rápido. Investigue más. Vea más lejos.