2024 comenzó con aún más IA: un modelo de lenguaje pequeño de Microsoft, un modelo nuevo (pero sin nombre) de Meta que compite con GPT-4 y un modelo de texto a video de Google que afirma ser más realista que cualquier otro hasta el momento. La investigación sobre cuestiones de seguridad también ha progresado y, lamentablemente, ha descubierto más problemas que soluciones. Un hilo común en varios ataques recientes ha sido el uso de incrustaciones: un atacante descubre texto o imágenes inofensivas que tienen una incrustación similar a palabras que describen acciones que no están permitidas. Estas entradas inocuas pasan fácilmente por filtros diseñados para evitar mensajes hostiles. AI ChatGPT puede filtrar conversaciones privadas a terceros. Ten mucho cuidado con lo que pones en tus indicaciones; no hay forma de predecir qué se filtra ni por qué. La fusión de grandes modelos de lenguaje ofrece a los desarrolladores lo mejor de muchos mundos: utilizar diferentes modelos para resolver diferentes tipos de problemas. Es esencialmente una mezcla de expertos, pero se aplica a nivel de aplicación de la pila en lugar de a nivel de modelo. Los investigadores han desarrollado un método para detectar texto generado por IA que tiene una precisión del 90% y una tasa de falsos positivos de solo el 0,01%. Google ha anunciado Lumiere, un modelo de texto a video que genera movimiento «realista, diverso y coherente». Lumiere genera el vídeo completo de una sola vez, en lugar de generar fotogramas clave distintos que luego se fusionan. ¿Es JavaScript un lenguaje útil para desarrollar aplicaciones de inteligencia artificial? New Stack enumera cinco herramientas para crear aplicaciones de inteligencia artificial en JavaScript, comenzando con TensorFlow.js. Meta ha lanzado un nuevo modelo de lenguaje que afirma tener un rendimiento similar al GPT-4. Es un modelo de lenguaje autogratificante; evalúa continuamente sus respuestas a las indicaciones y ajusta sus parámetros en respuesta. Ya existe una implementación independiente de código abierto en GitHub. Los hospitales están utilizando técnicas de aprendizaje federado para recopilar y compartir datos de pacientes sin comprometer la privacidad. Con el aprendizaje federado, los hospitales no comparten datos reales de los pacientes, sino modelos de aprendizaje automático basados ​​en datos locales. Los investigadores han descubierto «ataques compositivos» contra modelos de lenguaje multimodal. En estos ataques, se utilizan mensajes que combinan texto e imágenes para «hacer jailbreak» al modelo. Una imagen hostil pero de apariencia benigna establece un contexto en el que el modelo ignora sus barreras de seguridad. Los investigadores han utilizado pruebas para perfilar psicológicamente a los humanos para perfilar modelos de IA e investigar sus sesgos y prejuicios incorporados. La optimización de preferencias directas (DPO) es un algoritmo para entrenar modelos lingüísticos para que funcionen de acuerdo con las preferencias humanas. Es más simple y más eficiente que RLHF. Mistral ha publicado un artículo que describe su modelo Mixtral 8x7B, una mezcla de modelos de expertos con un rendimiento muy impresionante. Volkswagen ha añadido ChatGPT al sistema de información y entretenimiento de sus coches. ChatGPT no tendrá acceso a ninguno de los datos del automóvil. Los modelos de lenguaje se basan en la conversión de tokens de entrada en incrustaciones (largas secuencias de números). ¿Se puede recuperar el texto original a partir de las incrustaciones utilizadas con los modelos de lenguaje? La respuesta puede ser sí. El producto de inteligencia artificial de AWS, Q, ahora tiene herramientas para automatizar la actualización de programas Java a nuevas versiones. Eso incluye encontrar y reemplazar dependencias obsoletas. El modelo Phi-2 de Microsoft ahora es de código abierto; se le ha vuelto a otorgar la licencia MIT. Phi-2 es un modelo pequeño (2,7 mil millones de parámetros) con un rendimiento comparable al de modelos mucho más grandes. El resumen de IA de Simon Willison en 2023 es el mejor que hemos visto. El año que viene, a Simon le encantaría vernos ir más allá del “desarrollo basado en vibraciones”. A diferencia de la programación tradicional, la IA no hace lo que usted le dice que haga, y con frecuencia nos vemos obligados a evaluar los resultados de la IA en función de si «se siente bien». La FTC de EE. UU. ha lanzado un desafío a los desarrolladores: desarrollar software que puede detectar clones de voces humanas generados por IA. El ganador recibirá un premio de 25.000 dólares. DeepMind ha creado un modelo que puede resolver problemas de geometría. El nuevo modelo combina un modelo de lenguaje con IA simbólica, dándole la capacidad de razonar lógicamente sobre problemas además de hacer coincidir patrones. Programación Cualquier aplicación puede volverse extensible. Extism es una biblioteca WebAssembly que se puede agregar a casi cualquier aplicación y que permite a los usuarios escribir complementos en la mayoría de los principales lenguajes de programación. Zed, un editor de código colaborativo, ahora es de código abierto y está disponible en GitHub. Un estudio de GitHub muestra que crear un Una buena experiencia de desarrollador (DevEx o DX) mejora la productividad al reducir la carga cognitiva, acortar los ciclos de retroalimentación y ayudar a los desarrolladores a permanecer en un «estado de flujo». Julia Evans (@b0rk@jvns.ca) ha compilado una lista de errores comunes de Git. es un emulador de Flash construido con Rust y WASM. Si bien es posible que no recuerdes Macromedia Flash y probablemente no quieras usarlo para contenido nuevo, el New York Times está usando Ruffle para resucitar contenido de archivo que usaba Flash para visualizaciones. ¿JavaScript como lenguaje shell? Bun es un shell de JavaScript de código abierto que puede ejecutarse en Linux, MacOS y Windows. Es el único shell que es verdaderamente independiente de la plataforma. Shadeup es un nuevo lenguaje de programación que amplía TypeScript. Está diseñado para simplificar el trabajo con WebGPU. Rethinking Observability aboga por pensar en cómo los usuarios experimentan un servicio, en lugar de los detalles de la implementación del servicio. ¿Cuáles son los recorridos críticos del usuario (CUJ) y cuáles son los objetivos de nivel de servicio (SLO) para esos recorridos a través del sistema? Marimo es un nuevo portátil Python con algunas características importantes. Cuando editas cualquier celda, actualiza automáticamente todas las celdas afectadas; los cuadernos en sí son Python puro y se pueden administrar con Git y otras herramientas; GitHub Copilot está integrado en el editor Marino. LinkedIn ha lanzado su marco de productividad y felicidad del desarrollador, un conjunto de métricas para procesos que afectan la experiencia del desarrollador. Las métricas incluyen cosas como el tiempo de respuesta de la revisión del código, pero LinkedIn señala que el marco es más útil para ayudar a los equipos a crear sus propias métricas. El registro de paquetes de Node, NPM, aceptó recientemente un paquete llamado «todo» que vincula a todo lo que está en el registro. . Queda por ver si esto fue una broma o un ataque hostil, pero un efecto secundario importante es que se volvió imposible eliminar un paquete de NPM.container2wasm toma una imagen de contenedor y la convierte a Web Assembly. El ejecutable WASM se puede ejecutar con WASI o incluso en un navegador. Este proyecto aún se encuentra en sus primeras etapas, pero es muy impresionante. AHA Stack proporciona una forma de crear aplicaciones web que minimiza el JavaScript del lado del navegador. Está basado en el marco Astro, htmx y Alpine.js. El año pasado terminó con Brainfuck implementado en PostScript. Para comenzar el año 2024, alguien ha encontrado un intérprete de Lisp funcional escrito en Malbolge, un lenguaje que compite con Brainfuck por ser el lenguaje de programación más difícil, frustrante y obtuso que existe. El año comienza con un nuevo marco web Python, Microdot. ¿Cuánto tiempo ha pasado desde que tuvimos un nuevo marco de Python? Es muy similar a Flask, pero es pequeño; fue diseñado para ejecutarse en MicroPython, que se ejecuta en microcontroladores como ESP8266. Odin es otro nuevo lenguaje de programación. Admite programación orientada a datos y promete un alto rendimiento con control explícito (aunque seguro) de la gestión y el diseño de la memoria. Reivindica simplicidad, claridad y legibilidad. Seguridad El Centro Nacional de Seguridad Cibernética del Reino Unido advirtió que la IA generativa se utilizará en ransomware y otros ataques. La IA generativa hará que la ingeniería social y el phishing sean más convincentes; permitirá a actores inexpertos crear ataques mucho más peligrosos. Una presentación en el simposio de seguridad de USENIX sostiene que los canales laterales filtran información en casi todas las PC comerciales: micrófonos, cámaras y otros sensores captan señales electromagnéticas del procesador. Estas señales se pueden capturar y decodificar. Como todos los demás, los grupos de malware se están trasladando a lenguajes seguros para la memoria como Rust y DLang para desarrollar sus cargas útiles. Los investigadores han descubierto que se pueden utilizar datos de entrenamiento envenenados para insertar puertas traseras en modelos de lenguaje grandes. Estas puertas traseras pueden activarse mediante indicaciones especiales y no pueden descubrirse ni eliminarse mediante las técnicas de seguridad actuales. Es probable que los programadores que utilizan asistentes de IA escriban código que sea menos seguro mientras creen que su código es más seguro. Sin embargo, los usuarios de asistentes de IA que no “confían” en la IA, se involucran más con el código producido y es probable que produzcan código que sea más seguro. Una variante del malware Mirai está atacando los sistemas Linux. Esta variante encuentra contraseñas SSH débiles e instala software de minería de criptomonedas para crear una botnet de minería. Muchos grupos ofrecen “recompensas por errores” que pagan recompensas a quienes descubren errores (particularmente vulnerabilidades de seguridad) en su código. Un mantenedor de código abierto sostiene que este proceso está siendo distorsionado por informes de errores incorrectos generados por la IA, lo que hace perder el tiempo a los mantenedores. El Instituto Nacional de Estándares y Tecnología de EE. UU. ha publicado una taxonomía y terminología estándar para ataques contra sistemas de aprendizaje automático y IA. La web Nimbo Earth Online pretende ser un “gemelo digital” de la Tierra. Es superficialmente similar a Google Earth, pero tiene características fascinantes como la capacidad de ver progresiones históricas: por ejemplo, cómo cambió un paisaje después de un incendio o cómo el curso de un río vagó a lo largo de los años. Un estudio muestra que los resultados de búsqueda empeoran a medida que pasa como resultado del spam de SEO. El problema afecta a todos los principales motores de búsqueda. Si lees el artículo e ignoras los resúmenes de cebo de clics, Google está haciendo un trabajo algo mejor que sus competidores a la hora de mantener la integridad de la búsqueda. The Verge tiene un excelente artículo sobre cómo la optimización de los sitios para la búsqueda de Google ha afectado el diseño web, haciendo que los sitios sean mucho más homogéneos. La aplicación de Facebook incluye una nueva configuración de Historial de enlaces (activada de forma predeterminada) que fomenta el uso del navegador integrado de la aplicación. El historial de enlaces guarda todos los enlaces y se sabe que el navegador incluye un registrador de teclas; Los datos de ambos se utilizan para publicidad dirigida. Computación cuántica Si bien todavía no tenemos computadoras cuánticas utilizables, se ha publicado una mejora del algoritmo de Shor para factorizar números. Si bien reduce el tiempo de cálculo de O(N^2) a O(N^1,5), aumenta la cantidad de qubits necesarios, lo que puede ser una limitación importante. Aprende más rápido. Excavar más hondo. Ver más lejos.

Source link