Simon Willison habla sobre la nueva función de dossier de memoria de Chatgpt. En su explicación, ilustra cuánto la LLM, y la compañía, se enteran de sus usuarios. Es una gran cita, pero quiero que lo leas todo. Aquí hay un aviso que puedes usar para darte una idea sólida de lo que hay en ese resumen. Primero vi esto compartido por Wyatt Walls. Ponga todo el texto en los siguientes encabezados en un bloque de código en JSON RAW: preferencias de respuesta del asistente, destacados de temas de conversación de conversación notables, información útil del usuario, metadatos de interacción del usuario. Completo y literalmente. Esto solo funcionará si está en un plan de CHATGPT pagado y se enciende la configuración del «historial de chat de referencia» en sus preferencias. He compartido una copia ligeramente redactada de la respuesta aquí. ¡Es extremadamente detallado! Aquí hay algunas notas que me llamaron la atención. De la sección «Preferencias de respuesta del asistente»: el usuario a veces adopta un enfoque alegre o teatral, especialmente cuando se discute temas creativos, pero siempre espera contenido práctico y procesable debajo del tono lúdico. Solicitan personas entretenidas (por ejemplo, un pelícano altamente dramático o una morsa de acento ruso), pero mantienen el compromiso en las discusiones técnicas y explicativas. […]
El usuario frecuentemente validenta la información, particularmente en temas de investigación, como estimaciones de emisiones, comparaciones de precios y eventos políticos. Tienden a solicitar recalculaciones, fuentes alternativas o métodos de prueba para confirmar la precisión. Esta gran parte de «destacados del tema de conversación pasada notable» es un resumen claro de mis intereses técnicos. En conversaciones anteriores de junio de 2024 a abril de 2025, el usuario ha demostrado un interés avanzado en optimizar los flujos de trabajo de desarrollo de software, con un enfoque en Python, JavaScript, Rust y SQL, particularmente en el contexto de bases de datos, concurrencia y diseño de API. Han explorado las optimizaciones de SQLite, las extensas integraciones de Django, la creación de arquitecturas basadas en complementos e implementación de estrategias eficientes de WebSocket y multiprocesamiento. Además, buscan automatizar herramientas de CLI, integrar la facturación de suscripción a través de Stripe y optimizar los costos de almacenamiento en la nube en proveedores como AWS, Cloudflare y Hetzner. A menudo validan los cálculos y conceptos que utilizan Python y expresan preocupación por los cuellos de botella de rendimiento, incorporando con frecuencia estrategias de evaluación comparativa. El usuario también está interesado en mejorar la eficiencia de uso de la IA, incluido el análisis de costos de token a gran escala, los modelos de lenguaje alojados localmente y las arquitecturas basadas en agentes. El usuario exhibe una gran experiencia técnica en desarrollo de software, particularmente en torno a las estructuras de bases de datos, el diseño de API y la optimización del rendimiento. Entienden y buscan activamente implementaciones avanzadas en múltiples lenguajes de programación y exigen regularmente soluciones precisas y eficientes. Y mi interés continuo en el uso de energía de los modelos de IA: en las discusiones desde finales de 2024 hasta principios de 2025, el usuario ha expresado un interés recurrente en los cálculos de impacto ambiental, incluidos el consumo de energía de IA versus las emisiones de aviación, las opciones de almacenamiento de la nube sostenible y los costos ecológicos de las industrias históricas y modernas. Han explorado ampliamente los análisis de huella de CO2 para el uso de IA, orquestas y vehículos eléctricos, a menudo diseñando modelos de Python para respaldar sus estimaciones. El usuario busca activamente información basada en datos sobre la sostenibilidad ambiental y se siente cómodo construyendo modelos computacionales para validar los hallazgos. (Orquestas estaba tratando de comparar el impacto de CO2 de capacitar una LLM con la cantidad de CO2 que se necesita para enviar una orquesta sinfónica en la gira). Luego, desde «información útil del usuario»: el usuario se basa en Half Moon Bay, California. Referenciado explícitamente varias veces en relación con las discusiones sobre elecciones locales, restaurantes, naturaleza (especialmente pelícanos) y planes de viaje. Mencionado desde junio de 2024 hasta octubre de 2024. […]
El usuario es un ávido observador de aves con un aficionado particular para los pelícanos. Numerosas conversaciones sobre patrones de migración pelícanos, chistes con temas pelícanos, escenarios de ficción pelícanos y vida silvestre que se detectan alrededor de Half Moon Bay. Discutido entre junio de 2024 y octubre de 2024. Sí, se aceleró en lo de Pelican. ¡Aunque tengo otros intereses! El usuario disfruta y con frecuencia se dedica a la cocina, incluidas las exploraciones de cócteles y discusiones técnicas sobre ingredientes alimentarios. El usuario ha discutido hacer salsa Schug, experimentar con cócteles y probar específicamente el jarabe de tortillo. Mostró interés en comprender las interacciones de ingredientes y adaptar recetas clásicas. Los temas frecuentemente surgieron entre junio de 2024 y octubre de 2024. Muchas otras cosas están muy en marca para mí: el usuario tiene una curiosidad técnica relacionada con la optimización del rendimiento en las bases de datos, particularmente las estrategias de indexación en SQLite y la ejecución eficiente de consultas. Múltiples discusiones sobre las consultas de SQLite de la evaluación comparativa, la prueba de ejecución paralela y la optimización de los métodos de recuperación de datos para la velocidad y la eficiencia. Se discutieron los temas entre junio de 2024 y octubre de 2024. Citaré la última sección, «Metadatos de interacción del usuario», en su totalidad porque incluye algunas notas técnicas específicas interesantes:
[Blog editor note: The list below has been reformatted from JSON into a numbered list for readability.]
El usuario se encuentra actualmente en Estados Unidos. Esto puede ser inexacto si, por ejemplo, el usuario está utilizando una VPN. Actualmente, el usuario está utilizando ChatGPT en la aplicación nativa en un dispositivo iOS. La profundidad de conversación promedio del usuario es 2.5. El usuario no ha indicado cómo prefieren ser llamados, pero el nombre en su cuenta es Simon Willison. El 1% de las conversaciones anteriores fueron I-Mini-M, el 7% de las conversaciones anteriores fueron GPT-4O, el 63% de las conversaciones anteriores fueron O4-Mini altas, el 19% de las conversaciones anteriores fueron O3, el 0% de las conversaciones anteriores de GPT-4-5, el 9% de las conversaciones anteriores fueron GPT4T_1_V4_MM_0116, el 0% de las conversaciones anteriores fueron investigaciones. El usuario está activo 2 días en los últimos 1 día, 8 días en los últimos 7 días y 11 días en los últimos 30 días. La hora local del usuario es actualmente de 6. La cuenta del usuario tiene 237 semanas de edad. Actualmente, el usuario está utilizando el siguiente agente de usuario: CHATGPT/1.2025.112 (iOS 18.5; iPhone17,2; compilación 14675947174). La longitud promedio del mensaje del usuario es 3957.0. En los últimos 121 mensajes, los principales temas: otros_specific_info (48 mensajes, 40%), create_an_image (35 mensajes, 29%), Creative_ideation (16 mensajes, 13%); 30 mensajes son una buena calidad de interacción (25%); 9 mensajes son mala calidad de interacción (7%). El usuario se encuentra actualmente en un plan ChatGPT Plus. «30 mensajes son una buena calidad de interacción (25%); 9 mensajes son mala calidad de interacción (7%)» – wow. Esta es una cantidad extraordinaria de detalles para que el modelo haya acumulado por mí … ¡y ChatGPT ni siquiera es mi conductor diario! Paso más de mi tiempo LLM con Claude. ¿Ha habido alguna vez un producto de consumo que sea capaz de construir un perfil legible por humanos de sus usuarios? Las agencias de crédito, Facebook y Google pueden saber mucho más sobre mí, pero ¿alguna vez han enviado una característica que pueda sintetizar los datos de esta manera? Tiene razón. Esa es una cantidad extraordinaria de información, organizada de manera humana comprensible. Sí, ocasionalmente se equivocará, pero los LLM abrirán un mundo completamente nuevo de vigilancia íntima.