Stefania Drugsa sobre el diseño para la próxima generación – O’Reilly

O’Reilly MediaGenerative AI en el mundo real: Stefania Drugsa sobre el diseño para el episodio de la próxima generación PAUSE PAUSE Episode / Episodio INMUDE RELOW 10 SEGROS 1X Avance rápido 10 segundos 00:00 / 33m 7s Suscripción Sharehow ¿Enseña a los niños a usar y construir con AI? En eso trabaja Stefania Drugsa. Es importante ser sensible a su creatividad, sentido de diversión y deseo de aprender. Al diseñar para niños, es importante diseñar con ellos, no solo para ellos. Esa es una lección que también tiene implicaciones importantes para los adultos. Únase a Stefania Drugsa y Ben Lorica para escuchar sobre la IA para los niños y lo que eso tiene que decir sobre la IA para adultos. Sobre la IA generativa en el podcast del mundo real: en 2023, Chatgpt puso a AI en la agenda de todos. En 2025, el desafío será convertir esas agendas en realidad. En la IA generativa en el mundo real, Ben Lorica entrevista a líderes que están construyendo con IA. Aprenda de su experiencia para ayudar a poner a la IA a trabajar en su empresa. Compruebe otros episodios de este podcast en la plataforma de aprendizaje O’Reilly. Timestamps 0:00: Introducción a Stefania Drugsa, investigador independiente y más recientemente científico de investigación en DeepMind.0: 27: Ha creado herramientas de educación de AI para jóvenes, y después de eso, trabajó en AI multimodal en DeepMind. ¿Qué te han enseñado los niños sobre el diseño de IA? 0: 48: Ha sido un gran viaje. Comencé a trabajar en AI Education en 2015. Estaba en el equipo de Scratch en el MIT Media Lab. Trabajé en cognimates para que los niños pudieran entrenar modelos personalizados con imágenes y textos. Los niños harían cosas en las que nunca hubiera pensado, como construir un modelo para identificar las líneas extrañas o para reconocer y darle cumplidos a la mano. Hicieron cosas raras, extravagantes y divertidas y no necesariamente utilitarios.2: 05: Para los jóvenes, conducir un automóvil es divertido. Tener un auto sin conductor no es divertido. Tienen muchas ideas que podrían inspirar a los adultos. ¿Cuál es la mayor desconexión? 2: 47: No tenemos una perilla para que la agencia controle cuánto delegamos a las herramientas. La mayoría de la Generación Z usa productos AI listos para usar como ChatGPT, Gemini y Claude. Estas herramientas tienen la suposición de horneados de que necesitan hacer el trabajo en lugar de hacer preguntas para ayudarlo a hacer el trabajo. Me gusta un enfoque mucho más socrático. Una gran parte del aprendizaje es hacer y recibir buenas preguntas. Un papel importante para la IA generativa es usarlo como una herramienta que puede enseñarle cosas, hacerle preguntas; [it’s] Algo con quien hacer una lluvia de ideas, no una herramienta con la que delegue trabaje. 4:25: Existe este gran elefante en la habitación donde no tenemos conversaciones o mejores prácticas sobre cómo usar AI.4: 42: Usted mencionó el enfoque socrático. ¿Cómo se implementa el enfoque socrático en el mundo de las interfaces de texto? 4: 57: En cognimates, creé un copiloto para la codificación de niños. Este copiloto no hace la codificación. Les hace preguntas. Si un niño pregunta: «¿Cómo hago que el tipo se mueva?» El copiloto hará preguntas en lugar de decir: «Use este bloque y luego ese bloque». 6:40: Cuando diseñé esto, comenzamos con una persona detrás de escena, como el mago de Oz. Luego construimos la herramienta y nos dimos cuenta de que los niños realmente quieren un sistema que pueda ayudarlos a aclarar su pensamiento. ¿Cómo se desglosa un evento complejo en pasos que son buenas unidades computacionales? 8:06: El tercer descubrimiento fue las afirmaciones, cuando hicieron algo que fue genial, el copiloto dice algo como «eso es increíble». Los niños pasarían el doble de tiempo codificando porque tenían un copiloto infinitamente paciente que les hiciera preguntas, les ayudaría a depurar y darles afirmaciones que reforzarían su identidad creativa. 8:46: Con esas instrucciones de diseño, construí la herramienta. Estoy presentando un artículo en la conferencia ACM IDC (Diseño de interacción para niños) que presenta este trabajo con más detalle. Espero que este ejemplo se replique. Describen tan precisamente. Pero lo que estás describiendo es interesante porque estás aprendiendo, estás construyendo incrementalmente. Nos hemos alejado de eso como adultos. ¿Cuáles son los bloques LEGO correctos? Un aviso no es lo suficientemente tinkerable. No permite suficiente expresividad. Debe ser compuesto y permitir que el usuario tenga el control. 11:17: Lo que es muy emocionante para mí es multimodal [models] y cosas que pueden funcionar por teléfono. Los jóvenes pasan mucho tiempo en sus teléfonos, y son más accesibles en todo el mundo. Tenemos modelos de código abierto que son multimodales y pueden ejecutarse en dispositivos, por lo que no necesita enviar sus datos a la nube. 11:59: Trabajé recientemente en dos proyectos multimodales móviles primero. El primero fue en matemáticas. Creamos un punto de referencia de conceptos erróneos primero. ¿Cuáles son los errores que los estudiantes de secundaria pueden cometer al aprender álgebra? Probamos para ver si los LLM multimodales pueden recoger conceptos erróneos basados ​​en imágenes de los ejercicios escritos a mano de los niños. Ejecutamos los resultados de los maestros para ver si estuvieron de acuerdo. Confirmamos que los maestros estuvieron de acuerdo. Luego creé una aplicación llamada Mathmind que le hace preguntas a medida que resuelve problemas. Si detecta conceptos erróneos; Propone ejercicios adicionales. 14:41: Para los maestros, es útil ver cuántas personas no entendieron un concepto antes de seguir adelante. 15:17: ¿Quién está construyendo los modelos de pesas abiertas que está utilizando como punto de partida? 15: 26: Usé muchos de los modelos Gemma 3. El último modelo, 3n, es multilingüe y lo suficientemente pequeño como para ejecutar en un teléfono o computadora portátil. Llama tiene buenos modelos pequeños. Mistral es otro bueno.16: 11: ¿Qué pasa con la latencia y el consumo de batería? 16: 22: No he hecho pruebas extensas para el consumo de baterías, pero no he visto nada atroz.16: 35: Las matemáticas son las pruebas perfectas de muchas maneras, ¿verdad? Hay una respuesta correcta y incorrecta.16: 47: El futuro de la IA multimodal será neurosimbólico. Hay una parte que hace el LLM. El LLM es bueno en Fuzzy Logic. Pero hay una parte del sistema formal, que en realidad tiene especificaciones concretas. Las matemáticas son buenas para eso, porque sabemos la verdad del suelo. La pregunta es cómo crear especificaciones formales en otros dominios. Los resultados más prometedores provienen de esta intersección de métodos formales y modelos de idiomas grandes. Un ejemplo es la alfageometría de DeepMind, porque estaban usando una gramática para restringir el espacio de las soluciones. 18:16: ¿Puedes darnos una idea del tamaño de la comunidad que trabaja en estas cosas? ¿Es principalmente académico? ¿Hay startups? ¿Hay subvenciones de investigación? 18: 52: La primera comunidad cuando comencé era AI para K12. Hay una comunidad activa de investigadores y educadores. Fue apoyado por NSF. Es bastante diverso, con personas de todo el mundo. Y también hay una comunidad de aprendizaje y herramientas que se centra en el aprendizaje de matemáticas. La filantropía del Renaissance también financia muchas iniciativas.20: 18: ¿Qué pasa con la Academia Khan? 20: 20: Khan Academy es un gran ejemplo. Querían que Khanmigo se tratara de motivación intrínseca y comprenda el estímulo positivo para los niños. Pero lo que descubrí era que las matemáticas estaban mal: los LLMS tempranos tenían problemas con las matemáticas. 22:28: Digamos que un mes a partir de ahora un modelo de fundación se vuelve realmente bueno en las matemáticas avanzadas. ¿Cuánto tiempo hasta que podamos destilar un modelo pequeño para que se beneficie en el teléfono? 23: 04: Hubo un proyecto, Minerva, que fue un LLM específicamente para matemáticas. Un modelo realmente bueno que siempre es correcto en matemáticas no será un transformador debajo del capó. Será un transformador junto con el uso de herramientas y un prover del teorema automático. Necesitamos tener una pieza del sistema que sea verificable. ¿Qué tan rápido podemos hacer que funcione en un teléfono? Eso es factible en este momento. Existen sistemas de código abierto como Unsaply que destila un modelo tan pronto como esté disponible. Además, las API se están volviendo más asequibles. Podemos construir esas herramientas en este momento y hacer que funcionen en dispositivos de borde. 25:05: Humano en el bucle para la educación significa padres en el bucle. ¿Qué pasos adicionales tienes que hacer para ser cómodo que lo que sea que construyas está listo para ser desplegado y ser examinado por los padres? Entiendo esta pregunta con tanta frecuencia que me senté y escribí un manual largo para los padres. Durante la pandemia, trabajé con la misma comunidad de familias durante dos años y medio. Vi cómo los padres mediaban el uso de IA en la casa. Aprendieron a través de los juegos cómo funcionaban los sistemas de aprendizaje automático, sobre el sesgo. Hay mucho trabajo por hacer para las familias. Los padres están abrumados. Hay una sensación constante de no querer que su hijo se quede atrás, pero también no los quiera en los dispositivos todo el tiempo. Es importante hacer un plan para conversar sobre cómo están usando IA, cómo piensan sobre la IA, que proviene de un lugar de curiosidad. 28:12: Hablamos sobre la implementación del método socrático. Una de las cosas de las que la gente está hablando es de múltiples agentes. En algún momento, algún niño usará una herramienta que orquesta a un grupo de agentes. ¿Qué tipo de innovaciones en UX estás viendo que nos prepararán para este mundo? 28: 53: La parte de múltiples agentes es interesante. Cuando estaba haciendo este estudio en el copiloto de Scratch, al final tuvimos una sesión de diseño con los niños. Este tema de agentes y múltiples agentes surgió. Muchos de ellos querían eso y querían ejecutar simulaciones. Hablamos sobre la comunidad Scratch porque es un aprendizaje social, así que les pregunté qué sucede si algunos de los juegos son realizados por agentes. ¿Te gustaría saber eso? Es algo que quieren y algo por lo que quieren ser transparentes. 30:41: Una comunidad en línea híbrida que incluye niños y agentes no es ciencia ficción. La tecnología ya existe. 30:54: Estoy colaborando con las personas que crearon una tecnología llamada Infinibranch que le permite crear muchos entornos virtuales donde puede probar agentes y ver a los agentes en acción. Claramente vamos a tener agentes que puedan tomar medidas. Les dije lo que los niños querían, y ellos dijeron: «Hagamos que suceda». Definitivamente será un área de simulaciones y herramientas para el pensamiento. Creo que es una de las áreas más emocionantes. Puede ejecutar 10 experimentos a la vez, o 100. 32:23: En la empresa, muchas personas empresariales se adelantan a sí mismas. Hagamos que un agente funcione bien primero. Muchos de los vendedores se están adelantando.32: 49: Absolutamente. Una cosa es hacer una demostración; Otra cosa es hacer que funcione de manera confiable.