En O’Reilly, no solo creamos materiales de capacitación sobre IA. También lo estamos utilizando para crear nuevos tipos de experiencias de aprendizaje. Una de las formas en que estamos poniendo a trabajar la IA es nuestra actualización de Respuestas. Answers es una función generativa impulsada por IA que tiene como objetivo responder preguntas en el flujo de aprendizaje. Está en todos los libros, cursos a pedido y videos, y eventualmente estará disponible en toda nuestra plataforma de aprendizaje. Para verlo, haga clic en el icono «Respuestas» (el último elemento de la lista en el lado derecho de la pantalla). Aprende más rápido. Excavar más hondo. Ver más lejos. Answers permite el aprendizaje activo: interactuar con el contenido haciendo preguntas y obteniendo respuestas, en lugar de simplemente ingerir una transmisión de un libro o video. Si está resolviendo un problema laboral, el aprendizaje se incorpora al flujo de trabajo. Es natural tener preguntas mientras trabajas en algo; Aquellos de nosotros que recordamos los libros impresos también recordamos haber tenido una pila de libros abiertos boca abajo en nuestros escritorios (para guardar la página) a medida que profundizábamos más y más en la investigación de un problema. En internet pasa algo parecido: abres tantas pestañas mientras buscas una respuesta que no recuerdas cuál es cuál. ¿Por qué no puedes simplemente hacer una pregunta y obtener una respuesta? Ahora usted puede. A continuación presentamos algunas ideas sobre las decisiones que tomamos en el proceso de creación de Respuestas. Por supuesto, todo está sujeto a cambios; eso es lo primero que debes tener en cuenta antes de comenzar cualquier proyecto de IA. Éste es territorio desconocido; todo es un experimento. No sabrá cómo la gente utilizará su aplicación hasta que la cree y la implemente; Hay muchas preguntas sobre Respuestas para las cuales todavía estamos esperando respuestas. Es importante tener cuidado al implementar una aplicación de IA, pero también es importante darse cuenta de que toda la IA es experimental. El núcleo de Answers se construyó mediante la colaboración con un socio que proporcionó la experiencia en IA. Ése es un principio importante, especialmente para las pequeñas empresas: no construyas solo cuando puedes asociarte con otros. Habría sido muy difícil desarrollar la experiencia para construir y entrenar un modelo, y mucho más efectivo trabajar con una empresa que ya tiene esa experiencia. Habrá muchas decisiones y problemas que su personal deberá tomar y resolver. Al menos para los primeros productos, deje el trabajo pesado de la IA a otra persona. Concéntrese en comprender el problema que está resolviendo. ¿Cuáles son sus casos de uso específicos? ¿Qué tipo de respuestas esperarán sus usuarios? ¿Qué tipo de respuestas quieres dar? Piense en cómo las respuestas a esas preguntas afectan su modelo de negocio. Si crea un servicio similar a un chat, debe pensar seriamente en cómo se utilizará: qué tipos de mensajes esperar y qué tipos de respuestas devolver. Respuestas impone pocas restricciones a las preguntas que puede hacer. Si bien la mayoría de los usuarios consideran a O’Reilly como un recurso para desarrolladores de software y departamentos de TI, nuestra plataforma contiene muchos otros tipos de información. Answers puede responder preguntas sobre temas como química, biología y cambio climático, cualquier cosa que esté en nuestra plataforma. Sin embargo, se diferencia de aplicaciones de chat como ChatGPT en varios aspectos. Primero, se limita a preguntas y respuestas. Aunque sugiere preguntas de seguimiento, no es una conversación. Cada nueva pregunta inicia un nuevo contexto. Creemos que muchas empresas que experimentan con IA quieren conversar por el simple hecho de conversar, no como un medio para lograr sus fines, posiblemente con el objetivo de monopolizar la atención de sus usuarios. Queremos que nuestros usuarios aprendan; Queremos que nuestros usuarios sigan resolviendo sus problemas técnicos. La conversación por sí sola no encaja en este caso de uso. Queremos que las interacciones sean breves, directas y directas. Limitar las respuestas a preguntas y respuestas también minimiza el abuso; Es más difícil descarrilar un sistema de IA cuando estás limitado a preguntas y respuestas. (Honeycomb, una de las primeras empresas en integrar ChatGPT en un producto de software, tomó una decisión similar). A diferencia de muchos productos impulsados ​​por IA, Answers le dirá cuando realmente no tenga una respuesta. Por ejemplo, si preguntas «¿Quién ganó la serie mundial?» responderá «No tengo suficiente información para responder esta pregunta». Si hace una pregunta que no puede responder, pero sobre la cual nuestra plataforma puede tener información relevante, le indicará esa información. Esta decisión de diseño fue simple, pero sorprendentemente importante. Muy pocos sistemas de inteligencia artificial le dirán que no pueden responder la pregunta y que la incapacidad es una fuente importante de alucinaciones, errores y otros tipos de información errónea. La mayoría de los motores de IA no pueden decir «Lo siento, no lo sé». Los nuestros pueden y lo harán. Las respuestas siempre se atribuyen a contenido específico, lo que nos permite compensar nuestro talento y a nuestros editores asociados. El diseño del plan de compensación fue una parte importante del proyecto. Estamos comprometidos a tratar a los autores de manera justa; no solo generaremos respuestas a partir de su contenido. Cuando un usuario hace una pregunta, Respuestas genera una respuesta breve y proporciona enlaces a los recursos de los que extrajo la información. Estos datos van a nuestro modelo de compensación, que está diseñado para ser neutral en cuanto a ingresos. No penaliza nuestro talento cuando generamos respuestas a partir de su material. El diseño de Answers es más complejo de lo que cabría esperar, y es importante que las organizaciones que inician un proyecto de IA comprendan que “lo más simple que pueda funcionar” probablemente no funcionará. Desde el principio, sabíamos que no podíamos simplemente utilizar un modelo como GPT o Gemini. Además de ser propensos a errores, no tienen ningún mecanismo para proporcionar datos sobre cómo crearon una respuesta, datos que necesitamos como entrada para nuestro modelo de compensación. Eso nos empujó inmediatamente hacia el patrón de generación aumentada de recuperación (RAG), que proporcionó una solución. Con RAG, un programa genera un mensaje que incluye tanto la pregunta como los datos necesarios para responderla. Ese mensaje aumentado se envía al modelo de lenguaje, que proporciona una respuesta. Podemos compensar nuestro talento porque sabemos qué datos se utilizaron para construir la respuesta. El uso de RAG plantea la pregunta: ¿de dónde provienen los documentos? Otro modelo de IA que tiene acceso a una base de datos del contenido de nuestra plataforma para generar documentos “candidatos”. Otro modelo más clasifica a los candidatos, seleccionando aquellos que parecen más útiles; y un tercer modelo reevalúa a cada candidato para garantizar que sea realmente relevante y útil. Finalmente, los documentos seleccionados se recortan para minimizar el contenido que no está relacionado con la pregunta. Este proceso tiene dos propósitos: minimizar las alucinaciones y los datos enviados al modelo que responde la pregunta; minimiza el contexto requerido. Cuanto más contexto se requiera, más tiempo llevará obtener una respuesta y más costará ejecutar el modelo. La mayoría de los modelos que utilizamos son modelos pequeños y de código abierto. Son rápidos, eficaces y económicos. Además de minimizar las alucinaciones y hacer posible atribuir contenido a los creadores (y a partir de ahí, asignar regalías), este diseño facilita la adición de contenido nuevo. Constantemente agregamos contenido nuevo a la plataforma: miles de artículos por año. Con un modelo como GPT, agregar contenido requeriría un proceso de capacitación largo y costoso. Con RAG, agregar contenido es trivial. Cuando se agrega algo a la plataforma, se agrega a la base de datos de donde se elige el contenido relevante. Este proceso no requiere un uso intensivo de computación y puede tener lugar casi de inmediato, en tiempo real, por así decirlo. Las respuestas nunca se quedan atrás del resto de la plataforma. Los usuarios nunca verán «Este modelo solo se ha entrenado con datos hasta julio de 2023». Answers es un producto, pero es solo una parte del ecosistema de herramientas que estamos construyendo. Todas estas herramientas están diseñadas para servir a la experiencia de aprendizaje: para ayudar a nuestros usuarios y clientes corporativos a desarrollar las habilidades que necesitan para seguir siendo relevantes en un mundo cambiante. Ese es el objetivo y también la clave para crear aplicaciones exitosas con IA generativa. ¿Cuál es el objetivo? ¿Cuál es el verdadero objetivo? No se trata de impresionar a sus clientes con su experiencia en IA. Es para solucionar algún problema. En nuestro caso, ese problema es ayudar a los estudiantes a adquirir nuevas habilidades de manera más eficiente. Concéntrate en ese objetivo, no en la IA. La IA será una herramienta importante, tal vez la más importante. Pero no es un fin en sí mismo.