Consideremos un sistema con datos de Tesla integrados que abarcan la historia de la empresa. Sin mecanismos eficientes de clasificación y recuperación, un analista financiero que pregunte sobre las ganancias o un analista de riesgos que busque información sobre demandas judiciales recibiría una respuesta generada a partir de una abrumadora mezcla de datos irrelevantes. Estos datos podrían incluir noticias no relacionadas sobre directores ejecutivos y compras de celebridades. El sistema produciría respuestas vagas, incompletas o incluso alucinadas, obligando a los usuarios a perder un tiempo valioso clasificando manualmente los resultados para encontrar la información que realmente necesitan y luego validar su precisión. Los sistemas basados ​​en agentes RAG suelen servir para múltiples flujos de trabajo, y los modelos de recuperación y los LLM deben adaptarse a sus requisitos únicos. Por ejemplo, los analistas financieros necesitan resultados centrados en las ganancias, mientras que los analistas de riesgos requieren información sobre demandas judiciales y acciones regulatorias. Cada flujo de trabajo exige resultados ajustados que se ajusten a léxicos y formatos específicos. Si bien es necesario algún ajuste del LLM, el éxito aquí depende principalmente de la calidad de los datos y de la eficacia del modelo de recuperación para filtrar los puntos de datos específicos del flujo de trabajo de los datos de origen y alimentarlos al LLM. Por último, un enfoque de agentes de IA bien diseñado para la automatización de flujos de trabajo de conocimiento complejos puede ayudar a mitigar los riesgos con las implementaciones de RAG al dividir los grandes casos de uso en «trabajos por hacer» discretos, lo que facilita garantizar la relevancia, el contexto y el ajuste efectivo en cada etapa del sistema.