¿Quieres ideas más inteligentes en tu bandeja de entrada? Regístrese en nuestros boletines semanales para obtener solo lo que importa a los líderes de IA, datos y seguridad empresariales. Suscríbase ahora no hay duda de que los agentes de IA, aquellos que pueden trabajar de forma autónoma y asincrónica detrás de escena en los flujos de trabajo empresariales, son el tema du Jour en Enterprise en este momento. Pero existe una preocupación cada vez mayor de que todo es solo eso: hablar, principalmente exageradamente, sin mucha sustancia detrás de él. Gartner, por ejemplo, observa que las empresas están en el «pico de las expectativas infladas», un período justo antes de la desilusión porque los vendedores no han respaldado su conversación con casos de uso tangible y del mundo real. Aún así, eso no quiere decir que las empresas no estén experimentando con los agentes de IA y ven el retorno temprano de la inversión (ROI); Global Enterprises Block y GlaxoSmithKline (GSK), para sus partes, están explorando la prueba de conceptos en los servicios financieros y el descubrimiento de fármacos. AI Scaling alcanza sus límites de potencia de límites, el aumento de los costos de los tokens y los retrasos de inferencia están remodelando Enterprise AI. Únase a nuestro salón exclusivo para descubrir cómo son los mejores equipos: convertir la energía en una ventaja estratégica arquitectando una inferencia eficiente para las ganancias de rendimiento real que desbloquean el ROI competitivo con sistemas de IA sostenibles asegura su lugar para mantenerse a la vanguardia: https://bit.ly/4mwgngo «Multi-agente múltiple es absolutamente lo que es absolutamente lo que viene a continuación, pero estamos descubriendo qué parece eso de una manera que eso cumple con los humanos, hace que sea conveniente, lo que hace que sea conveniente, lo que hace que sea conveniente, lo que hace que sea conveniente», hace que sea conveniente, lo que hace que sea, lo que hace que sea, lo que hace que sea, lo que hace que sea, sea conveniente «. Las plataformas de datos, dijeron el CEO y editor en jefe de VentureBeat, Matt Marshall, en un reciente evento de impacto de IA patrocinado por SAP este mes. Trabajando con un solo colega, no un enjambre de Bot Block, la empresa matriz de 10,000 empleados de la aplicación Square, Cash y After Page, se considera en modo de descubrimiento completo, después de haber implementado un marco de agente de IA interoperable, codificado como Goose, en enero. El ganso se introdujo inicialmente para tareas de ingeniería de software, y ahora es utilizado por 4,000 ingenieros, con la adopción duplicando mensualmente, explicó Axen. La plataforma escribe alrededor del 90% del código y ha guardado ingenieros aproximadamente 10 horas de trabajo por semana al automatizar la generación de código, la depuración y el filtrado de información. Además de escribir código, Goose actúa como un «compañero de equipo digital», comprimiendo flujos y flujos de correo electrónico, integrando en todas las herramientas de la compañía y generando nuevos agentes cuando las tareas exigen más rendimiento y alcance ampliado. Axen enfatizó que Block se centra en crear una interfaz que se siente como trabajar con un solo colega, no un enjambre de bots. «Queremos que sientas que estás trabajando con una persona, pero están actuando en tu nombre en muchos lugares de muchas maneras diferentes», explicó. Goose opera en tiempo real en el entorno de desarrollo, buscando, navegar y escribir código basado en la salida del modelo de idioma grande (LLM), al tiempo que lee y escribe de forma autónoma, ejecutando código y pruebas, refinando salidas e instalando dependencias. Esencialmente, cualquiera puede construir y operar un sistema en su LLM preferido, y el ganso puede conceptualizarse como la capa de aplicación. Tiene una interfaz de aplicación de escritorio y línea de comandos incorporada, pero los desarrolladores también pueden construir UIS personalizadas. La plataforma se basa en el protocolo de contexto modelo de Anthrope (MCP), un conjunto estandarizado de API y puntos finales de código abierto cada vez más popular que conecta a los agentes con repositorios de datos, herramientas y entornos de desarrollo. Goose ha sido lanzado bajo la Licencia APACHE de código abierto 2.0 (ASL2), lo que significa que cualquiera puede usar, modificarlo y distribuirlo libremente, incluso para fines comerciales. Los usuarios pueden acceder a las bases de datos de Databricks y hacer llamadas o consultas SQL sin necesidad de conocimientos técnicos. «Realmente queremos encontrar un proceso que permita a las personas obtener valor del sistema sin tener que ser un experto», explicó Axen. Por ejemplo, en la codificación, los usuarios pueden decir lo que quieren en el lenguaje natural y el marco lo interpretará en miles de líneas de código que los desarrolladores pueden leer y examinar. Block también está viendo el valor en las tareas de compresión, como la lectura de ganso a través de Slack, el correo electrónico y otros canales y resumiendo información para los usuarios. Además, en ventas o marketing, los agentes pueden recopilar información relevante sobre un cliente potencial y transmitirla en una base de datos. Los agentes de IA subutilizaron, pero la experiencia en el dominio humano aún es necesario que el proceso haya sido el cuello de botella más grande, señaló Axen. No puedes simplemente darle a la gente una herramienta y decirles que hagan que funcione para ellos; Los agentes deben reflejar los procesos con los que los empleados ya están comprometidos. Los usuarios humanos no están preocupados por la columna vertebral técnica, más bien, el trabajo que están tratando de lograr. Los constructores, por lo tanto, deben analizar lo que los empleados están tratando de hacer y diseñar las herramientas para ser «lo más literalmente posible», dijo Axen. Luego pueden usar eso para encadenar y abordar problemas cada vez mayores. «Creo que estamos subutilizando enormemente lo que pueden hacer», dijo Axen sobre los agentes. «Son las personas y el proceso porque no podemos seguir el ritmo de la tecnología. Hay una gran brecha entre la tecnología y la oportunidad». Y, cuando la industria une eso, ¿todavía habrá espacio para la experiencia en el dominio humano? Por supuesto, dice Axen. Por ejemplo, particularmente en los servicios financieros, el código debe ser confiable, compatible y seguro para proteger a la empresa y los usuarios; Por lo tanto, debe ser revisado por los ojos humanos. «Todavía vemos un papel realmente crítico para los expertos humanos en cada parte de la operación de nuestra empresa», dijo. «No necesariamente cambia lo que significa experiencia como individuo. Solo le brinda una nueva herramienta para expresarla». Bloque construido en una columna vertebral de código abierto La interfaz de usuario humana es uno de los elementos más difíciles de los agentes de IA, señaló Axen; El objetivo es hacer que las interfaces sean fáciles de usar, mientras que la IA está en el fondo está tomando medidas de manera proactiva. Sería útil, señaló Axen, si más actores de la industria incorporan estándares similares a MCP. Por ejemplo, «Me encantaría que Google simplemente vaya y tenga un MCP público para Gmail», dijo. «Eso haría que mi vida sea mucho más fácil». Cuando se le preguntó sobre el compromiso de Block con el código abierto, señaló: «Siempre hemos tenido una columna vertebral de código abierto», y agregó que durante el último año la compañía ha estado «renovando» su inversión para abrir tecnologías. «En un espacio que se mueve tan rápido, esperamos poder configurar la gobernanza de código abierto para que pueda que esta sea la herramienta que se mantiene al día con usted, incluso cuando salen nuevos modelos y nuevos productos». Las experiencias de GSK con múltiples agentes en el descubrimiento de fármacos GSK son un desarrollador farmacéutico líder, con un enfoque específico en vacunas, enfermedades infecciosas e investigación oncológica. Ahora, la compañía está comenzando a aplicar arquitecturas de múltiples agentes para acelerar el descubrimiento de medicamentos. Kim Branson, SVP de GSK y Jefe Global de AI y ML, dijo que los agentes están comenzando a transformar el producto de la compañía y que son «absolutamente núcleo para nuestro negocio». Los científicos de GSK están combinando LLM específicos de dominio con ontologías (conceptos de materia y categorías que indican propiedades y relaciones entre ellos), cadenas de herramientas y marcos de prueba rigurosos, explicó Branson. Esto les ayuda a consultar gigantescos conjuntos de datos científicos, planificar experimentos (incluso si no hay verdad fundamental) y ensamblar evidencia entre genómica (el estudio de ADN), proteómica (el estudio de proteínas) y datos clínicos. Los agentes pueden superficial de hipótesis, validar los datos de datos y comprimir los ciclos de investigación. Branson señaló que el descubrimiento científico ha recorrido un largo camino; Los tiempos de secuenciación han disminuido, y la investigación en proteómica es mucho más rápida. Al mismo tiempo, sin embargo, el descubrimiento se vuelve cada vez más difícil a medida que se acumulan cada vez más datos, particularmente a través de dispositivos y wearables. Como dijo Branson: «Tenemos datos de pulso más continuos sobre las personas que antes como especie». Puede ser casi imposible para los humanos analizar todos esos datos, por lo que el objetivo de GSK es usar la IA para acelerar los tiempos de iteración, señaló. Pero, al mismo tiempo, la IA puede ser complicada en Big Pharma porque a menudo no hay una verdad terrestre sin realizar grandes experimentos clínicos; Se trata más de hipótesis y científicos que exploran evidencia para encontrar posibles soluciones. «Cuando comienzas a agregar agentes, descubres que la mayoría de las personas en realidad ni siquiera tienen una forma estándar de hacerlo entre ellos», señaló Branson. «Esa variación no es mala, pero a veces conduce a otra pregunta». Él bromeó: «No siempre tenemos una verdad absoluta con la que trabajar, de lo contrario, mi trabajo sería mucho más fácil». Se trata de encontrar los objetivos correctos o saber cómo diseñar lo que podría ser un biomarcador o evidencia de diferentes hipótesis, explicó. Por ejemplo: ¿es esta la mejor vía a considerar para las personas con cáncer de ovario en esta condición en particular? Hacer que la IA entienda que el razonamiento requiere el uso de ontologías y posar preguntas como, «Si esto es cierto, ¿qué significa X?». Los agentes específicos del dominio pueden reunir evidencia relevante de grandes conjuntos de datos internos. GSK construyó modelos de lenguaje epigenómico impulsados ​​por cerebras desde cero que utiliza para inferencia y entrenamiento, explicó Branson. «Construimos modelos muy específicos para nuestras aplicaciones donde nadie más tiene uno», dijo. La velocidad de inferencia es importante, señaló, ya sea para un modelo o una investigación profunda autónoma, y ​​GSK utiliza diferentes conjuntos de herramientas basadas en el objetivo final. Pero las ventanas de contexto grande no siempre son la respuesta, y el filtrado es fundamental. «No puedes simplemente jugar relleno de contexto», dijo Branson. «No puedes simplemente tirar todos los datos en esto y confiar en el LM para resolverlos». Pruebas continuas GSK crítico pone muchas pruebas en sus sistemas de agente, priorizando el determinismo y la confiabilidad, a menudo ejecutando múltiples agentes en paralelo a los resultados de verificación cruzada. Branson recordó que, cuando su equipo comenzó a construirse, tenían un agente de SQL que corrieron «10,000 veces», e inexplicablemente de repente «falsificó» los detalles. «Nunca volvimos a verlo volver a suceder, pero sucedió una vez y ni siquiera entendimos por qué sucedió con este LLM en particular», dijo. Como resultado, su equipo a menudo ejecutará múltiples copias y modelos en paralelo mientras aplica llamadas de herramientas y limitaciones; Por ejemplo, dos LLM realizarán exactamente la misma secuencia y los científicos de GSK los revisarán. Su equipo se centra en los bucles de aprendizaje activo y está reuniendo sus propios puntos de referencia internos porque los populares y disponibles son a menudo «bastante académicos y no reflejan lo que hacemos». Por ejemplo, generarán varias preguntas biológicas, anotarán lo que creen que será el estándar de oro, luego aplicarán una LLM contra eso y verán cómo se ubica. «Hacemos especialmente cosas problemáticas donde no funcionó o hizo algo tonto, porque fue cuando aprendemos algunas cosas nuevas», dijo Branson. «Tratamos de que los humanos usen su juicio experto donde importa». Insights diarias sobre casos de uso de negocios con VB diariamente Si desea impresionar a su jefe, VB Daily lo tiene cubierto. Le damos la cuenta interior de lo que las empresas están haciendo con la IA generativa, desde cambios regulatorios hasta implementaciones prácticas, por lo que puede compartir ideas para el ROI máximo. Lea nuestra Política de privacidad Gracias por suscribirse. Mira más boletines de VB aquí. Ocurrió un error.