SOPA Images/Colaborador/Getty Images Un gran enfoque del trabajo empresarial en estos días es automatizar las tareas humanas para una mayor eficiencia. El gigante informático IBM pregunta en su investigación más reciente si la inteligencia artificial generativa (IA), como los grandes modelos de lenguaje (LLM), puede ser un trampolín hacia la automatización. Llamado «SNAP», el marco de software propuesto por IBM entrena a un LLM para generar una predicción. de la siguiente acción que tendrá lugar en un proceso de negocio dados todos los eventos que han ocurrido antes. Esas predicciones, a su vez, pueden servir como sugerencias sobre los pasos que puede tomar una empresa. Además: ¿Puede ChatGPT predecir el futuro? Entrenar a la IA para descubrir qué sucede a continuación: SNAP puede mejorar el rendimiento de predicción de la próxima actividad para varios BPM [business process management] conjuntos de datos», escriben Alon Oved y sus colegas de IBM Research en un nuevo artículo, SNAP: Semantic Stories for Next Activity Prediction, publicado esta semana en el servidor de preimpresión arXiv. El trabajo de IBM es sólo un ejemplo de una tendencia hacia el uso de LLM para intentar para predecir un próximo evento o acción en una serie. Los académicos han estado trabajando con lo que se llama datos de series de tiempo: datos que miden las mismas variables en diferentes momentos en el tiempo para detectar tendencias. El trabajo de IBM no utiliza datos de series de tiempo, pero sí se centra en la noción de eventos en secuencia y resultados probables. Además: la IA está superando a nuestra mejor tecnología de pronóstico del tiempo, gracias a DeepMindSNAP es un acrónimo de «historias semánticas para la predicción de la próxima actividad». NAP (parte de SNAP) es un área de investigación de sistemas que existe desde hace décadas. NAP normalmente utiliza formas más antiguas de IA para predecir lo que sucederá a continuación después de que se hayan ingresado todos los pasos hasta ese punto, generalmente desde un registro del negocio. que es una práctica conocida como «minería de procesos». El elemento de historias semánticas de SNAP es la parte que IBM agrega al marco. La idea es utilizar la riqueza del lenguaje en programas como GPT-3 para ir más allá de las actividades de los programas tradicionales de IA. Los modelos de lenguaje pueden capturar más detalles de un proceso de negocio y convertirlos en una «historia» coherente en lenguaje natural. Los programas de IA más antiguos no pueden manejar todos los datos sobre los procesos de negocio, escriben Oved y su equipo. «Utilizan sólo la secuencia de actividades como entrada para generar un modelo de clasificación» y «Rara vez se tienen en cuenta los atributos numéricos y categóricos adicionales dentro de dicho marco para las predicciones». Además: ¿Por qué Nvidia está enseñando a los robots a girar bolígrafos y Cómo ayuda la IA generativa Un LLM, por el contrario, puede seleccionar muchos más detalles y moldearlos en una historia. Un ejemplo es una solicitud de préstamo. El proceso de solicitud contiene varios pasos. El LLM puede recibir varios elementos de la base de datos sobre el monto del préstamo, como «monto = $ 20,000» y «fecha de inicio de la solicitud = 20 de agosto de 2023». El LLM puede transformar automáticamente esos elementos de datos en una narrativa en lenguaje natural, como por ejemplo: «El monto del préstamo solicitado fue de $ 20,000 y fue solicitado por el cliente. La actividad «Registrar solicitud» se llevó a cabo en el turno 6, que ocurrió 12 días después de iniciado el caso […]»El sistema SNAP consta de tres pasos. Primero, se crea una plantilla para una historia. Luego, esa plantilla se utiliza para construir una narrativa completa. Y, por último, las historias se utilizan para entrenar al LLM para predecir el próximo evento que sucederá en La historia. SNAP de IBM puede tomar una lista de atributos de un proceso de negocio y convertirlos en una narrativa a través de IA generativa, que luego puede usarse para predecir el próximo desarrollo más probable. IBMEn el primer paso, los atributos, como el préstamo cantidad: se envían al mensaje del modelo de lenguaje, junto con un ejemplo de cómo se pueden convertir en una plantilla, que es un andamiaje para una historia. Se le dice al modelo de lenguaje que haga lo mismo con un nuevo conjunto de atributos, y escupe una nueva plantilla. En el paso dos, esa nueva plantilla se introduce en el modelo de lenguaje y el modelo la completa como una historia terminada en lenguaje natural. El paso final es introducir muchas de esas historias en un LLM para entrenarlo. predecir lo que sucederá a continuación. La conclusión de esta combinación de historias son los ejemplos de entrenamiento de «verdad sobre el terreno». Además: la IA generativa no puede encontrar sus propios errores. ¿Necesitamos mejores indicaciones? En su investigación, Oved y su equipo prueban si SNAP es mejor en la predicción de la siguiente acción que los programas de inteligencia artificial más antiguos. Utilizan cuatro conjuntos de datos disponibles públicamente, incluida la base de datos real de incidentes de TI del fabricante de automóviles Volvo, una base de datos de registros de procesos de permisos ambientales y una colección de casos imaginarios de recursos humanos. Los autores utilizan tres «modelos fundamentales del lenguaje» diferentes: GPT-3 de OpenAI, BERT de Google y DeBERTa de Microsoft. Dicen que los tres «producen resultados superiores en comparación con los puntos de referencia establecidos». Curiosamente, aunque el GPT-3 es más potente que los otros dos modelos, su rendimiento en las pruebas es relativamente modesto. Concluyen que «incluso los LFM de código abierto relativamente pequeños como BERT tienen resultados SNAP sólidos en comparación con los modelos grandes». Los autores también encuentran que las oraciones completas de los modelos de lenguaje parecen ser importantes para el rendimiento. «¿Importa la estructura semántica de la historia?» preguntan, antes de concluir: «El diseño de historias semánticas coherentes y gramaticalmente correctas a partir de registros de procesos de negocio constituye un paso clave en el algoritmo SNAP». Además: Cinco formas de utilizar la IA de forma responsable. Comparan las historias de GPT-3 y los otros modelos con un enfoque diferente en el que simplemente combinan la misma información en una sola cadena de texto larga. Encuentran que el primer enfoque, que utiliza oraciones gramaticales completas, tiene mucha mayor precisión que una simple cadena de atributos. Los autores concluyen que la IA generativa es útil para ayudar a extraer todos los datos sobre procesos que la IA tradicional no puede capturar: «Eso es particularmente útil cuando el espacio de características categóricas es enorme, como las declaraciones de los usuarios y otros atributos de texto libre». Por otro lado, las ventajas de SNAP disminuyen cuando utiliza conjuntos de datos que no tienen mucha información semántica; en otras palabras, detalles escritos. «Un hallazgo central de este trabajo es que el rendimiento de SNAP aumenta con la cantidad de información semántica dentro del conjunto de datos», escriben. Lo más importante para el enfoque SNAP es que los autores sugieren que es posible que los conjuntos de datos se mejoren cada vez más con tecnologías más nuevas, como la automatización de procesos robóticos, «donde las expresiones del usuario y del sistema a menudo contienen información semántica rica que puede usarse para mejorar la precisión de las predicciones». «.

Source link