Puede resultar difícil hacer que un modelo de IA generativa comprenda una hoja de cálculo. Para intentar resolver este problema, los investigadores de Microsoft publicaron un artículo el 12 de julio en Arxiv en el que se describe SpreadsheetLLM, un marco de codificación que permite a los modelos de lenguaje grandes «leer» hojas de cálculo. SpreadsheetLLM podría «transformar la gestión y el análisis de datos de las hojas de cálculo, allanando el camino para interacciones de usuario más inteligentes y eficientes», escribieron los investigadores. Una ventaja de SpreadsheetLLM para las empresas sería utilizar fórmulas en hojas de cálculo sin aprender a usarlas haciendo preguntas al modelo de IA en lenguaje natural. ¿Por qué las hojas de cálculo son un desafío para los LLM? Las hojas de cálculo son un desafío para los LLM por varias razones. Las hojas de cálculo pueden ser muy grandes, superando la cantidad de caracteres que un LLM puede digerir a la vez. Las hojas de cálculo son «diseños y estructuras bidimensionales», como dice el informe, a diferencia de la «entrada lineal y secuencial» con la que funcionan bien los LLM. Los LLM no suelen estar capacitados para interpretar direcciones de celdas y formatos de hojas de cálculo específicos. Los investigadores de Microsoft utilizaron una técnica de varios pasos para analizar hojas de cálculo. SpreadsheetLLM tiene dos partes principales: SheetCompressor, que es un marco para reducir las hojas de cálculo a formatos que los LLM pueden entender. Chain of Spreadsheet, que es una metodología para enseñar a un LLM cómo identificar las partes correctas de una hoja de cálculo comprimida para «mirar» cuando se le presenta una pregunta y para generar una respuesta. Un diagrama de cómo el marco SpreadsheetLLM «lee» una hoja de cálculo realizando múltiples procesos. Imagen: Microsoft SheetCompressor tiene tres módulos: Anclajes estructurales que ayudan a los LLM a identificar las filas y columnas en la hoja de cálculo. Un método para reducir la cantidad de tokens que le cuesta al LLM interpretar la hoja de cálculo. Una técnica para mejorar la eficiencia al agrupar celdas similares. Usando estos módulos, el equipo redujo los tokens necesarios para la codificación de hojas de cálculo en un 96%. Esto, a su vez, permitió una ligera mejora (12,3%) sobre el trabajo de otro equipo de investigación líder para ayudar a los LLM a comprender las hojas de cálculo. Los investigadores probaron su método de identificación de hojas de cálculo con estos LLM: GPT-4 y GPT-3.5 de OpenAI. Llama 2 y Llama 3 de Meta. Phi-3 de Microsoft. Mistral AI-v2. Para la cadena de capacidades de hojas de cálculo, utilizaron GPT-4. ¿Qué significa SpreadsheetLLM para los esfuerzos de IA de Microsoft? La ventaja obvia para Microsoft aquí es permitir que su asistente de IA Copilot, que funciona en muchas aplicaciones de la suite Microsoft 365, haga más en Excel. SpreadsheetLLM representa el esfuerzo continuo por hacer que la IA generativa sea práctica, y abrir Excel a personas que no han sido capacitadas en sus funciones más avanzadas podría ser un buen nicho para que la IA generativa se expanda. VER: La profundidad con la que su empresa se involucra con Microsoft Copilot afectará qué versión, si es que hay alguna, es adecuada para su trabajo. Uso en el mundo real y próximos pasos para esta investigación de Microsoft Una mejora del 12,3% con respecto a los hallazgos de un equipo de investigación líder anterior es más significativa académicamente que económicamente por ahora. La IA generativa es famosa por inventar cosas, y las alucinaciones que se propagan por una hoja de cálculo podrían hacer que enormes cantidades de datos se vuelvan inútiles. Como señalan los investigadores, lograr que un LLM comprenda el formato de una hoja de cálculo (es decir, cómo se ve normalmente una hoja de cálculo y cómo funciona) es diferente a lograr que el LLM genere datos comprensibles y precisos dentro de esas celdas. Además, esta metodología requiere una gran potencia de procesamiento y múltiples pasadas por un LLM para generar una respuesta. Además, el asistente de Excel de su oficina podría ser capaz de extraer una respuesta en unos pocos minutos sin utilizar casi tanta energía. En el futuro, el equipo de investigación quiere incluir una forma de codificar detalles como el color de fondo de las celdas y profundizar la comprensión de los LLM sobre cómo se relacionan entre sí las palabras dentro de las celdas. TechRepublic se ha puesto en contacto con Microsoft para obtener más información.