Los ejecutivos de empresas y TI entrevistados para una encuesta reciente de Deloitte se muestran cautelosos ante los costos asociados con los proyectos de inteligencia artificial generativa (GenAI), y el tiempo avanza para que las organizaciones creen un valor significativo y sostenido a través de sus iniciativas GenAI. Según Deloitte, el costo se convertirá cada vez más en un factor clave en la toma de decisiones sobre GenAI. La encuesta a 2.770 líderes de empresas y TI informó que solo el 16% de las organizaciones dijeron que producen informes regulares para el director financiero sobre el valor que se crea con la tecnología. Sin embargo, Deloitte dijo que a medida que GenAI se convierta en una parte integral de cómo se hacen los negocios, sus iniciativas se medirán cada vez más con métricas financieras tradicionales a medida que las organizaciones comiencen a exigir resultados más tangibles y mensurables de sus inversiones en GenAI. En el informe Estado de la IA generativa en la empresa que acompaña a la encuesta, Deloitte predijo que las empresas adoptarán un conjunto integral de medidas financieras y no financieras para presentar un panorama completo del valor creado a partir de las inversiones en iniciativas GenAI. “En el futuro, es posible que veamos surgir nuevas métricas que reflejen sus características y capacidades únicas”, escribieron los autores del informe. “Por ejemplo, podría haber una métrica que cuantifique el desempeño de los trabajadores humanos y los sistemas GenAI (juntos o por separado) en tareas creativas y relacionadas con la innovación”. Deloitte instó a los líderes empresariales y de TI a que encuentren la manera de medir y comunicar el valor de la tecnología, que, según dijo, es fundamental para establecer expectativas y mantener el interés, el apoyo y la inversión de la alta dirección y la sala de juntas. Cita a un director sénior y jefe de un acelerador GenAI en la industria farmacéutica que cree que el rendimiento de los grandes modelos de lenguaje (LLM) aún debe mejorarse junto con la preparación de los datos. “Los datos siempre serán un problema”, dijeron. “También la comprensión profunda de la IA generativa. No hay suficientes personas que comprendan y puedan impulsar la transformación”. Deloitte dijo que el valor de las iniciativas GenAI provendrá cada vez más de las organizaciones que hagan uso de datos diferenciados de nuevas formas, como para ajustar los LLM, crear un LLM desde cero o desarrollar aplicaciones de IA empresarial. “Para que la IA generativa produzca el tipo de impacto que esperan los ejecutivos, es probable que las empresas deban aumentar su comodidad con el uso de sus datos patentados, que pueden estar sujetos a las regulaciones existentes y emergentes”, dijeron los autores del informe. Acceso a datos públicos para la formación Hay muchos casos en los que las organizaciones pueden mejorar los LLM entrenados con datos de Internet con datos internos para personalizar los sistemas públicos basados ​​en IA según sus requisitos comerciales particulares. Sin embargo, la investigación ha descubierto que el uso de datos públicos de LLM como fuente para entrenar a otro LLM puede conducir a imprecisiones. En un artículo publicado en Nature el mes pasado, los investigadores Ilia Shumailov, Zakhar Shumaylov, Yiren Zhao, Nicolas Papernot, Ross Anderson y Yarin Ga afirmaron que había una “ventaja de pionero” cuando se trata de entrenar modelos de IA. “En nuestro trabajo, demostramos que el entrenamiento con muestras de otro modelo generativo puede inducir un cambio de distribución que, con el tiempo, provoca el colapso del modelo”, dijeron. Los investigadores recomendaron que los desarrolladores de modelos de IA se aseguraran de que se conservara el acceso a la fuente de datos original y que los datos adicionales no generados por los LLM permanecieran disponibles a lo largo del tiempo. También advirtieron sobre la dificultad de identificar datos creados por LLM en Internet. “La necesidad de distinguir los datos generados por LLM de otros datos plantea preguntas sobre la procedencia del contenido que se rastrea desde Internet”, señalaron. Los investigadores también predijeron que podría resultar cada vez más difícil entrenar nuevas versiones de LLM sin acceso a datos rastreados desde Internet antes de la adopción masiva de la tecnología o acceso directo a datos generados por humanos a gran escala. Una posible solución sugerida por los investigadores es que las diferentes partes involucradas en la creación y el despliegue de LLM podrían compartir la información necesaria para determinar la fuente original de los datos.