Si el destornillador fuera inventado hoy por la industria tecnológica, se utilizaría ampliamente para una variedad de tareas, incluido martillar clavos. Desde el debut de ChatGPT, ha habido un fervor y una reacción cada vez mayores contra los modelos de lenguajes grandes (LLM). De hecho, muchas adaptaciones de la tecnología parecen malversadas y sus capacidades están sobrevaloradas, dada su frecuente falta de veracidad. Esto no quiere decir que no haya muchos usos excelentes para un LLM, pero debes responder algunas preguntas clave antes de continuar. ¿Un LLM será mejor o al menos igual a las respuestas humanas? ¿A alguien le gustan esos chatbots de servicio al cliente que ¿No respondes ninguna pregunta que no esté ya en la página principal del sitio web? Por otro lado, hablar con una persona del servicio de atención al cliente que simplemente lee un guión y no está capacitada para ayudar es igualmente frustrante. Cualquier implementación de un LLM debe probar si es igual o mejor que el chatbot o las respuestas humanas que está reemplazando. ¿Cuál es la exposición a la responsabilidad? En nuestra sociedad litigiosa, cualquier nuevo proceso o tecnología debe evaluarse frente a su potencial de exposición legal. Hay áreas obvias en las que se debe tener precaución, como la medicina, el derecho o las finanzas, pero ¿qué pasa con una respuesta generada por un LLM que dirige a las personas a una política o consejo que es engañoso, inapropiado o algo peor? Las malas políticas empresariales a menudo dan lugar a demandas colectivas. Al aumentar la escala de las interacciones con los clientes, un LLM mal capacitado o restringido podría generar una responsabilidad no deseada aún mayor. ¿Es un LLM realmente más barato? Claro, es fácil medir su suscripción y uso de un LLM general como ChatGPT, pero sistemas personalizados más específicos puede tener costos más altos más allá de la potencia informática. ¿Qué pasa con el personal y otra infraestructura para mantener y depurar el sistema? Puede contratar bastantes representantes de servicio al cliente por el precio de un experto en IA. Además, ChatGPT y servicios similares parecen estar subsidiados por inversiones en este momento. Es de suponer que en algún momento querrán obtener ganancias y entonces el costo podría aumentar. ¿Es ese LLM realmente más barato y seguirá siéndolo durante la vida útil de su sistema? ¿Cómo lo mantendrá? La mayoría de los sistemas LLM empresariales se capacitarán a medida en conjuntos de datos específicos. Una desventaja de las redes neuronales en las que se basan los LLM es que son notoriamente difíciles de depurar. A medida que avanza la tecnología, los LLM pueden desarrollar la capacidad de revisar, borrar o «desaprender» algo falso que han aprendido. Pero por ahora, desaprender puede resultar bastante difícil. ¿Cuál es su proceso o procedimiento para actualizar periódicamente el LLM y eliminar las malas respuestas? ¿Cuál es su proceso de prueba? Un beneficio clave de un LLM es que no tiene que anticipar todas las permutaciones posibles de una pregunta para que el modelo dar una respuesta creíble. Sin embargo, la palabra «creíble» no significa correcto. Se deben probar al menos las preguntas más comunes y las diversas permutaciones. Si su LLM reemplazará un proceso humano o de máquina existente, las preguntas que la gente hace hoy serían un buen conjunto de datos para comenzar. Hay un viejo proverbio de dudosa procedencia que se traduce aproximadamente como «más despacio, tengo prisa». No todo será un gran caso de uso para los LLM y existe amplia evidencia de que el entusiasmo está superando las capacidades. Sin embargo, al medir la calidad y la economía, y al idear algunos procedimientos de prueba y mantenimiento decentes, puede hacer que los LLM sean una herramienta valiosa en muchos casos de uso diferentes. Copyright © 2024 IDG Communications, Inc.

Source link