La decisión de la Fundación Linux de tomar bajo su protección la Iniciativa de Modelo Abierto (OMI, por sus siglas en inglés) podría allanar el camino para modelos de lenguaje grandes (LLM, por sus siglas en inglés) “más éticos”, dicen los analistas. “Uno de los objetivos principales de OMI y su incorporación a la Fundación Linux es propagar un uso ético de los datos (texto/imágenes) para entrenar modelos de IA generativos”, dijo Abhigyan Malik, director de práctica de datos, análisis e IA en Everest Group. Sin embargo, Malik advirtió que la práctica de entrenar modelos con datos éticos será cada vez más difícil, dada la comprensión más amplia de la protección de datos y con fuentes populares que cambian sus políticas de privacidad y uso. Varios proveedores de LLM propietarios, como Open AI y Stability AI, enfrentan actualmente demandas que afirman que estas empresas violaron los derechos de autor al entrenar sus modelos. ¿Qué es la Iniciativa de Modelo Abierto? La Iniciativa de Modelo Abierto (OMI, por sus siglas en inglés), que fue fundada en junio por tres empresas emergentes: Invoke, Civitai y Comfy Org, tiene como objetivo reunir a desarrolladores, investigadores y empresas para colaborar en el avance de tecnologías de modelos relacionadas con la IA abiertas y con licencias permisivas. Según la Fundación Linux, las licencias permisivas tienden a facilitar que los miembros de la comunidad participen y compartan contribuciones sin obligaciones posteriores. “Esto favorece particularmente a los segmentos de software que requieren la capacidad de los productores de software de distribuir software propietario basado en la base de código abierto sin revelar sus cambios”, explicó la Fundación en su guía para software de código abierto. El objetivo principal de OMI es reunir una profunda experiencia en entrenamiento de modelos e inferencia para desarrollar modelos de igual o mayor calidad que los modelos propietarios, como los LLM de los establos de OpenAI, Google y AWS, pero libres de términos de licencia restrictivos que limiten el uso de estos modelos. Para lograr esto, la OMI, que estará gobernada por un comité directivo dirigido por la comunidad, establecerá un marco de gobernanza y grupos de trabajo para el desarrollo colaborativo de la comunidad. También realizará una encuesta para recopilar comentarios sobre futuras investigaciones y entrenamiento de modelos de la comunidad de código abierto, dijo la Fundación Linux en un comunicado, y agregó que creará más estándares compartidos para mejorar la interoperabilidad de los modelos y las prácticas de metadatos. Además, la OMI desarrollará un conjunto de datos transparente para la capacitación y creará un modelo de prueba alfa para el equipo rojo específico. El objetivo final de la iniciativa, según la Fundación, será lanzar una versión alfa del modelo, con scripts de ajuste, a la comunidad para fin de año. ¿Por qué esto es importante para las empresas? La importancia de este movimiento para las empresas radica en la falta de disponibilidad del código fuente y las restricciones de licencia de los proveedores de LLM como Meta, Mistral y Anthropic, que ponen salvedades en las políticas de uso de sus modelos de «código abierto». Meta, por ejemplo, según el otro líder de práctica de IA de Everest Group, Suseel Menon, proporciona los derechos para usar los modelos Llama libres de regalías sin ninguna licencia, pero no proporciona el código fuente. «Meta también agrega una cláusula: ‘Si, en Meta Llama 3, los usuarios activos mensuales de los productos o servicios son mayores a 700 millones de usuarios activos mensuales, debe solicitar una licencia de Meta’. Esta cláusula, combinada con la falta de disponibilidad del código fuente, plantea la cuestión de si el término de código abierto debería aplicarse a la familia de modelos de Llama», explicó Menon. Por el contrario, el objetivo de OMI, según los analistas, es crear modelos que no presenten salvedades a las empresas y sean de más libre acceso. ¿Podrá OMI hacer frente al poder de Meta y los proveedores de LLM más grandes? Los objetivos y la visión de OMI recibieron reacciones mixtas de los analistas. Mientras que el analista jefe de Amalgam Insights, Hyoun Park, cree que OMI conducirá al desarrollo de estándares más predecibles y consistentes para los modelos de código abierto, de modo que estos modelos puedan potencialmente funcionar entre sí con mayor facilidad, Malik de Everest Group cree que OMI puede no ser capaz de hacer frente al poder de proveedores como Meta y Anthropic. “El desarrollo de LLM requiere un gran esfuerzo computacional y ha costado a los grandes gigantes tecnológicos y a las empresas emergentes miles de millones en gastos de capital para alcanzar la escala que tienen actualmente con sus LLM de código abierto y propietarios”, dijo Malik, y agregó que esto podría ser un gran desafío para los LLM basados ​​en la comunidad. El líder de la práctica de IA también señaló que los intentos anteriores de un LLM basado en la comunidad tampoco han obtenido mucha adopción, ya que los modelos desarrollados por entidades más grandes tienden a tener un mejor desempeño en la mayoría de las métricas. “Un excelente ejemplo de un LLM abierto de este tipo es BLOOM, que creó con éxito un modelo comunitario, pero aún no ha podido generar adopción debido a ineficiencias y ciertas opciones de diseño (fue diseñado para no ser una interfaz de chat)”, explicó Malik. Sin embargo, el líder de la práctica de IA dijo que OMI podría encontrar nichos apropiados dentro del espacio de desarrollo de contenido (generación de imágenes 2D/3D, adaptación, diseño visual, edición, etc.) a medida que comienza a construir sus modelos. “Estos nichos están alineados con varios casos de uso (por ejemplo, generación de imágenes en 3D) o aplicaciones en los sectores verticales (por ejemplo, generación/edición de imágenes de catálogos para el comercio minorista) donde sus modelos pueden realizar tareas de manera efectiva”, dijo Malik. La teoría de Malik puede ser válida, dado que Invoke es una plataforma de IA generativa para estudios profesionales y Civitai es un centro de IA generativa para creadores. Uno de los otros casos de uso para los LLM comunitarios de OMI es ver su uso como modelos de lenguaje pequeños (SLM), que pueden ofrecer una funcionalidad específica con alta efectividad o una funcionalidad que está restringida a aplicaciones o casos de uso únicos, dijeron los analistas. Actualmente, la página de GitHub de OMI tiene tres repositorios, todos bajo la licencia Apache 2.0.