Cuando Sam Altman visitó la India el año pasado, dijo que sería imposible para una startup competir con OpenAI en la formación de modelos básicos con 10 millones de dólares en el banco. El comentario llegó a los titulares más importantes, y CP Gurnani, ex director ejecutivo de la empresa india de TI Tech Mahindra, dijo ambiciosamente que se aceptó el desafío de construir IA generativa de forma nativa en la India. Avanzando rápidamente hasta principios de 2024, India, conocida por su talento y sus empresas tecnológicas, va por buen camino con la IA generativa. Sin embargo, lo interesante es que el primer jugador indio que da un paso concreto para enfrentarse a los modelos GPT de OpenAI no es Tech Mahindra sino (lo adivinaste) una startup fundada por Bhavish Aggarwal, quien también fundó la empresa de transporte Ola Cabs para competir con Uber. . Ola Krutrim, que significa «artificial», presentó su primer modelo de lenguaje, la base Krutrim, y un chatbot construido sobre él el mes pasado, al tiempo que detalló planes para llevarlo a la corriente principal muy pronto. Otros jugadores, incluidos Tech Mahindra y Reliance Industries, también están en la carrera, tratando de ponerse al día. La carrera por ofrecer experiencias localizadas Si bien los modelos básicos como la familia GPT de OpenAI y Llama de Meta hacen un trabajo bastante bueno generando lenguaje, respuestas y código, a veces pueden tener dificultades para manejar consultas en idiomas distintos del inglés, particularmente aquellos de bajos recursos (con una huella digital más pequeña). Para abordar esto y potenciar experiencias más localizadas, empresas de tecnología en diferentes países, incluidos Corea del Sur, Finlandia y China, han comenzado a capacitar modelos patentados con un enfoque de aumentar la representación de idiomas locales y contextos culturales en sus datos de capacitación. El mismo desafío también obstaculiza las ambiciones de IA generativa de la India. Sin embargo, en este caso el problema es mucho mayor. El país alberga a 1.400 millones de personas, o casi el 18% de la población mundial, y tiene 22 idiomas oficialmente reconocidos, más de 1.600 dialectos y 19.200 dialectos no oficiales. Entrenar un modelo para que lo abarque todo es una tarea en sí misma y ciertamente requiere mucho capital (como sugirió Altman). Después de ofrecer servicios de transporte compartido y vender vehículos eléctricos, Aggarwal incorporó Krutrim en abril de 2023 para afrontar este desafío. La compañía recaudó 24 millones de dólares en deuda de Matrix Partners y capacitó a Krutrim basándose en dos billones de tokens. Este, como anunció el empresario en el lanzamiento, incluye la mayor representación de lenguas índicas, 20 veces más que cualquier otro modelo. “Krutrim tiene valores indios nativos. Genera texto y código con un sentido innato de la sensibilidad y relevancia cultural india”, dijo. En su forma actual, el modelo de Ola comprende 20 idiomas indios y genera 10, incluidos hindi e inglés. Según la empresa, su rendimiento en los idiomas índicos ya es mejor que el de GPT-4, pero el rendimiento en calidad del inglés sigue estando por detrás (se espera que mejore en los próximos meses). La startup se está moviendo en fases y tiene múltiples desarrollos en proceso, incluido soporte para todos los idiomas índicos oficialmente reconocidos y una versión Pro del modelo para la resolución de problemas complejos con soporte para texto, visión y voz. Además de los modelos que se proporcionarían a las empresas, Aggarwal y el equipo han creado una experiencia de chatbot similar a ChatGPT para la audiencia india. Sin embargo, no está abierto al público en este momento. La empresa también está realizando investigación y desarrollo en el ámbito del hardware para construir su supercomputadora de inteligencia artificial. Los peces gordos se ponen al día Si bien queda por ver cómo funcionan los modelos de Krutrim en el mundo real, cuando los desarrolladores y consumidores comiencen a usarlos, la compañía se ha posicionado como uno de los primeros jugadores indios en cubrir todas las bases en el mucho. espacio de IA generativa publicitado. Las otras empresas notables que se están poniendo al día son Tech Mahindra y Reliance Industries del multimillonario Mukesh Ambani. Tech Mahindra, bajo el liderazgo de CP Gurnani, comenzó a trabajar en un modelo de lenguaje grande (LLM) de código abierto en el marco del Proyecto Indus en agosto de 2023 y recientemente lo lanzó para pruebas beta internas. Está previsto que esta oferta debute en febrero de 2024 y se dice que es un LLM en hindi puro con 539 millones de parámetros y 10 mil millones de tokens de dialecto hindi +. Incluso en este caso, no se admiten todos los idiomas. «En la primera fase, crearemos el LLM para el idioma hindi y más de 37 dialectos, y luego avanzaremos de manera gradual para cubrir otros idiomas y dialectos», señaló la compañía en su sitio web. Por otro lado, Reliance Industries, que lideró la ola 4G en India con Jio y cuenta con patrocinadores como Google, Meta e Intel, parece estar avanzando un poco más lento en la carrera por la IA. La compañía anunció un plan para construir modelos lingüísticos para la India en su Asamblea General Anual del año pasado. Posteriormente se asoció con Nvidia para obtener acceso al superchip GH200 y construir una infraestructura de inteligencia artificial más poderosa que la supercomputadora más rápida de la India. Ahora está trabajando con un equipo del Instituto Indio de Tecnología de Bombay para dar vida al proyecto, denominado Bharat GPT. Si bien no se han compartido muchos detalles, parece que Reliance planea llevar la oferta de GPT a sus productos y servicios de cara al cliente, incluidos los ofrecidos por Jio. No está claro si la compañía lanzará o no un chatbot orientado al consumidor similar a ChatGPT. Junto con Reliance y TechM, Sarvam AI, con sede en Bengaluru, que recientemente salió del sigilo con 41 millones de dólares en financiación, también ha atraído una atención significativa. La startup ha creado un modelo de lenguaje índico de 7 mil millones de parámetros, basado en Llama2, y planea lanzar una plataforma centrada en la empresa para ayudar a las empresas a crear aplicaciones de IA generativa usándola. Corover, respaldado por Google, también afirma haber creado un modelo de lenguaje índico que admite 22 idiomas para su plataforma de chatbots empresariales conversacionales. Mejores experiencias con IA generativa A medida que el ecosistema evoluciona, surgen más actores y la tecnología madura, se espera que tomen forma en el país modelos de lenguaje índico más sofisticados, cerrados y de código abierto. Todo esto no sólo mejorará los flujos de trabajo internos de la empresa, sino que también conducirá a mejores aplicaciones para las organizaciones que operan en diferentes sectores. Por ejemplo, Tech Mahindra señala que el LLM de Indus Project puede conducir al desarrollo de un asistente digital para más de 140 millones de agricultores, proporcionándoles la información necesaria sobre préstamos, pesticidas y otros aspectos relacionados con la agricultura en su idioma preferido. También podría impulsar quioscos financieros y de atención médica para descifrar el habla en dialectos locales y proporcionar información útil en cuestión de segundos. Las posibilidades son infinitas. Más allá de esto, también será interesante ver cómo se comportan estos modelos frente a sus homólogos globales en términos de rendimiento, incluidos líderes del mercado como OpenAI, que se acerca a GPT-4.5, y Google, que recientemente presentó la serie de modelos Gemini. La misión de VentureBeat es ser una plaza digital para que los tomadores de decisiones técnicas adquieran conocimientos sobre tecnología empresarial transformadora y realicen transacciones. Descubra nuestros Briefings.

Source link