Inflection ayuda a solucionar la falta de información de RLHF con modelos únicos para IA empresarial y agente

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder en la industria. Más información Un intercambio reciente en X (anteriormente Twitter) entre el profesor de Wharton Ethan Mollick y Andrej Karpathy, ex director de IA de Tesla y cofundador de OpenAI, toca algo fascinante y fundamental: muchos de los principales modelos de IA generativa de la actualidad. incluidos los de OpenAI, Anthropic y Google—muestran una sorprendente similitud en el tono, lo que suscita la pregunta: ¿por qué los grandes modelos lingüísticos (LLM) convergen no sólo en competencia técnica sino también en personalidad? El comentario de seguimiento señaló una característica común que podría estar impulsando la tendencia de convergencia de resultados: el aprendizaje por refuerzo con retroalimentación humana (RLHF), una técnica en la que los modelos de IA se ajustan en función de evaluaciones proporcionadas por entrenadores humanos. Sobre la base de esta discusión sobre el papel de RLHF en la similitud de resultados, los recientes anuncios de Inflection AI sobre Inflection 3.0 y una API comercial pueden proporcionar una dirección prometedora para abordar estos desafíos. Ha introducido un enfoque novedoso para RLHF, destinado a hacer que los modelos generativos no sólo sean consistentes sino también distintivamente empáticos. Con su entrada al espacio empresarial, los creadores de la colección de modelos Pi aprovechan RLHF de una manera más matizada, desde esfuerzos deliberados para mejorar los modelos de ajuste hasta una plataforma patentada que incorpora comentarios de los empleados para adaptar los resultados de la IA generada a la cultura organizacional. . La estrategia tiene como objetivo hacer de los modelos de Inflection AI verdaderos aliados culturales en lugar de simples chatbots genéricos, proporcionando a las empresas un sistema de IA más humano y alineado que se destaque entre la multitud. Inflection AI quiere que los chatbots de su trabajo se preocupen. En este contexto de convergencia, Inflection AI, los creadores del modelo Pi, están abriendo un camino diferente. Con el reciente lanzamiento de Inflection for Enterprise, Inflection AI tiene como objetivo hacer de la inteligencia emocional, denominada «EQ», una característica central para sus clientes empresariales. La compañía dice que su enfoque único hacia RLHF la distingue. En lugar de depender del etiquetado de datos anónimo, la empresa buscó comentarios de 26.000 profesores de escuela y profesores universitarios para ayudar en el proceso de ajuste a través de una plataforma de comentarios patentada. Además, la plataforma permite a los clientes empresariales ejecutar aprendizaje reforzado con comentarios de los empleados. Esto permite ajustar posteriormente el modelo a la voz y el estilo únicos de la empresa del cliente. El enfoque de Inflection AI promete que las empresas serán “dueñas” de su inteligencia, es decir, un modelo local ajustado con datos propietarios que se gestionan de forma segura en sus propios sistemas. Este es un alejamiento notable de los modelos de IA centrados en la nube con los que muchas empresas están familiarizadas: una configuración que Inflection cree mejorará la seguridad y fomentará una mayor alineación entre los resultados de la IA y las formas en que las personas la usan en el trabajo. Qué es y qué no es RLHF RLHF se ha convertido en la pieza central del desarrollo de la IA de generación, en gran parte porque permite a las empresas dar forma a respuestas para que sean más útiles, coherentes y menos propensas a errores peligrosos. El uso de RLHF por parte de OpenAI fue fundamental para hacer que herramientas como ChatGPT fueran atractivas y, en general, confiables para los usuarios. RLHF ayuda a alinear el comportamiento del modelo con las expectativas humanas, haciéndolo más atractivo y reduciendo resultados no deseados. Sin embargo, el RLHF no está exento de inconvenientes. El RLHF se propuso rápidamente como una razón que contribuía a la convergencia de los resultados de los modelos, lo que podría conducir a una pérdida de características únicas y hacer que los modelos fueran cada vez más similares. Aparentemente, la alineación ofrece coherencia, pero también crea un desafío para la diferenciación. Anteriormente, el propio Karpathy señaló algunas de las limitaciones inherentes al RLHF. Lo comparó con un juego de control de vibraciones y enfatizó que no proporciona una “recompensa real” similar a los juegos competitivos como AlphaGo. En cambio, RLHF optimiza una resonancia emocional que, en última instancia, es subjetiva y puede fallar en tareas prácticas o complejas. De EQ a AQ Para mitigar algunas de estas limitaciones de RLHF, Inflection AI se ha embarcado en una estrategia de entrenamiento más matizada. No solo implementó un RLHF mejorado, sino que también dio pasos hacia capacidades de IA agente, que ha abreviado como AQ (Action Quotient). Como describió White en una entrevista reciente, los objetivos empresariales de Inflection AI implican permitir que los modelos no solo comprendan y sientan empatía, sino también que tomen acciones significativas en nombre de los usuarios, que van desde enviar correos electrónicos de seguimiento hasta ayudar en la resolución de problemas en tiempo real. Si bien el enfoque de Inflection AI es ciertamente innovador, existen posibles deficiencias a considerar. Su ventana de contexto de token de 8K utilizada para la inferencia es más pequeña que la que emplean muchos modelos de alta gama, y el rendimiento de sus modelos más nuevos no ha sido evaluado como punto de referencia. A pesar de los planes ambiciosos, es posible que los modelos de Inflection AI no alcancen el nivel deseado de rendimiento en aplicaciones del mundo real. No obstante, el cambio de EQ a AQ podría marcar una evolución crítica en el desarrollo de la IA de generación, especialmente para los clientes empresariales que buscan aprovechar la automatización para tareas tanto cognitivas como operativas. No se trata sólo de hablar con empatía con los clientes o empleados; Inflection AI espera que Inflection 3.0 también ejecute tareas que traduzcan la empatía en acción. La asociación de Inflection con plataformas de automatización como UiPath para proporcionar esta «IA agente» refuerza aún más su estrategia para destacarse en un mercado cada vez más concurrido. Navegando en un mundo posterior a Suleyman Inflection AI ha experimentado cambios internos significativos durante el año pasado. La salida del CEO Mustafa Suleyman en la “adquisición” de Microsoft, junto con una parte considerable del equipo, arroja dudas sobre la trayectoria de la empresa. Sin embargo, el nombramiento de White como director ejecutivo y un equipo directivo renovado han marcado un nuevo rumbo para la organización. Esta “refundación” se centró en el uso empresarial de la IA emocional, con el objetivo de proporcionar experiencias de IA personalizadas y profundamente integradas en lugar de soluciones genéricas de chatbot. Pi… en realidad bastante popular El enfoque único de Inflection AI con Pi está ganando terreno más allá del espacio empresarial, particularmente entre los usuarios de plataformas como Reddit. La comunidad de Pi ha expresado sus experiencias, compartiendo anécdotas positivas y debates sobre las respuestas reflexivas y empáticas de Pi. Esta popularidad de base demuestra que Inflection AI podría haber logrado algo significativo. Al apoyarse en la inteligencia emocional y la empatía, Inflection no solo está creando una IA que ayuda, sino también una IA que resuena en las personas, ya sea en entornos empresariales o como asistentes personales. Este nivel de participación de los usuarios sugiere que su enfoque en EQ podría ser la clave para distinguirse en un panorama donde otros LLM corren el riesgo de mezclarse entre sí. ¿Qué sigue para Inflection AI? En el futuro, el enfoque de Inflection AI en funciones posteriores a la capacitación como la generación aumentada de recuperación (RAG) y los flujos de trabajo agentes tiene como objetivo mantener su tecnología a la vanguardia de las necesidades empresariales. Inflection AI dice que el objetivo final es marcar el comienzo de una era posterior a la GUI, donde la IA no solo responde a comandos sino que ayuda activamente con integraciones perfectas entre varios sistemas comerciales. Aún no se sabe si el novedoso enfoque de Inflection AI mejorará significativamente la similitud de resultados. Sin embargo, si las ideas innovadoras de White y su equipo dan frutos, EQ podría surgir como una métrica fundamental para evaluar la eficacia de la tecnología generativa de su empresa. VB Daily ¡Manténgase informado! Reciba las últimas noticias en su bandeja de entrada diariamente. Al suscribirse, acepta los Términos de servicio de VentureBeat. Gracias por suscribirte. Consulte más boletines de VB aquí. Se produjo un error.

Todo lo que necesitas saber sobre tecnología

Inflection ayuda a solucionar la falta de información de RLHF con modelos únicos para IA empresarial y agente

Deja una respuesta Cancelar la respuesta

Inflection ayuda a solucionar la falta de información de RLHF con modelos únicos para IA empresarial y agente

Samsung Galaxy Watch 7 y Ultra alcanzan los precios más bajos antes del Prime Day

15 ciberataques y filtraciones de datos notables

Deja una respuesta Cancelar la respuesta