Imagen: LALAKA/Adobe Stock GPT-4 es un sistema modelo de lenguaje de gran tamaño con inteligencia artificial que puede imitar el habla y el razonamiento humanos. Para ello, se capacita en una vasta biblioteca de comunicación humana existente, desde obras literarias clásicas hasta grandes extensiones de Internet. La inteligencia artificial de este tipo se basa en su entrenamiento para predecir qué letra, número u otro carácter es probable que aparezca en secuencia. Esta hoja de trucos explora GPT-4 desde un alto nivel: cómo acceder a GPT-4 para uso comercial o de consumo, quién lo creó y cómo funciona. ¿Qué es GPT-4? GPT-4 es un modelo multimodal de gran tamaño que puede imitar prosa, arte, video o audio producido por un humano. GPT-4 es capaz de resolver problemas escritos o generar texto o imágenes originales. GPT-4 es la cuarta generación del modelo básico de OpenAI. La API GPT-4, así como las API GPT-3.5 Turbo, DALL·E y Whisper ya están disponibles de forma general a partir del 7 de julio de 2023. El 6 de noviembre de 2023, OpenAI anunció la próxima generación de GPT-4. , GPT-4 Turbo. ¿Quién es el propietario de GPT-4? GPT-4 es propiedad de OpenAI, una empresa independiente de inteligencia artificial con sede en San Francisco. OpenAI se fundó en 2015; Comenzó como una organización sin fines de lucro, pero desde entonces pasó a un modelo con fines de lucro. OpenAI ha recibido financiación de Elon Musk, Microsoft, Amazon Web Services, Infosys y otros patrocinadores corporativos e individuales. OpenAI también ha producido ChatGPT, un chatbot de uso gratuito derivado del modelo de la generación anterior, GPT-3.5, y DALL-E, un modelo de aprendizaje profundo generador de imágenes. A medida que la tecnología mejora y crece en sus capacidades, OpenAI revela cada vez menos sobre cómo se entrenan sus soluciones de IA. ¿Cuándo se lanzó GPT-4? OpenAI anunció el lanzamiento de GPT-4 el 14 de marzo de 2023. GPT-4 estuvo disponible de inmediato para los suscriptores de ChatGPT Plus, mientras que otros usuarios interesados ​​tuvieron que unirse a una lista de espera para acceder. VER: Salesforce incorporó IA generativa a sus productos de ventas y servicios de campo. (TechRepublic) ¿Cómo se puede acceder a GPT-4? La versión pública de GPT-4 está disponible en el sitio del portal ChatGPT. El 7 de julio de 2023, OpenAI puso la API GPT-4 a disposición para uso general de «todos los desarrolladores de API existentes con un historial de pagos exitosos». OpenAI también espera abrir el acceso a nuevos desarrolladores a finales de julio de 2023. Los límites de velocidad pueden aumentar después de ese período dependiendo de la cantidad de recursos informáticos disponibles. En agosto de 2023, GPT-4 se incluyó como parte de ChatGPT Enterprise. Los usuarios de la suscripción empresarial reciben el uso ilimitado de una tubería de alta velocidad a GPT-4. ¿Cuánto cuesta usar GPT-4? Para un individuo, el uso de la suscripción ChatGPT Plus cuesta $20 por mes. El precio de la API GPT-4 de solo texto comienza en $ 0,03 por 1.000 tokens de solicitud (un token equivale aproximadamente a cuatro caracteres en inglés) y $ 0.06 por 1.000 tokens de finalización (salida), dijo OpenAI. (OpenAI explica más sobre cómo se cuentan los tokens aquí). VER: Política de ética de la inteligencia artificial (TechRepublic Premium) También está disponible una segunda opción con mayor longitud de contexto (alrededor de 50 páginas de texto) conocida como gpt-4-32k. Esta opción cuesta $0,06 por cada 1.000 tokens de aviso y $0,12 por cada 1.000 tokens de finalización. Otros servicios de asistencia de IA como Microsoft Copilot y Copilot X de GitHub ahora se ejecutan en GPT-4. Más cobertura de IA de lectura obligada ¿Cuáles son las capacidades de GPT-4? Al igual que su predecesor, GPT-3.5, el principal reclamo de fama de GPT-4 es su respuesta a preguntas en lenguaje natural y otras indicaciones. OpenAI dice que GPT-4 puede «seguir instrucciones complejas en lenguaje natural y resolver problemas difíciles con precisión». En concreto, GPT-4 puede resolver problemas matemáticos, responder preguntas, hacer inferencias o contar historias. Además, GPT-4 puede resumir grandes cantidades de contenido, lo que podría resultar útil para referencias de consumidores o casos de uso empresarial, como una enfermera que resume los resultados de su visita a un cliente. OpenAI probó la capacidad de GPT-4 para repetir información en un orden coherente utilizando varias evaluaciones de habilidades, incluidos los exámenes AP y Olympiad y el examen uniforme de la barra. Obtuvo una puntuación en el percentil 90 en el examen de la abogacía y en el percentil 93 en el examen de lectura y escritura basado en evidencia SAT. GPT-4 obtuvo puntuaciones variables en los exámenes AP. Estas no son verdaderas pruebas de conocimiento; en cambio, ejecutar GPT-4 a través de pruebas estandarizadas muestra la capacidad del modelo para formar respuestas que suenen correctas a partir de la masa de escritura y arte preexistentes en los que fue entrenado. GPT-4 predice qué token probablemente será el siguiente en una secuencia. (Un token puede ser una sección de una cadena de números, letras, espacios u otros caracteres). Si bien OpenAI mantiene la boca cerrada sobre los detalles específicos del entrenamiento de GPT-4, los LLM generalmente se capacitan traduciendo primero la información de un conjunto de datos en tokens; Luego, el conjunto de datos se limpia para eliminar datos confusos o repetitivos. A continuación, las empresas de IA suelen emplear personas para aplicar el aprendizaje por refuerzo al modelo, empujando al modelo hacia respuestas que tengan sentido común. Los pesos, que en pocas palabras son los parámetros que le dicen a la IA qué conceptos están relacionados entre sí, se pueden ajustar en esta etapa. La API de Chat Completions y sus actualizaciones La API de Chat Completions permite a los desarrolladores utilizar la API GPT-4 a través de un formato de solicitud de texto libre. Con él, pueden crear chatbots u otras funciones que requieran una conversación de ida y vuelta. La API de Chat Completions estuvo disponible por primera vez en junio de 2020. En enero de 2024, la API de Chat Completions se actualizará para utilizar modelos de finalización más nuevos. Los modelos ada, babbage, curie y davinci de OpenAI se actualizarán a la versión 002, mientras que las tareas de finalización de chat que utilizan otros modelos pasarán a gpt-3.5-turbo-instruct. Ajuste de GPT-3.5 Turbo y otras noticias El 22 de agosto de 2023, OpenAPI anunció la disponibilidad de ajuste de GPT-3.5 Turbo. Esto permite a los desarrolladores personalizar modelos y probarlos para sus casos de uso específicos. En enero de 2023, OpenAI lanzó la última versión de su API de moderación, que ayuda a los desarrolladores a identificar texto potencialmente dañino. La última versión se conoce como text-moderation-007 y funciona de acuerdo con las mejores prácticas de seguridad de OpenAI. ¿Cuáles son las limitaciones de GPT-4 para empresas? Al igual que otras herramientas de inteligencia artificial de este tipo, GPT-4 tiene limitaciones. Por ejemplo, GPT-4 no comprueba si sus declaraciones son precisas. Su entrenamiento con textos e imágenes de Internet puede hacer que sus respuestas sean absurdas o incendiarias. Sin embargo, OpenAI tiene controles digitales y entrenadores humanos para tratar de mantener el resultado lo más útil y apropiado para el negocio posible. Además, GPT-4 tiende a crear «alucinaciones», que es el término de inteligencia artificial para las imprecisiones. Sus palabras pueden tener sentido en secuencia, ya que se basan en probabilidades establecidas por aquello en lo que se entrenó el sistema, pero no están verificadas ni conectadas directamente con eventos reales. OpenAI está trabajando para reducir la cantidad de falsedades que produce el modelo. Otra limitación importante es la cuestión de si la información corporativa confidencial que se introduce en GPT-4 se utilizará para entrenar el modelo y exponer esos datos a partes externas. Microsoft, que tiene un acuerdo de reventa con OpenAI, planea ofrecer instancias privadas de ChatGPT a corporaciones más adelante en el segundo trimestre de 2023, según un informe de abril. Al igual que GPT-3.5, GPT-4 no incorpora información más reciente que septiembre de 2021 en su léxico. Uno de los competidores de GPT-4, Google Bard, tiene información actualizada porque está entrenado en la Internet contemporánea. La IA puede sufrir un colapso del modelo cuando se entrena con datos creados por IA; Este problema se está volviendo más común a medida que proliferan los modelos de IA. GPT-4 versus GPT-3.5 o ChatGPT El segundo modelo más reciente de OpenAI, GPT-3.5, difiere de la generación actual en algunos aspectos. OpenAI no ha revelado el tamaño del modelo en el que se entrenó GPT-4, pero dice que es «más datos y más cálculos» que los miles de millones de parámetros con los que se entrenó ChatGPT. GPT-4 también ha demostrado más destreza a la hora de escribir una variedad más amplia de materiales, incluida la ficción. GPT-4 tiene un rendimiento superior a ChatGPT en las pruebas estandarizadas mencionadas anteriormente. Las respuestas a las indicaciones dadas al chatbot pueden ser más concisas y más fáciles de analizar. OpenAI señala que GPT-3.5 Turbo iguala o supera a GPT-4 en determinadas tareas personalizadas. Además, GPT-4 es mejor que GPT-3.5 a la hora de tomar decisiones comerciales, como programación o resumen. GPT-4 tiene «un 82% menos de probabilidades de responder a solicitudes de contenido no permitido y un 40% más de probabilidades de producir respuestas objetivas», dijo OpenAI. VER: Aprenda a usar ChatGPT. (TechRepublic Academy) Otra gran diferencia entre los dos modelos es que GPT-4 puede manejar imágenes. Puede servir como ayuda visual, describiendo objetos del mundo real o determinando los elementos más importantes de un sitio web y describiéndolos. «En una variedad de dominios, incluidos documentos con texto y fotografías, diagramas o capturas de pantalla, GPT-4 exhibe capacidades similares a las de las entradas de solo texto», escribió OpenAI en su documentación GPT-4. ¿Vale la pena actualizar a GPT-4? Si las nuevas capacidades ofrecidas a través de GPT-4 son apropiadas para su negocio es una decisión que depende en gran medida de sus casos de uso y de si ha tenido éxito con la inteligencia artificial en lenguaje natural. Revise las capacidades y limitaciones enumeradas anteriormente y considere dónde GPT-4 podría ahorrar tiempo o reducir costos; por el contrario, considere qué tareas podrían beneficiarse materialmente del conocimiento, las habilidades y el sentido común humanos. Las últimas noticias sobre GPT-4 Microsoft anunció a principios de agosto que la disponibilidad de GPT-4 en el servicio Azure OpenAI se ha expandido a varias regiones de cobertura nuevas. A partir de noviembre de 2023, los usuarios que ya estén explorando el ajuste fino de GPT-3.5 podrán postularse al programa de acceso experimental de ajuste fino de GPT-4. OpenAI también lanzó un programa de modelos personalizados que ofrece aún más personalización de la que permite el ajuste fino. Las organizaciones pueden solicitar un número limitado de espacios (que comienzan en $2-3 millones) aquí. En la primera conferencia DevDay de OpenAI en noviembre, OpenAI demostró que GPT-4 Turbo podía manejar más contenido a la vez (más de 300 páginas de un libro estándar) que GPT-4. GPT-4 Turbo estará disponible en versión preliminar a partir de noviembre. OpenAI bajó los precios de GPT-4 Turbo en noviembre de 2023. El precio de GPT-3.5 Turbo se redujo varias veces, la más reciente en enero de 2024. El 9 de abril, OpenAI anunció que GPT-4 con Vision está disponible de forma generalizada en la API de GPT-4. , lo que permite a los desarrolladores utilizar un modelo para analizar texto y vídeo con una llamada API.