Ryan Haines / Android Authority Las imágenes generadas por IA son más impresionantes que nunca, y algunas incluso ganan premios de fotografía y engañan a expertos en el proceso. ¿La mejor parte? No necesitas ser un artista profesional ni tener habilidades técnicas para crearlos. Pero no todos los generadores de imágenes de IA son iguales: algunos destacan por su realismo, mientras que otros están plagados de errores fáciles de detectar. Una cosa es segura: muy pocos pueden generar texto de forma fiable. Entonces, para encontrar el mejor, presioné cada generador de imágenes de IA con indicaciones sucesivamente desafiantes. Aquí están mis hallazgos. ¿Cuál es el mejor generador de imágenes con IA?C. Scott Brown / Autoridad de Android Encontrar el mejor generador de imágenes de IA es difícil ya que los resultados pueden variar enormemente de un mensaje a otro. Sin embargo, sabemos que la tecnología de IA generativa tiende a tener dificultades en ciertas áreas más que en otras, por lo que podemos adaptar nuestras indicaciones para resaltar estas debilidades y ver dónde brilla o falla cada una. Prácticamente todos los generadores de imágenes pueden manejar estilos artísticos más simples, por lo que esta vez limitaré las pruebas a escenas realistas. Si alguna vez necesita probar un generador de imágenes de IA, intente solicitar imágenes con detalles intrincados como manos, cabello o texto. Sólo un puñado de ellos puede manejarlos bien, y otros a menudo producen resultados distorsionados o poco realistas. Otra buena prueba son las escenas complejas con múltiples sujetos o perspectivas inusuales, que tienden a hacer tropezar incluso a los mejores modelos. Con eso en mente, decidí probar varios generadores de imágenes de IA diferentes. Específicamente, elegí Imagen 3 de Google, Imagine de Meta, DALL-E 3 a través de Microsoft Designer y ChatGPT, y Grok. Y como primera indicación, pedí una imagen de una persona llorando. Esta solicitud puede parecer demasiado superficial, pero la variación en el resultado fue fascinante. Pregunta 1: Una persona llorando, con lágrimas corriendo por su rostro. Como ya puedes ver, las imágenes de diferentes modelos de IA no se parecen en nada. Si bien esto se debe en parte a que mi mensaje fue bastante vago, cada generador de imágenes que probé también fue entrenado en un conjunto de datos diferente. Meta utilizó imágenes públicas de Facebook e Instagram, por ejemplo, mientras que no está tan claro cómo la mayoría de las otras empresas obtuvieron sus conjuntos de datos de entrenamiento. Replicar la anatomía siempre ha sido complicado para los generadores de imágenes de IA y estos resultados solo prueban ese hecho. Imagen 3 de Google produjo un resultado extremadamente convincente, mientras que otros como Imagine de Meta generaron . Volví a probar este mensaje con variaciones menores para mejorar el tamaño de la muestra, pero Imagen 3 ganó todas las veces. Microsoft Designer usa DALL-E 3 de OpenAI internamente, lo que significa que debería producir resultados similares a ChatGPT. Y eso resultó ser cierto en mis pruebas, y ambos servicios arrojaron resultados decentes. Ganador: Imagen 3, seguida de DALL-E 3 Pregunta 2: una escena llena de acción de dos bailarines en mitad de una actuación en una calle empapada de lluvia… Aumenté la complejidad y el detalle de mi mensaje esta vez, manteniendo a los sujetos humanos en el marco. Imagen 3 arrojó un resultado excelente una vez más, solo fallaron los dedos de un sujeto. Por otro lado, Imagine de Meta estropeó por completo las extremidades y la cara de un bailarín y consideraría el resultado inutilizable. Microsoft Designer ofreció resultados de estilo de dibujos animados, que parecían pasables pero no eran lo que estaba buscando. El intento de ChatGPT fue mucho peor, con una extremidad extra brotando de un bailarín. Afortunadamente, Grok hizo girar el péndulo hacia atrás con un resultado razonable además de los dedos entrelazados de los bailarines. Pregunta 3: Genere una imagen de un Airbus A380… rodando por una pista con árboles tropicales de fondo. Puede que a estas alturas suene como un disco rayado, pero Imagen 3 continúa diezmando a la competencia. Aunque este mensaje requiere que la IA genere texto en el fuselaje, el modelo de Google lo manejó con facilidad. El nombre de la aerolínea se replica perfectamente y, aparte de las extrañas marcas de las calles de rodaje en la pista, es casi imposible decir que la imagen ha sido generada por IA. Grok obtuvo un resultado igualmente impresionante, aunque no en el primer intento, y aún así confundió algunas ventanas en el avión. cubierta superior. El chatbot utiliza un generador de imágenes relativamente nuevo llamado Flux, creado por los investigadores que desarrollaron Stable Diffusion. Dada la reputación de este último en el espacio de los generadores de imágenes, no sorprende que Grok pueda producir excelentes resultados. Desafortunadamente, los otros generadores de imágenes de IA arrojaron resultados inferiores a cómicamente malos aquí. Meta’s Imagine escupe texto confuso y el plano equivocado. DALL-E 3 a través de ChatGPT casi clava el texto en el costado del avión, pero generó marcas de pista mal formadas. Microsoft Designer utiliza el mismo modelo DALL-E 3, pero de alguna manera entregó imágenes poco realistas y con un aspecto aún peor. Vale la pena señalar que agregar términos como “fotorrealista” o “HD” hizo poco para que los resultados generados por IA tuvieran un aspecto más auténtico o realista. . El impacto fue mínimo en el mejor de los casos, aunque es una práctica estándar incluir estos términos como parte de una buena indicación. Ganador: Imagen 3, seguido de Grok Prompt 4: Personalidades famosas GrokGrok Mucho se ha dicho sobre el lado oscuro de los generadores de imágenes de IA y su capacidad para influir en la opinión pública a través de narrativas falsas. Para combatir este problema, la mayoría de las plataformas de IA generativa ahora tienen barreras que le impiden solicitar imágenes que imiten a una persona específica. Como era de esperar, todos los generadores de imágenes de IA rechazaron mi solicitud, excepto Grok. Elon Musk creó Grok como una IA máxima de “búsqueda de la verdad”, que es solo un discurso de marketing para un chatbot con menos barreras de seguridad que sus competidores. Esta falta de restricciones también se extiende a las imágenes generadas por IA, lo que significa que técnicamente podrías generar imágenes de líderes mundiales, celebridades e incluso el propio Musk en entornos cuestionables. ¿Qué generador de imágenes de IA recomiendo? Muchos de los generadores de imágenes de IA que recomiendo Los probados tienen fortalezas únicas que los hacen mejores que el resto, así que aquí está mi mejor elección según mis prioridades. Calidad: Puede que Imagen 3 de Google no tenga la marca más reconocible de todos los generadores de imágenes con IA de esta lista, pero se destaca por ofrecer imágenes realistas y resultados extremadamente creíbles. El único inconveniente es que solo obtienes una imagen a la vez y el procesamiento de IA puede tardar varios segundos cada vez que envías un mensaje. Velocidad: Meta Imagine se destaca si necesita una imagen rápida, ya que ni siquiera necesita presionar la tecla Enter para ver el resultado. La herramienta genera una imagen un segundo después de escribir un mensaje, lo que parece casi instantáneo en comparación con otras ofertas de esta lista. Costo: Con tantos generadores de imágenes de IA disponibles en la actualidad, ¿vale la pena pagar por uno? Al hacerlo, se desbloquearán algunas características interesantes, ya que la edición de imágenes con IA generalmente está bloqueada detrás de servicios de suscripción como Midjourney, Adobe Firefly y DALL-E 3. Sin embargo, para la generación de imágenes con IA simple, recomendaría Imagen 3, Meta Imagine y Microsoft. Diseñador. Censura: Grok ofrece uno de los generadores de imágenes de IA más sencillos y con las menores restricciones, por lo que vale la pena intentarlo. El único inconveniente es que necesitarás una suscripción X Premium (anteriormente Twitter Blue) para utilizar el servicio. Sin embargo, desde un punto de vista práctico, el mejor generador de imágenes con IA puede ser el que ya está instalado en su dispositivo. Por ejemplo, Meta AI ya está integrada en WhatsApp y Facebook Messenger. Si ya usa cualquiera de las aplicaciones, Meta Imagine debería servirle para las necesidades básicas de generación de imágenes. Del mismo modo, la serie Pixel 9 se envía con la nueva aplicación Pixel Studio de Google con tecnología de Imagen 3. Alternativamente, también puede solicitar imágenes generadas por IA a través de la aplicación Gemini. en cualquier dispositivo Android. Este último todavía usa la Imagen 2 de última generación por ahora, pero pronto pasará al último modelo de Google. Comentarios