Midjourney 5 mejora casi todos los aspectos de las imágenes generadas por IA
Mejorando: Con todas las noticias recientes que giran en torno a ChatGPT y otros modelos de lenguaje extenso, es fácil olvidar que sus primos, los generadores de imágenes de IA, aún están mejorando. Es posible que uno haya descubierto cómo renderizar ojos y manos sin que el sujeto parezca sacado de una pesadilla. sin embargo, los resultados aún asustan a algunas personas.
A principios de esta semana, el laboratorio de investigación Midjourney lanzó una versión beta de la versión 5 de su software de imágenes de IA autodenominado. Según su anuncio a través de Twitter, la última versión agrega una mayor calidad de imagen, resultados más "diversos", una gama más amplia de estilos, texturas uniformes y mucho más.
A partir de hoy nuestra comunidad puede probar Midjourney V5. Tiene una calidad de imagen mucho más alta, salidas más diversas, un rango estilístico más amplio, compatibilidad con texturas fluidas, relaciones de aspecto más amplias, mejores indicaciones de imagen, rango dinámico más amplio y más. ¡Vamos a explorar!
Los usuarios ya han publicado cientos de resultados sorprendentes y los sentimientos sobre las mejoras son mixtos. La mayoría está impresionada porque la IA de imágenes ha tenido problemas para producir aspectos como sombras, reflejos, ojos y manos. A continuación se muestra una imagen que creamos con Dall-E de OpenAI como un ejemplo de dónde la máquina tiene problemas.
La composición está un poco fuera de lugar y la sensación general es caricaturesca. La iluminación está mal. Los ojos y las manos están muy deformados. Las piernas están llenas de artefactos, al igual que el contenedor de palomitas de maíz y el asiento junto al sujeto. Este resultado es uno de los cuatro con problemas similares en diversos grados.
La versión 5 de Midjourney parece haber mejorado en este sentido, al menos por los ejemplos que otros han compartido. Los resultados de las indicaciones simples bordean el valle inquietante: lo suficientemente realistas como para pasar como fotos profesionales en muchos casos, pero aún con esa calidad extraña que no puedes ubicar. Si bien son increíblemente realistas, muchos han descrito las imágenes como espeluznantes.
¡Midjourney v5 está aquí! (de verdad esta vez, jajaja) Aquí hay algunos de mis avisos, v4 vs v5, así como algunos nuevos avisos y tomas de público. Agregaré más a esto a medida que experimente. 𧵠pic.twitter.com/qSEZWQBXou
Nuestro propio Kishalaya Kundu dijo: "Estoy más asustado que impresionado, para ser honesto", después de ver una serie de fotos casi perfectas de Midjourney V5. El temor es que uno podría crear fácilmente una imagen falsa y hacerla pasar como genuina.
Dejando a un lado el factor de fluencia, en comparación con V4, Midjourney V5 ha mejorado drásticamente la calidad. La diseñadora gráfica Julie Wieland ha usado Midjourney V4 (lanzado en noviembre pasado) durante algún tiempo y dice que la versión 5 tiene texturas de piel "increíblemente realistas". Los efectos de iluminación también son mucho mejores, incluidos los reflejos, el resplandor y las sombras. Quizás lo más importante es que la IA genera manos y ojos que parecen naturales la mayor parte del tiempo.
�"� Consejo de MJ: ¡las tomas a través de una ventana finalmente son posibles con V5! He estado deseando la estética de "My Blueberry Nights" desde que probé Dalle2 por primera vez (y funcionó bien), pero v5 ¡Es alucinante! Encuentra el indicador en el texto ALT de las imágenes #synthography #midjourneyv5 pic.twitter.com/kAOagopucG
"Los ojos son casi perfectos y ya no están torcidos", dijo Wieland a Ars Technica. "Las manos son correctas la mayor parte del tiempo, con cinco dedos en lugar de 7-10 en una mano. MJ v5 actualmente me parece como si finalmente me pusiera anteojos después de ignorar la mala vista durante demasiado tiempo. De repente ves todo en 4k; es se siente extrañamente abrumador pero también increíble".
Foto de estilo callejero de la década de 1960 de una mujer joven, sentada, velero, vestido verde de dior, vestido verde de seda, vestido verde, seda, collar de perlas, perlas de tiffany, collar de perlas de tiffany, puesta de sol, océano, filmada en Agfa Vista 200, 4k --ar 16:9v4 (izquierda) v5 (derecha) pic.twitter.com/wz7GbI3fvA
Midjourney también mejoró la resolución nativa de 512x512px a 1024x1024px. El aumento lo alinea con Dall-E. Sin embargo, la versión 4 podría supermuestrear para duplicar la resolución nativa. No es irrazonable esperar que V5 use la misma técnica para producir imágenes de 2048x2048, pero eso es para una actualización más adelante.
La conclusión es que MidJourney solo llegó a la escena de la IA hace un año. Muchas (no todas) de estas imágenes que inundan los feeds de Twitter esta semana están intactas. Anteriormente, Weiland usó una combinación de técnicas para mejorar la calidad visual de Midjourney 4, incluida la "superposición de pintura" con Dall-E y retoques en Photoshop. La versión 5 promete menos edición posterior a la generación y quizás imágenes fotográficas perfectas antes de lo que podemos imaginar. Esta perspectiva es, de hecho, emocionante y aterradora.
Mejorando: