Hoy, Stability AI, la compañía desarrolladora de Stable Diffusion (el principal oponente open source de inteligencias artificiales generadoras de imágenes como DALL-E 2 o MidJourney) ha anunciado el lanzamiento de su nuevo SDXL 0.9 (también conocido como Stable Diffusion XL).
Tras el exitoso lanzamiento de su versión beta en abril, SDXL 0.9 ahora ofrece una tecnología de generación de imágenes "con una mejora significativa de funcionalidades con respecto a su predecesor".
De hecho, el comunicado oficial de lanzamiento gira en torno a la contraposición de imágenes generadas por la beta lanzada en abril y las del nuevo lanzamiento definitivo. Extraterrestres, gente bebiendo café o un lobo sirven para ilustrar el perceptible avance en este modelo de IA.
Un avance, por lo demás, necesario para evitar que el 'open source' se quedara atrás en este campo, después de que el pasado mes de marzo MidJourney lanzara también su nueva versión (la v5)…
…en la que, entre otros muchos pasos hacia el fotorrealismo total, lograron suprimir uno de los principales indicadores que habían permitido detectar hasta ahora las imágenes creadas mediante IA: los problemas a la hora de representar las manos. Ahora, Stable Diffusion también ha logrado superar este obstáculo.
Además, Stable Diffusion XL, promete permitirnos "crear imágenes descriptivas con prompts más breves", así como generar palabras legibles dentro de las imágenes, otro de los grandes dolores de cabeza de la mayoría de modelos de este tipo.
La versión open source, realmente, no se lanzará hasta dentro de un mes (momento en que podrás instalarlo en tu PC, si lo deseas y si tu GPU lo permite), pero eso no significa que no podamos probar ya por nosotros mismos el nuevo lanzamiento de Stability AI, pues ClipDrop ya implementa una versión de SDXL que podemos probar gratuitamente y sin registro.
Además, los clientes de Stability AI API y DreamStudio podrán acceder a este nuevo modelo a partir del próximo lunes 26 de junio, "al igual que los de otras herramientas líderes de generación de imágenes como NightCafe".
Bajo el capó del nuevo Stable Diffusion
El factor clave del perceptible avance en las capacidades de SDXL 0.9 radica en "su significativo aumento en el recuento de parámetros con respecto a la versión beta", según el comunicado de la compañía:
"SDXL 0.9 tiene uno de los mayores recuentos de parámetros de cualquier modelo de imagen de código abierto, con un modelo base de 3.500 millones de parámetros y un conjunto de modelos de 6.600 millones de parámetros (el resultado final se crea ejecutando dos modelos y agregando los resultados).
El modelo de la segunda etapa se utiliza para añadir detalles más precisos a los resultados generados en la primera etapa.
Para comparar, la versión beta se ejecuta con 3.1B parámetros y utiliza un único modelo".
Vía | Stability AI
Ver todos los comentarios en https://www.genbeta.com
VER 1 Comentario