La nueva IA creada por Google hace imágenes increíbles y realistas a partir de la descripción de una idea. Supera a DALL-E 2

Hace unas semanas nos sorprendíamos con los resultados que ofrecía la inteligencia artificial de DALL-E 2 y analizábamos cómo verlas y cómo pedir una. Las imágenes se logran recurriendo a la misma tecnología que la IA generadora de textos GPT-3. También hemos podido ver cómo de realistas quedaron las fotografías de unas vacaciones buceando en el fondo del mar gracias al uso de esta IA.

En Genbeta

Esta impresionante inteligencia artificial restaura fotografías dañadas: adiós arañazos, hola color

Pues hoy vamos a ver las fotos que es capaz de crear gweb-research-imagen, que basa su tecnología en la Google AI (reconocida por tener capacidades tan avanzadas como que puede explicarte chistes). A continuación puedes ver ejemplos de fotografías con el texto debajo que se escribió para que la AI crease esa imagen.

Un vistazo a…

'Sgroogled.com': cuando MICROSOFT lanzaba anuncios ANTI-GOOGLE

Modelo de difusión de texto a imagen

IMAGEN es, según explican sus creadores, "un modelo de difusión de texto a imagen" en el que los resultados son realistas, según podemos ver en los resultados. IMAGEN se basa en inteligencia artificial de modelos lingüísticos para la comprensión del texto y se apoya en modelos de difusión para la generación de imágenes de alta fidelidad.

Para evaluar los modelos de texto a imagen con mayor profundidad, esta web también ha creado DrawBench. Con DrawBench se compara IMAGEN con métodos recientes, como VQ-GAN+CLIP o con DALL-E 2.

En Genbeta

Esta inteligencia artificial te dibuja en segundos el objeto que quieras y con el estilo artístico que decidas: así funciona

Como ves en los ejemplos de la anterior foto, puedes definir asuntos tan estrambóticos como: "una galería de arte con obras de Monet. La galería está inundada. Robots se mueven por la galería utilizando tablas de Paddle board". Y la herramienta ha creado una fotografía con esos requisitos, que parece realmente diseñada tras horas de trabajo.

Cerrado al público

De todos modos, no es posible crear nuestras propias fotografías: a diferencia de OpenAI es una herramienta más restrictiva, al menos por el momento. Como explica la propia web, para evitar riesgos no darán acceso a IMAGEN ni habrá demo pública. Como sucede con DAL-LE 2, las fotografías resultantes tienen una marca de agua en la esquina inferior derecha para identificar que no es una foto real, pero esta es fácilmente recortable con cualquier editor.

Jeff Dean, investigador senior de inteligencia artificial de Google AI ha compartido numerosas imágenes en su perfil de Twitter.

AI can unlock joint human/computer creativity! Imagen is one direction we are pursuing:https://t.co/LTlE3pqq4W

"A high contrast portrait of a very happy fuzzy panda dressed as a chef in a high end kitchen making dough. There is a painting of flowers on the wall behind him." pic.twitter.com/SrqEv9jeHf
— Jeff Dean (@🏡) (@JeffDean) May 24, 2022

Según los investigadores de Google, actualmente sólo está disponible como documento científico. Por razones éticas, es poco probable que esto cambie en un futuro próximo, pero no lo descartan en un futuro.

Vía | Carlos Santana

Modelo de difusión de texto a imagen

Cerrado al público

Recibe "Xatakaletter", nuestra newsletter semanal

Explora en nuestros medios