La nueva IA creada por Google hace imágenes increíbles y realistas a partir de la descripción de una idea. Supera a DALL-E 2

La nueva IA creada por Google hace imágenes increíbles y realistas a partir de la descripción de una idea. Supera a DALL-E 2
1 comentario Facebook Twitter Flipboard E-mail

Hace unas semanas nos sorprendíamos con los resultados que ofrecía la inteligencia artificial de DALL-E 2 y analizábamos cómo verlas y cómo pedir una. Las imágenes se logran recurriendo a la misma tecnología que la IA generadora de textos GPT-3. También hemos podido ver cómo de realistas quedaron las fotografías de unas vacaciones buceando en el fondo del mar gracias al uso de esta IA.

Pues hoy vamos a ver las fotos que es capaz de crear gweb-research-imagen, que basa su tecnología en la Google AI (reconocida por tener capacidades tan avanzadas como que puede explicarte chistes). A continuación puedes ver ejemplos de fotografías con el texto debajo que se escribió para que la AI crease esa imagen.

Ftesqmixoaalu49
Un vistazo a…
'Sgroogled.com': cuando MICROSOFT lanzaba anuncios ANTI-GOOGLE

Modelo de difusión de texto a imagen

Firefox By12yiflob

IMAGEN es, según explican sus creadores, "un modelo de difusión de texto a imagen" en el que los resultados son realistas, según podemos ver en los resultados. IMAGEN se basa en inteligencia artificial de modelos lingüísticos para la comprensión del texto y se apoya en modelos de difusión para la generación de imágenes de alta fidelidad.

Para evaluar los modelos de texto a imagen con mayor profundidad, esta web también ha creado DrawBench. Con DrawBench se compara IMAGEN con métodos recientes, como VQ-GAN+CLIP o con DALL-E 2.

Como ves en los ejemplos de la anterior foto, puedes definir asuntos tan estrambóticos como: "una galería de arte con obras de Monet. La galería está inundada. Robots se mueven por la galería utilizando tablas de Paddle board". Y la herramienta ha creado una fotografía con esos requisitos, que parece realmente diseñada tras horas de trabajo.

Cerrado al público

Imagen Training Process 860x846

De todos modos, no es posible crear nuestras propias fotografías: a diferencia de OpenAI es una herramienta más restrictiva, al menos por el momento. Como explica la propia web, para evitar riesgos no darán acceso a IMAGEN ni habrá demo pública. Como sucede con DAL-LE 2, las fotografías resultantes tienen una marca de agua en la esquina inferior derecha para identificar que no es una foto real, pero esta es fácilmente recortable con cualquier editor.

Jeff Dean, investigador senior de inteligencia artificial de Google AI ha compartido numerosas imágenes en su perfil de Twitter.

Según los investigadores de Google, actualmente sólo está disponible como documento científico. Por razones éticas, es poco probable que esto cambie en un futuro próximo, pero no lo descartan en un futuro.

Vía | Carlos Santana

Comentarios cerrados
Inicio