OpenAI ya tiene listo DALL-E 3: se integrará en ChatGPT y se convierte en el rival a batir para MidJourney y Stable Diffusion

  • La nueva IA da respuesta a dos problemas con los que sus rivales no han sabido lidiar

  • Estará disponible en octubre? si usas un ChatGPT de pago

OpenAI, la compañía que lidera, hoy por hoy, el sector de la inteligencia artificial, acaba de dar un paso significativo en el mundo de la generación de imágenes mediante IA con el anuncio de la tercera versión de su plataforma DALL-E. Así es, habemus DALL-E 3, y no sólo llega con varias mejoras bajo el brazo en la calidad de las imágenes generadas…

…sino también con la novedad de integrarse de forma nativa con su chatbot —el popular ChatGPT—, lo que acercará la creación de imágenes a la amplia comunidad de usuarios de éste.

DALL-E se dio a conocer por primera vez en enero de 2021, e inició el actual 'boom' de las imágenes generadas por IA cuando, en abril de 2022, lanzó su segunda versión. Muchos oyeron hablar por primera vez entonces de términos como 'prompt', por ejemplo.

Pero, en los meses sucesivos, tanto MidJourney como Stable Diffusion le ganaron la partida, mostrando una mejor comprensión del concepto del texto introducido y, sobre todo, acabados mucho más impresionantes.

¿Qué ha cambiado?

Sin embargo, con esta tercera versión recién anunciada, OpenAI ha demostrado haber dado respuesta a las preocupaciones de los usuarios. Porque DALL-E 3 no sólo mejora lo que ofrecía DALL-E 2, no. También supera ampliamente, en algunos aspectos, a sus principales competidores en el campo de las IAs generadoras de imágenes:

"DALL·E 3 puede representar con precisión una escena con objetos específicos y las relaciones entre ellos"

En Midjourney o en Stable Diffusion resulta fácil lograr que los personajes y objetos solitarios se ajusten a nuestra imagen mental, pero lograr escenas en las que diferentes objetos tienen que seguir relaciones específicas entre sí descritas en el prompt puede ser una pesadilla a poco que aumente la complejidad de la imagen. Pero… DALL-E 3 ha solventado eso:

Espera, espera. ¿Y eso que ven mis ojos es texto coherente integrado a demanda en una imagen generada por IA? ¿En serio?

Prompt: "An illustration of a human heart made of translucent glass, standing on a pedestal amidst a stormy sea. Rays of sunlight pierce the clouds, illuminating the heart, revealing a tiny universe within. The quote 'Find the universe within you' is etched in bold letters across the horizon."

Tiembla, MidJourney, tiembla.

La clave: integración con ChatGPT

Una de las funcionalidades más destacadas de esta versión de DALL-E 3 es su integración con ChatGPT. Gracias a eso, los usuarios no necesitan ser expertos en la creación de prompts detallados.

En su lugar, pueden solicitar a ChatGPT que genere un prompt específico para DALL-E 3. De modo que ya no necesitaremos ser poco menos que prompt engineers para obtener el tipo de imagen que estamos buscando.

Y, una vez generado el prompt, la integración entre ambas herramientas de OpenAI permitirá traducirlo a imágenes sin necesidad de salir del chatbot, mejorando así la accesibilidad de la herramienta.

Sin embargo, la disponibilidad de DALL-E 3 será gradual. Por ahora, DALL-E está disponible sólo a nivel interno, y los suscriptores de ChatGPT Plus y ChatGPT Enterprise podrán tener acceso a la herramienta a lo largo de octubre. Por desgracia, OpenAI aún no ha anunciado cuándo estará disponible para el público en general.

Solventando problemas: seguridad y copyright

Según OpenAI, gran parte de su trabajo con DALL-E 3 ha consistido eb crear sólidas medidas de seguridad que eviten su uso en la creación de imágenes pornográficas o promotoras de odio. Para ello, ha trabajado con "red teamers" externos (dedicados específicamente a intentar romper dichas medidas para probarlas). DALL-E 3 tampoco permitirá recrear imágenes de personajes públicos.

Además, no generará imágenes inspiradas en el estilo de artistas vivos, en un esfuerzo por evitar problemas de derechos de autor, en un momento en el que no dejan de 'crecerle los enanos' en ese campo a su IA hermana, ChatGPT.

Vía | OpenAI

Imágenes | OpenAI

En Genbeta | "El impacto de Midjourney en la cultura es ya tan grande como el de Photoshop en fotografía": así está alucinando el realismo de 5.1

Ver todos los comentarios en https://www.genbeta.com

VER 0 Comentario

Portada de Genbeta