OpenAI revolucionó la IA generativa con DALL-E 3 y Sora. Google ya tiene grandes respuestas: Imagen 3 y Veo

La compañía tiene que recuperar tiempo perdido en el campo de las IAs generativas multimedia

Image 3 Google
Sin comentarios Facebook Twitter Flipboard E-mail

Entre todas las novedades anunciadas en su evento Google I/O, la compañía ha anunciado el lanzamiento de dos nuevos modelos de inteligencia artificial generativa: Veo, su modelo más avanzado para la generación de videos en alta definición, e Imagen 3, su modelo de texto a imagen de mayor calidad hasta la fecha.

Veo: una alternativa a Sora

Veo es el modelo de generación de video más avanzado de Google hasta la fecha. Este modelo es capaz de crear vídeos en alta definición (1080p) que pueden durar más de un minuto, cubriendo una amplia gama de estilos visuales y cinematográficos.

Pero lo más relevante es la consistencia y coherencia del metraje generado por Veo, con personas, animales y objetos que se mueven de manera realista a lo largo de las tomas.

Además, gracias a su comprensión avanzada del lenguaje natural y la semántica visual, Veo puede generar videos que reflejan fielmente la visión creativa del usuario, siendo capaz de entender términos cinematográficos como "timelapse" o "tomas aéreas de un paisaje", y ofreciendo así un control creativo sin precedentes.

Google ha estado invitando a cineastas y creadores a experimentar con Veo, a imagen y semejanza de lo que ha estado haciendo OpenAI con Sora. Un ejemplo de esto es la colaboración con el cineasta Donald Glover y su estudio creativo Gilga, quienes ya han experimentado con Veo en un proyecto cinematográfico.

Imagen 3: Dando batalla a DALL-E 3

Wm Text Rendering Word Light Made From Various Colorful Feathers Black Background

El modelo Imagen 3 de Google es su modelo de IA de texto-a-imagen (como MidJourney o DALL-E 3) de mayor calidad hasta la fecha: Imagen 3 genera imágenes fotorrealistas y detalladas con menos 'artefactos' (defectos) visuales que sus predecesores.

Este modelo no solo entiende mejor el lenguaje natural y la intención detrás de los prompts introducidos por los usuarios, sino que también incorpora pequeños detalles que mejoran la fidelidad de las imágenes generadas.

Imagen 3 es especialmente eficaz renderizando texto dentro de las imágenes (ver imagen anterior), una capacidad que abre nuevas posibilidades como la creación de mensajes de cumpleaños personalizados o diapositivas para presentaciones.

Al igual que Veo, Imagen 3 está disponible en vista previa privada para un grupo selecto de creadores dentro de ImageFX (con la posibilidad de unirse a la lista de espera) y próximamente estará disponible en Vertex AI.

En Genbeta | Esta inteligencia artificial te permite crear todo tipo de imágenes 3D con tu nombre gratis y con intentos ilimitados: así funciona

Inicio