Ya hemos comprobado de primera mano las bondades de Stable Diffusion, la nueva inteligencia artificial de Stability AI que ya puede probar todo el mundo de manera gratuita a través de DreamStudio. Esta IA puede generar imágenes a través de una descripción de texto, tal y como ocurre en DALL-E 2. Aunque lo que os vamos a enseñar a continuación es una muestra de cómo aprovechar al máximo las capacidades de esta IA, junto a otras aplicaciones.
Un usuario ha mostrado en Twitter un espectacular vídeo de cómo ha transformado su rostro y su voz haciendo uso de Stable Diffusion y otras aplicaciones gratuitas. Lo mejor de todo es que lo logró en muy poco tiempo, y de forma sencilla.
Transformación total en solo unos pocos pasos
Scott Lighthiser, experto en arte cinematográfico y creador de varios cortos en YouTube, ha querido hacer una demostración de las capacidades de Stable Diffusion, aunado a otras aplicaciones gratuitas, a través de un sorprendente vídeo en el que se le ve a él diciendo un trabalenguas en frente de la cámara, mientras su rostro y voz se van transformando poco a poco.
@StableDiffusion Img2Img x #ebsynth x @koe_recast TEST#stablediffusion #AIart pic.twitter.com/aZgZZBRjWM
— Scott Lighthiser (@LighthiserScott) September 7, 2022
Durante la primera escena le vemos a él de forma normal, pero a los pocos segundos vemos cómo su rostro se transforma en una especie de escultura griega viviente, pasando finalmente a convertirse en un zombie entrado en años y con el rostro lleno de sangre, todo mientras cambiada además su voz.
Tal y como menciona en el tweet, el vídeo ha sido realizado a través de una serie de aplicaciones completamente gratuitas y que, con un poco de maña, cualquiera puede hacer en poco tiempo. Con Stable Diffusion podemos subir una imagen nuestra para modificarla a nuestro antojo, todo desde la web de DreamStudio o ejecutando el modelo de forma local en nuestro ordenador. Pero claro, no es posible transformar un vídeo completo. Es por ello que lo ha renderizado dividiendo todos los fotogramas y escogiendo uno de ellos para editarlo en Stable Diffusion.
Testing #stablediffusion img2img & #ebsynth pic.twitter.com/U4VeDz2t54
— Scott Lighthiser (@LighthiserScott) August 31, 2022
Si bien las transformaciones faciales están a cargo de Stable Diffusion, para propagar el efecto a cada fotograma del vídeo de manera automática hizo uso de EbSynth. Eso sí, la clave reside en que en el vídeo no debe haber demasiado movimiento para que el efecto no se descomponga.
Para cambiar su voz, ha hecho uso también de Koe Recast, una app que nos permite transformar nuestra voz en tiempo real, alterando múltiples parámetros de la misma. Eso sí, para usar esta aplicación de forma completa habrá que registrarse para probar su versión alpha, o probar una demo online subiendo un archivo.
El resultado del uso de todo este conjunto de aplicaciones es el que hemos visto más arriba. Lighthiser también ha realizado otras pruebas con esta tecnología, aunque como podemos ver en el segundo vídeo mostrado, debido a un mayor movimiento en las escenas, el efecto no acaba de ser del todo convincente.
El uso de la inteligencia artificial para generar obras artísticas está generando gran debate en redes sociales. Desde la demostración de todo lo que podía hacer DALL-E 2, son más los que se preguntan si esta tecnología acabará perjudicando a los artistas.
Ver todos los comentarios en https://www.genbeta.com
VER 6 Comentarios