Esta inteligencia artificial que permite clonar tu voz (y cualquiera) está llenando Internet de famosos diciendo burradas: así se usa

La inteligencia artificial no va a dejar ningún área sin revolución
Hoy, suplantación de identidad

14 febrero 2024, 10:45

Marcos Merino

Una IA que permite a cualquiera, y en cuestión de segundos, clonar la voz de cualquier otra persona (o, por supuesto, de uno mismo) está empezando a arrasar en Internet. El polémico pero popular foro 4chan, sin ir más lejos, viene siendo inundado con deepfakes de audio de celebridades como Emma Watson o Joe Rogan llenos de comentarios violentos o pornográficos.

Y todo desde que, hace ahora un año, se abriera públicamente el acceso a la plataforma ElevenLabs, quizá una de las muestras más significativas de cuánto han avanzado las tecnologías basadas en IA dedicadas a la clonación y síntesis de audio.

Al margen del innegable realismo de su síntesis de voz (a años luz de voces enlatadas como Loquendo, tan popular hace años), la propia compañía presumía de que los clips de audio que genera requieren de poca o ninguna edición, lo que incentiva su uso en tareas como el doblaje o la producción de audiolibros:

Cuando surgieron los deepfakes de vídeo, todos pensamos que se inauguraba una era de desinformación masiva... y al final su principal aplicación fue la generación de porno. Está por ver qué pasará con sus equivalentes en audio

En Xataka

No te creas nada de lo que oigas, llegan los "deep fakes" de audio

Un vistazo a…

ZAO, la APP MÓVIL china que a través de DEEPFAKE te convierte en DICAPRIO en SEGUNDOS

Que alguien ponga orden aquí

Por supuesto, también ha ayudado a popularizar esta plataforma el hecho de que no presente ninguna de las salvaguardas que acostumbramos a encontrar en los servicios de generación de imágenes para evitar crear ciertos tipos de contenidos 'delicados' y/o basados en personas reales.

En un hilo publicado poco después en Twitter, ElevenLabs reconoció que parte de sus usuarios estaban abusando de su aplicación: "[observamos] un número creciente de casos de uso indebido de clonación de voz", y advirtió de que son capaces de "rastrear cualquier audio generado hasta el usuario".

Igualmente, se puso sobre la mesa la posibilidad de implementar protecciones como la verificación de la identidad de los usuarios o la aprobación manual de cada solicitud de clonación de voz. Sin embargo, su uso sigue siendo ilimitado por ahora.

Lo hemos probado

Cuando nos registramos en la plataforma, se nos concede acceso a una serie de herramientas. En primer lugar, encontraremos el sencillo sintetizador de voz que nos permite convertir textos en archivos de sonido usando, en principio, voces predefinidas en inglés estadounidense.

Sin embargo, si hacemos uso de la función de 'Voice Cloning', podremos subir a la plataforma un audio con una grabación de voz ("debe durar más de 1 minuto y no contener ruido de fondo", aclara la web), que nos permitirá crear una voz personalizada desde la que podremos volver al sintetizador y crear un audio basado en nuestra voz... o en la de cualquiera.

Paso 1 de la clonación de voz

Paso 2

Eso sí: el servicio está, por ahora, optimizado para el acento inglés estadounidense; de modo que es posible que, al generar el audio, no te termines de reconocer en el archivo resultante.

Los clásicos nunca mueren. Aunque suena horrible en estadounidense, dejadme que os lo diga.

Ese ha sido nuestro caso, tras generar una voz personalizada basada en la de un servidor: la lectura del Quijote en perfecto acento de Kansas (estado arriba, estado abajo) no ha terminado de sonarme 'muy yo', pero los usuarios estadounidenses aseguran no sufrir este problema.

La cuenta gratuita sólo permite crear hasta cinco voces personalizadas y sintetizar a audio 10.000 caracteres de texto al mes, además, los audios resultantes quedan sujetos a una licencia no comercial. Existen, a partir de ahí, varias opciones de pago, siendo la más barata de 22 dólares mensuales.

Imagen | Basada en original de Jason Rosewell en Unsplash

En Genbeta | Cómo crear imágenes y pósters con un estilo a lo Disney Pixar

Ver todos los comentarios en https://www.genbeta.com

VER 7 Comentarios

Portada de Genbeta

Esta inteligencia artificial que permite clonar tu voz (y cualquiera) está llenando Internet de famosos diciendo burradas: así se usa

La inteligencia artificial no va a dejar ningún área sin revolución

Hoy, suplantación de identidad

Que alguien ponga orden aquí

Lo hemos probado