Si te gusta la lectura gratis, seguro que ya conoces el Proyecto Gutenberg, que tiene a su disposición miles de libros electrónicos, principalmente de dominio público. Pues bien, si entras a su sección de audiolibros, vas a encontrar 5.000 nuevas obras disponibles para tus oídos. Pero estas novedades del Proyecto Gutenberg tienen una particularidad: no los ha leído persona, sino una inteligencia artificial.
Los retos de crear un audiolibro
Hacer un audiolibro a la vieja usanza requiere bastante tiempo y por supuesto, abonar a la persona que lee por los servicios prestados. Y todo ello sin contar con la edición y la publicación. Como resultado, en algunos casos no sale a cuenta, lo que implica que algunas obras antiguas se queden fuera de este práctico formato. Así que esta adaptación del texto escrito a la voz llevaba tiempo en la lista de deseos de esta iniciativa, pero no era una empresa fácil ni automatizando el proceso.
Hay un problema adicional: el archivo del Proyecto Gutenberg es heterogéneo, coexistiendo diferentes fuentes, formatos y se emplean procesos de reconocimiento óptico con bastantes errores, lo que requiere de una corrección y homogeneización gracias a la mano humana. Pero incluso así, se corre el riesgo de que una lectura a máquina automatizada caiga en detenerse en notas a pie de página, números, índices y otros elementos secundarios.
Pero el Proyecto Gutenberg en colaboración con el Instituto Tecnológico de Massachussets y Microsoft se han propuesto remediarlo con una red neuronal con inteligencia artificial, como detallan en su paper. Como explica Mark Hamilton, una de las cabezas de este proyecto, 'lo más complicado fue extraer el texto adecuado para leerlo en voz alta'. Además lo hace con una voz natural que pasa por humana.
Primero, "los fáciles", luego todos los demás y en varios idiomas
Grosso modo, el diseño del sistema comenzó por recorrer el archivo e identificar aquellas obras con formato similar para seleccionar los más adecuados para ser leídos de forma automática. Tras el primer lote, están trabajando para elaborar un sistema general que permita la lectura de 60.000 libros.
En cuanto a la narración, emplean la combinación de un sistema automático de inferencia de emociones para cambiar la voz y tono de lectura de forma dinámica basándose en el contexto mediante recursos de aprendizaje automático y discursos sintéticos.
Además de tratar de generalizar este procedimiento para convertir el grueso de la biblioteca, la idea próximamente es lanzar una nueva versión para que cualquiera pueda leer un par de líneas y que la red neuronal convierta el texto de una obra en audio con nuestra propia voz.
Puedes escuchar los resultados de la lectura con inteligencia artificial en esta página web, así como en Spotify, Apple Podcasts, Google Podcasts, e Internet Archive.. Por el momento todos ellos están en inglés, pero pronto llegarán en otros idiomas. Asimismo, puedes descargar el software usado desde GitHub.
Portada | Generada con Bing
En Genbeta | Dónde descargar gratis los libros que han entrado al dominio público en 2023
Ver 2 comentarios