Cuando te llega un mensaje de texto o una imagen a Telegram, WhatsApp o cualquier otra plataforma de mensajería instantánea, normalmente basta un vistazo para ver de qué se trata. Es rápido, unos segundos... no requiere más.
Sin embargo, cuando lo que nos llega es una audio, la cosa cambia. Recibir una nota de voz normalmente requiere de un entorno favorable para pararte a escuchar algo y una dosis de atención extra. Circunstancias que en el día a día de muchas personas no se dan. Sobre todo cuando se está en el trabajo o en clase. Los mensajes de audio terminan quedando para más adelante.
Para evitarnos todo eso, o si sencillamente te has cansado de escuchar audios y a pesar de ello quieres seguir sabiendo qué te dicen tus amigos, en Telegram disponemos de Voicy. Un bot que convierte a texto todos los mensajes de voz, archivos de audio y mensajes de video que recibe.
Voicy, un bot de Telegram que transcribe notas de voz y mensajes en vídeo
Voicy es una creación del desarrollados y emprendedor Nikita Kolmogorov, que un buen día se cansó de invertir parte de su tiempo en escuchar audios y decidió dedicarlo, a lo largo de un par de noches, a construir este bot capaz de convertirlos en audio.
Para comenzar a utilizarlo solamente debemos acceder a su web, voicybot.com, y pulsar el botón Add to Telegram. Como con cualquier otro bot, se nos abrirá la aplicación y podremos empezar a utilizarlo. En el caso de Voicy, primeramente introduciremos el comando /star y, a continuación, navegaremos entre los más de 80 idiomas y dialectos con los que es compatible hasta encontrar el nuestro.
A partir de aquí, su funcionamiento es radicalmente sencillo. Cuando recibamos un audio y queramos convertirlo a texto, se lo reenviamos y, en segundos, lo convertirá. Así de simple. No obstante, si donde se suelen acumular los audios es en un canal o un grupo, podemos añadirlo e invocándolo se encargará de transcribir las notas de voz. Funciona realmente bien.
Inicialmente, Voicy solamente admitía mensajes de voz, pero ha medida que fue creciendo su uso Kolmogorov incorporó la posibilidad de que también transcriba lo que se dice en archivos de audio, como los que le podemos compartir desde WhatsApp, y en vídeos.
El bot utiliza para funcionar dos motores de reconocimiento de voz, wit.ai y Google Speech. El primero es el que se usa por defecto porque es completamente gratuito, mientras que el segundo solamente trascribe un minuto de forma gratuita, por lo que su uso solamente se recomienda para personas que quieran usarlo específicamente por alguna razón.
Voicy es de código abierto y su código está disponible en GitHub para cualquiera que desee aportar.
Ver 11 comentarios