Reconocimiento y control de voz en Windows Phone, iOS y Android: ¿quién lo hace mejor?

Reconocimiento y control de voz en Windows Phone, iOS y Android: ¿quién lo hace mejor?
Facebook Twitter Flipboard E-mail

Una de las características que menos solemos tomar en cuenta de los móviles es el reconocimiento de voz. Normalmente la ignoramos porque no funciona bien, no es fácil de usar o porque usarla cuando hay gente alrededor resulta demasiado ridículo.

Sin embargo, el control por voz puede llegar a ser muy útil en muchos casos, y ahorrarnos bastante tiempo. Android, iOS y Windows Phone implementan el control por voz de serie, cada uno a su manera. En este post vamos a ver cómo usarlo en cada sistema, y cuál es que más fácil nos lo pone.


Un vistazo a…
Android 12 Preview - Cómo instalar paso a paso

Windows Phone, el que mejor lo hace (y con Mango todavía más)

Control de voz en Windows Phone

En WIndows Phone podemos activar el reconocimiento de voz manteniendo pulsada la tecla “Windows” desde cualquier estado del teléfono (incluso bloqueado si no tenéis contraseña). Al hacerlo aparece un pequeño popup en la parte superior de la pantalla que nos da algunos ejemplos de comandos.

La variedad de comandos no es muy grande. De hecho, sólo podemos hacer dos cosas: llamar y abrir aplicaciones. Ahora os preguntaréis que cómo puedo decir que Windows Phone es el que mejor lo hace si sólo tiene dos míseros comandos.

Lo mejor de Windows Phone es que el reconocimiento de voz es rápido y efectivo, muy efectivo. Hace poco pero lo hace muy bien. Llamar a alguien es tan simple como decir “Llamar a X al móvil/casa/trabajo”. Si el teléfono duda a qué número llamar (por ejemplo, porque hemos dicho un nombre que aparece varias veces en la agenda, o si no hemos especificado si queremos llamar a casa o al móvil), simplemente nos pregunta.

Para abrir aplicaciones sólo hay que decir “Abrir X”, y la aplicación se abre. No hace falta que sea una aplicación preinstalada del teléfono: también funciona con aplicaciones descargadas del Marketplace con nombres más extraños, como Angry Birds o IM+ (y la pronunciación da igual: he probado pronunciando Angry Birds tanto en inglés como en spánglish y lo reconoce a la perfección, y lo mismo con las diferentes formas de pronunciar IM+ que se me han ocurrido).

Lo mejor de todo es que el reconocimiento de voz es casi perfecto. Reconoce a la perfección todo lo que le digamos, y sobre todo, no comete errores. Si no es capaz de reconocer lo que has dicho simplemente no hace nada, cuando en otros sistemas lo normal es que haga lo que le dé la gana.

Además, la actualización Mango de Windows Phone traerá un nuevo comando más al reconocimiento
de voz: mensajes. El teléfono nos hablará cuando recibamos un mensaje, nos lo leerá si queremos y podremos dictar la respuesta. Parece poca cosa, pero creo que realmente puede ser muy útil.

En definitiva, los que mejor han trabajado el tema de reconocimiento de voz han sido los de Microsoft. Se han centrado en pocos comandos que resulten útiles al usuario y que el teléfono reconozca sin ningún problema, haciendo el control por voz de Windows Phone realmente atractivo.

iOS: muchos comandos pero mal funcionamiento

Control de voz en iOS

El reconocimiento de voz de iOS es el más completo de todos en cuanto a comandos. Podemos llamar, ya sea llamada normal o Facetime, y controlar el reproductor de música, todo con comandos de voz (tenéis la lista completa de comandos en Applesfera).

Para usarlo, simplemente hay que mantener pulsado el botón central, esperar a que aparezca la pantalla y decir el comando.

El problema de iOS es que el motor de reconocimiento funciona bastante mal. Pocas veces he logrado que reconozca lo que quería decir, y en muchos casos ha hecho lo que le ha dado la real gana y ha ejecutado comandos que no tenían nada que ver con lo que yo decía (por ejemplo, ha entendido “Aleatorio” como “Reproducir canciones de Queen”).

Y precisamente esta es una de las cosas que más desesperan cuando usas el control por voz, y que tanto Android como Windows Phone tienen más o menos resueltas: en Windows Phone si no te entiende te pide repetir, y Android te da varias opciones para que elijas la que más se acerca a lo que has dicho.

Además, iOS tiene un problema importante. Tanto Android como Windows Phone reconocen perfectamente cuándo dejas de hablar. iOS no, con lo que añade más ruido a los comandos y empeora más todavía los resultados.

En definitiva, o Apple se pone las pilas con el control por voz, o va a seguir siendo una característica bastante inútil de iOS.

Android: no hay comandos, sólo transcripción de voz

Reconocimiento de voz en Android

Android también incluye reconocimiento de voz, aunque en algunos casos necesitaréis descargar alguna aplicación adicional, como “Búsqueda por voz”. Como sólo ofrece transcripción, para usarlo simplemente hay que pulsar en el botón de micrófono que aparece cuando podamos dictar al teléfono.

La primera diferencia con iOS y Windows Phone es que no hay comandos para abrir aplicaciones o llamar a nadie. Sólo podemos hablar y el teléfono transcribe lo que decimos.

Esto sería útil a la hora de escribir mensajes o textos un poco largos, ya que hablar suele ser más cómodo que escribir mucho en los teclados de móvil. Pero por desgracia no lo es.

El reconocimiento de voz de Android es lento y, aunque no se puede decir que sea del todo inexacto tampoco es una maravilla.. Hay dos opciones para activarlo: usar la búsqueda por voz manteniendo pulsado el botón de Búsqueda del teléfono o transcribir la voz a texto pulsando el botón del micrófono en el teclado virtual.

Personalmente, el reconocimiento de voz de Android es el que menos me gusta. Una de las razones es que prefiero usar comandos de voz a dictar textos: en un texto transcrito tendrás que ir corrigiendo varias palabras mal reconocidas, y al final puede resultar más tedioso que escribirlo con el teclado virtual.

Además, el hecho de que sea lento y con fallos lo hace poco atractivo. Por lo menos para mí: en todo el tiempo que llevo usando Android apenas he usado el reconocimiento de voz por estas razones, aunque estoy seguro de que alguno de vosotros le saca bastante provecho.

En resumen: Windows Phone se lleva la palma

Después de haber visto detalladamente el control por voz en los tres sistemas móviles, creo que Windows Phone se lleva la palma. Es el que mejor funciona y, aunque no incluye demasiados comandos, la tecnología es muy madura y el reconocimiento es muy preciso. Es el único que usaría (y de hecho uso) de forma cotidiana y no sólo como una curiosidad del sistema.

iOS es el que peor reconoce la voz, desde mi punto de vista. Si mejorase este punto tendría gran parte de la batalla ganada ya que tiene un buen número de comandos. Y en cuanto a Android, aunque el motor de reconocimiento se salva, creo que deberían centrarse más en comandos que en transcripción de texto a voz: los primeros son mucho más útiles y fáciles de usar que lo segundo.

Conclusión adicional: el reconocimiento de voz es una tecnología marginada pero con mucho potencial

Después de haber estado probando bastante el reconocimiento de voz podemos sacar unas conclusiones sobre esta tecnología. El control por voz no es nada nuevo: lleva muchos años entre nosotros. Sin embargo nunca ha habido una implementación realmente buena y útil y que haya llegado al público general. Ha habido varias que sí, que, eran muy chulas en las presentaciones pero para el uso cotidiano no servían.

Gracias a esto, al final nos hemos formado una imagen del control por voz en nuestra mente como una tecnología muy chula pero poco útil, y que a veces puede resultar un poco ridícula (imaginaos a un hombre andando por la calle y gritando a su móvil que abra tal aplicación). El resultado es que se ha marginado al reconocimiento de voz, y casi no se le presta atención.

Sin embargo, si se implementa bien y se consigue que los comandos sean útiles, el control por voz puede llegar a ser muy interesante. Yo, que antes era un voz-escéptico, ahora uso el control de voz de Windows Phone siempre que llamo a alguien, y de hecho es una de las cosas que más echo de menos en otros teléfonos.

Creo que si la tecnología evoluciona bien podría convertirse en algo imprescindible en muchas situaciones. Por ejemplo, para llamar o enviar mensajes cuando conduces sin distraerte, o para poder controlar el teléfono sin sacarlo del bolsillo cuando vamos con auriculares. Vosotros qué opináis, ¿creéis que el reconocimiento de voz puede llegar a resultaros verdaderamente útil?

Imagen | Johan Larrson | Daquella Manera

Comentarios cerrados
Inicio