Google patenta un sistema de «escucha activa» para identificar quién habla

Google patenta un sistema de «escucha activa» para identificar quién habla

Otros

Google patenta un sistema de "escucha activa" para identificar quién habla

24 septiembre, 2014 17:40

Google ha puesto mucho énfasis en el reconocimiento de voz tanto en Google Now como en otras opciones como Android Wear. Pero no han parado en mejorar estos servicios.

Ahora han mejorado el sistema de escucha activa, y con el comando Ok Google en todas las pantallas de búsqueda. Pero quizá no está todo dicho al respecto. Respecto a una patente del 4 de septiembre sobre detectar el final de una pregunta de usuario, podemos encontrar algunas de las cosas que Google está planeando en su escucha activa. En la patente describen cómo, a través de múltiples micrófonos para detectar la ubicación de las voces, podemos llegar por ejemplo a ignorar las voces procedentes de fuentes no deseadas.  Pero no queda la cosa ahí, sino que se habla sobre la captura de indicadores visuales.

El dispositivo de captura digital podría ser un grabador de vídeo, una cámara digital, una webcam…El dispositivo de captura visual captura imágenes y representa estas imágenes como una secuencia que podrían formar un vídeo.

Esto puede empezar en algunas de las características, como las que ya hemos visto en el Samsung Galaxy S5, que controlaba si estábamos mirando la pantalla o no. Pero eso es sólo el comienzo. De hecho, en la patente de Google, se podrían llegar a detectar deliberacciones y conversaciones con otras personas, por lo que el dispositivo podría incluso entrar en modo de escucha activa desactivado. ¡Esto puede asustar a más de uno!

Identificando a las personas

La patente de Google va mucho más allá, recogiendo todo tipo de información:

El analizar visual puede determinar el número de personas en un área, la identidad de las personas, los ángulos verticales y horizontales de las cabezas de la gente, así como el movimiento de los labios […]

Determinar la identidad de la persona que está hablando basado en el movimiento de los labios de las personas y las características acústicas de su voz […]

El sistema puede analizar datos de audio, visuales y almacenar información en un perfil de usuario […]

¿Qué empezáis a pensar ahora? ¿Se trata esto del comienzo de algo parecido a Skynet? ¿Será Google el ojo que todo lo ve? Seguro que mucha gente se pone en contra de este tipo de prácticas y tecnologías, pues creen que atentan contra la libertad de las personas y de nuestra propia privacidad, y posiblemente razón no les falte.

La privacidad, clave

En todo momento, Google ha dejado claro que estos ajustes serán opcionales, permitiendo al usuario elegir si desea o no que su información se almacene.  A pesar de todo esto, seguro que a Google se le presentarán muchas preocupaciones sobre la privacidad una vez que esta aplicación llegara. De hecho, ya hemos visto un ejemplo más o menos parecido en Microsoft, con su Xbox One y Kinect, el cual también estaba siempre a la escucha y observando. ¿A alguien le suena?

Y esta tecnología no tendría que quedarse en los dispositivos móviles. Podría llegar a PCs o cualquier tipo de dispositivo electrónico con los sensores de entrada necesarios. ¿Quizá Android TV, Android Auto y Android @ Home serían los siguientes? Es lo más lógico a pensar. Y así llegaríamos a un ecosistema donde todo nuestro entorno nos observa y estudia.

Por tanto sólo nos queda que decir, que si Google estuviera decidido a que este proyecto vea la luz, deberían preocuparse de que la puesta en práctica sea de una manera responsable y que tenga más que cuidado el aspecto de la privacidad. Aunque una pregunta clave es: ¿estamos preparados nosotros para estas tecnologías?

Via Phandroid