Los auriculares son uno de los dispositivos electrónicos que más han evolucionado en los últimos años, tanto en diseño como en tecnología. Hace tiempo que en España dijimos adiós a los cables gracias a las conexiones inalámbricas, pero las últimas mejoras van desde añadir un purificador de aire hasta incluir drivers SMC para lograr un sonido HiFi. Sin embargo, los mayores avances parecen centrarse en la cancelación de ruido activa (ANC, por sus siglas en inglés), que permite un aislamiento casi total del exterior, sobre todo en modelos de alta gama como los AirPods Pro o los Bose QuietComfort Earbuds II.
La cancelación de ruido es toda una bendición en lugares ruidosos, como el transporte público, pero tiene un problema: puedes perderte algo importante de lo que está sucediendo en tu entorno. Para evitarlo existen modos de transparencia, pero tampoco son la panacea: dejan pasar todos los sonidos y al final acabas subiendo más el volumen de la música o tu pódcast favorito para poder oírlo bien. Para añadir nuevas capacidades a los auriculares, un equipo de investigadores de la Universidad de Washington ha desarrollado un nuevo algoritmo con IA que te permite elegir qué sonidos se filtran a través de los auriculares cuando la cancelación de ruido está activada.
El avance, al que han llamado "audición semántica", se define como "una nueva capacidad de los dispositivos audibles que les permite, en tiempo real, centrarse en determinados sonidos del mundo real o ignorarlos, al tiempo que conservan las señales espaciales". En otras palabras, una cancelación de ruido a la carta que te permite aislarte del mundo sin peligro en todo tipo de situaciones. Si llora un bebé mientras estás pasando la aspiradora o corres por la calle y se aproxima un coche que no has visto, podrás oír esos sonidos gracias a una suerte de escenas preconfiguradas.
Bloqueo a la carta
Para entender bien lo que propone Shyam Gollakota, autor principal del estudio publicado en ACM Digital Library y profesor de ingeniería informática en la Universidad de Washington, primero hay que comprender cuáles son los principios físicos de la cancelación de ruido.
Por un lado está la cancelación de ruido pasiva, que se consigue gracias al diseño acústico de los auriculares, ya sean de diadema o in-ear. Es algo que depende principalmente de los materiales de fabricación y de la forma en que sellan o cubren el oído, y su máxima expresión son los que utilizan los obreros de la construcción o los trabajadores de las fábricas en entornos con niveles de ruido peligrosos para la salud.
La ANC, en cambio, utiliza las interferencias de ondas para suprimir casi todos (es prácticamente imposible conseguir un 100% de cancelación) los ruidos procedentes del exterior. Y es que los sonidos que escuchamos son ondas de baja frecuencia, siempre por debajo de los 20 KHz. Gracias a los micrófonos incluidos en los auriculares con cancelación de ruido activa y a un software específico, se pueden crear ondas de sonido artificial capaces de compensar o contrarrestar sonidos concretos, utilizando un fenómeno llamado interferencia destructiva de ondas.
De esta manera, los micrófonos se encargan de recoger el ruido procedente del exterior, para que este sea procesado por los auriculares y generar una señal exactamente igual pero de fase opuesta. Así se produce el efecto de cancelación de ruido activa, permitiendo escuchar la música sin oír nada de lo que sucede a tu alrededor.
Las principales aportaciones técnicas del sistema desarrollado por Gollakota y su equipo son "una red neuronal que puede lograr la extracción binaural del sonido objetivo en presencia de sonidos interferentes y ruido de fondo" y "una metodología de entrenamiento que permite generalizar nuestro sistema al uso en el mundo real". Es decir, que se puede seguir entrenando la IA para conseguir más tipos de sonidos y mejorar su precisión.
Para lograr su propósito, la solución de los científicos de la Universidad de Washington pasa por transmitir el audio capturado por los micrófonos de los auriculares a un smartphone, que es el encargado de cancelar todos los sonidos ambientales. La novedad es que, a través de comandos de voz o de una app, cada usuario puede seleccionar qué sonidos quiere incluir de entre 20 clases distintas, desde sirenas hasta llantos de bebé, pasando por el habla humana, los gorjeos de los pájaros o los maullidos de un gato. Una vez seleccionados, sólo se reproducirán esos sonidos a través de los auriculares.
"Entender cómo suena un pájaro y extraerlo del resto de sonidos del entorno requiere una inteligencia en tiempo real que los actuales auriculares con cancelación de ruido no han conseguido", explica el propio Gollakota en un comunicado de prensa. Para lograrlo, él y sus compañeros se enfrentaron a un complejo desafío: decodificar y volver a codificar toda la información en tiempo récord y respetando el sentido espacial.
"El reto es que los sonidos que oyen los usuarios de los auriculares deben sincronizarse con sus sentidos visuales. No puedes oír la voz de alguien dos segundos después de que te hable. Esto significa que los algoritmos neuronales deben procesar los sonidos en menos de una centésima de segundo". Según las pruebas realizadas, Gollakota y su equipo han conseguido un tiempo de ejecución de 6,56 ms, prácticamente inapreciable para los sentidos humanos.
Conexión por cable
Para lograr esa velocidad récord, en lugar de utilizar servidores en la nube más fiables, el sistema de audición semántica se conecta directamente por cable al smartphone, que es el encargado de realizar todas las operaciones. Además, para que los usuarios sigan experimentando los sonidos de su entorno con fidelidad, el sistema necesita mantener estos retardos y otras señales espaciales, ya que los sonidos procedentes de distintas direcciones entran en nuestros oídos en momentos diferentes.
Para poner a prueba el sistema, los científicos lo han utilizado conectado a auriculares comerciales (en varias fotos aparecen modelos de la marca JBL) en distintos entornos cotidianos, como oficinas, calles o parques. En todos los casos consiguieron su objetivo: cancelar los ruidos, salvo los seleccionados por los usuarios.
[El algoritmo que ayudará a viajar en coche con niños: burbujas de sonido delimitadas a cada asiento]
La última evaluación corrió a cargo de 22 voluntarios a los que se pidió valorar la calidad de salida de audio del sistema para el sonido marcado como objetivo. De media, la calidad mejoraba en comparación con la grabación original, y en la propia página web del proyecto hay numerosos ejemplos en los que se pueden comparar ambas grabaciones.
Los fallos se concentraron en los casos en los que los sonidos compartían muchas propiedades, "como la música vocal y el habla humana", señalan. Sin embargo, los investigadores están convencidos de que entrenando los algoritmos con más datos procedentes del mundo real se podrán ofrecer mejores resultados. De momento no deja de ser un prototipo de concepto, pero Gollakota y sus compañeros confían en las posibilidades de desarrollarlo como un producto comercial a lo largo de los próximos años.
También te puede interesar:
- Así son los nuevos auriculares inalámbricos de Sony: gaming, audio espacial y gran autonomía
- Bose renueva sus tres auriculares de alta gama y se vuelca en mejorar el audio espacial
- Sharon Peng (Harman): "El deseo por los dispositivos de audio de alta calidad nunca ha sido tan alto"
- Música real con instrumentos imposibles: el software que desafía el límite del sonido