MADRID, 13 (Portaltic/EP)
Google ha distribuido en su aplicación de teclado propia Gboard un nuevo sistema de reconocimiento de habla y de escritura por voz basado en mecanismos de Inteligencia Artificial (IA), que soluciona los problemas de latencia y que funciona desde dispositivos sin conexión.
La nueva tecnología de Gboard se basa en la introducción de redes neuronales recurrentes (RNN, por sus siglas en inglés), que funcionan de extremo a extremo para adaptarse al reconocimiento del habla desde el propio dispositivo, según ha explicado Johan Schalkwyk, miembro del equipo de voz de Google, en un comunicado.
La IA de Gboard está potenciada por un transductor neuronal lo suficientemente compacto como para instalarse en un dispositivo móvil, como reveló el equipo de Google en una investigación reciente sobre la materia.
A través de esta tecnología, el reconocimiento de habla "siempre está disponible", según Schalkwyk, incluso cuando el dispositivo está sin conexión, lo que permite también eliminar la latencia de red y los fallos relacionados. El nuevo modelo de Google funciona por caracteres, detectando las palabras pronunciadas por el usuario en tiempo real.
Google ha explicado que su nuevo transductor neuronal recurrente reduce la cantidad de datos que necesita para funcionar, pasando de 2GB a 80MB, gracias a un uso más inteligente de los parámetros y de la biblioteca TensorFlow.
De esta manera, en Gboard ya no resulta necesario utilizar la conexión a internet para acceder a grandes cantidades de datos, y este sistema funciona "más rápido que la velocidad real de discurso en un solo núcleo", según Google.
La nueva IA de Google ya está disponible en todos los 'smartphones' Pixel de la compañía, por el momento solo en su versión en inglés de Estados Unidos.