La apuesta de Google por la inteligencia artificial no ha parado desde que la compañía se dio cuenta de que OpenAI se le había adelantado con ChatGPT. El lanzamiento de Gemini y nuevos modelos de lenguaje ha conseguido reducir e incluso eliminar la ventaja que ChatGPT tenía, pero tal vez el enfrentamiento más interesante no está en 'chatbot', sino en las conversaciones de voz.
Como demostró GPT-4o, las conversaciones de voz son la siguiente frontera de la IA generativa; la posibilidad de poder hablar con nuestro móvil como si fuese una persona, con todo lo que ello conlleva. Es el siguiente paso de los asistentes personales como Google Assistant, que ya eran capaces de responder a nuestra voz pero que estaban limitados en la cantidad de cosas que podían hacer; y desde luego, no podían continuar la conversación como pueden hacer los modelos actuales.
Gemini Live es uno de estos modelos, aunque lamentablemente, hasta ahora no se comproba en español de primera mano, ya que estaba disponible sólo en inglés. Eso cambia a partir de hoy, según ha anunciado Google, con la compatibilidad de hasta 40 idiomas más, entre los que se incluye el español en varios países de latinoamérica.
De hecho, el español será uno de los primeros idiomas soportados por Gemini Live en varios países de latinoamérica, además del francés, alemán, portugués, e hindi; a lo largo de los días, los usuarios de la app de Gemini empezarán a tener acceso a Gemini Live para realizar conversaciones de voz con la IA. Las decenas de idiomas restantes tendrán que esperar varias semanas para lo mismo. Aunque inicialmente Gemini Live era exclusivo de los usuarios de los suscriptores de Google One AI Premium, posteriormente Google lo hizo gratuito para todos los usuarios.
Un detalle interesante es que la IA será capaz de cambiar entre dos idiomas de manera natural durante la conversación; es decir, que si hablamos dos idiomas de manera indistinta, como inglés y español, podemos hablar con Gemini Live con los dos y nos entenderá. Eso sí, para eso primero tendremos que entrar en la configuración de Gemini y añadir el segundo idioma que queramos usar.
Google también ha confirmado que está continuando el trabajo para integrar Gemini con el resto de apps, lo que debería aumentar las posibilidades de la IA. Usando las Extensiones, Gemini ya es capaz de obtener nuestros datos de apps como Gmail, Maps o YouTube, pero en las próximas semanas también será capaz de conectar con Calendar, Task y Keep. Eso permitirá, por ejemplo, pedir a la IA que nos haga un resumen de los eventos del día, o que nos actualice la lista de la compra, una vez que le demos permiso para acceder a nuestros datos.