
Fotomontaje de Gemini Live de Google El Androide Libre
Google actualiza Gemini Live y 'charlar' con su IA pasa al siguiente nivel en tu móvil: ya es más dinámica e interactiva
Gemini Live ya está disponible desde hace meses en España y permite usar la voz para interactuar con el chatbot de inteligencia artificial generativa.
Más información: Gemini, ante su momento clave: el nuevo corazón de Google marca el futuro de la compañía más allá de las búsquedas
Gemini Live es la respuesta de Google al modo de voz avanzado de ChatGPT y así ofrecer al usuario otra alternativa a esa experiencia que se basa en charlar animosamente con una inteligencia artificial, que en la solución de OpenAI está limitada al pago de una suscripción mensual, ya que de forma gratuita son pocos minutos los que se ofrecen. Ahora Google quiere que charlar con su IA sea algo más interactivo, dinámico y multimodal.
Gemini Live, disponible a través de la app de Android, ahora va a recibir una actualización de su modelo de lenguaje mayor que va a generar que las conversaciones den lugar a otra experiencia más satisfactoria para el usuario.
Lo que tratan tanto Gemini Live como el modelo de voz avanzado de ChatGPT es producir una experiencia natural como si se estuviera hablando con una persona. Es el objetivo, y lo que justamente demostró OpenAI cuando el año pasado en mayo, una semana antes del Google I/O 2024 (ya hay fecha para la edición de 2025), dejó estupefacto a medio planeta con las capacidades oratorias de su IA.
El gigante tecnológico de las búsquedas online ha enviado un correo a los usuarios de Live en el que se puede leer "comenzando a desplegar actualizaciones a Gemini". El último modelo, del que no se ha dado nombre, es el encargado de que Gemini Live entienda múltiples acentos, dialectos e idiomas durante la conversación, aparte de que también puede ayudar en traducciones.
Justamente la semana pasada Google lanzó Gemini 2.0, e introdujo el Multimodal Live API para desarrolladores que entre sus virtudes se encuentra la habilidad de procesar texto, audio y vídeo al mismo tiempo que genera texto y audio. Esta gran capaciad se va a introducir en Gemini Live para pasar al siguiente nivel en la interacción.
Building with Gemini 2.0: Multimodal live streaming
El email también lo han recibido los usuarios de Gemini Live en España y en el mismo se puede leer como Google tiene ideado introducir las funciones de pantalla compartida y stream de vídeo en directo en Live a través de la app de Gemini.
Hay un punto importante a tener en cuenta en toda esta experiencia, y es que para mejorarla, la idea de Gogole es que Gemini deje registrado el audio, vídeo y las pantallas compartidas en Gemini Apps Activity. Y es que actualmente Gemini Live solamente almacena y procesa las transcripciones de los chats de Live, así que en este caso ampliaría sus aptitudes.

El Androide Libre
Otro de los pasos dados por Google en la carrera que mantiene con OpenAI y ese objetivo de no dejar que los creadores de ChatGPT se alejen, y es que cada uno, cada semana, casi está implementando un nuevo modelo, una actualización a sus apps o el estreno de cualquier característica que pueda poner en valor su chatbot de inteligencia artificial generativa.