Los últimos dos años han sido una auténtica locura en cuanto a la creación de proyectos relacionados con inteligencia artificial. El chatbot de OpenAI dio el pistoletazo de salida, y ahora su buscador basado en IA llega a España. Entre ambos eventos hemos visto lanzamientos de empresas nuevas y, sobre todo, una carrera entre los gigantes de la industria por no quedarse atrás.
Pero parece que los resultados tardan más de lo que esperaríamos. Alexa se supone que iba a tener una versión de pago que usaría IA, pero un año después de su presentación aún no se ha podido ver fuera de sus laboratorios. Google también ha dado varios bandazos, con la creación de Bard primero y de Gemini después.
Este último parece que será el asistente definitivo, con una marca reconocible para el gran público, que sustituirá a su anterior asistente, uno que no funcionaba mal, pero que carecía de carisma. Incluso hemos visto ya cómo serán los nuevos comandos de activación. Pero aún le queda mucho por mejorar.
Aplicaciones conectadas
El segundo problema es más importante. La conexión de Gemini con otras aplicaciones se realiza mediante las extensiones. Este nuevo ajuste permite decidir a qué tiene acceso el asistente desde nuestro teléfono. El problema es que aún hay muchas aplicaciones que no se pueden controlar desde el mismo.
Hacer la lista de la compra ha sido un problema durante meses por culpa de que la integración con Google Keep no estaba presente. Abrir Spotify y escuchar música ha sido otro inconveniente para muchos usuarios durante también mucho tiempo. Es cierto que la compañía aún da la opción de usar el antiguo asistente de Google en los smartphones, pero es raro que tengamos Gemini disponible, pero sin acabar.
Mayor velocidad
Usar el asistente de Google es tedioso si sabemos cómo funciona Alexa. La velocidad de ejecución de las tareas del asistente de Amazon es muchísimo mayor que en el caos de Google. Y el problema es que esto no se ha mejorado con Gemini. Quizás es por cómo se han diseñado los protocolos de interconexión con los servidores.
Para tareas rutinarias podemos pensar que da igual que tarde en encender una luz dos segundos en vez de uno, pero si se usan muchos comandos esa sensación de lentitud permea, y hace que Amazon tenga un buen argumento de venta del que Google carece. Lo mismo pasa con la respuesta desde un altavoz al que no le hemos hablado si tenemos varios. Debería responder siempre desde el que esté más cerca.
Uso en altavoces inteligentes
Y hablando de altavoces inteligentes, Google debería ponerse las pilas para dotar de inteligencia artificial a sus altavoces inteligentes y sus pantallas. Seguramente esto acabe siendo parte de una de las versiones de pago más costosas de Google One, y no tendremos Gemini en todos los altavoces por defecto, pero aún así es raro que aún no podamos usar el nuevo asistente más allá de los móviles y tablets.
Es más, podría ser un argumento de venta diferenciador con respecto a Amazon, que lleva cierto retraso en este aspecto al parecer por los problemas de su nueva versión de Alexa con IA con el control domótico de la casa, que es una de las funciones estrellas. De cualquier forma, el hardware no debería ser un factor limitante, ya que Gemini no se ejecuta en los altavoces, sino en los servidores de Google.
Integración con Gemini Live
La competencia de Google en el terreno de los asistentes de voz es grande. Está Alexa, por parte de Amazon, y también ChatGPT, que tiene una opción de voz muy avanzada. Incluso Samsung parece que traerá el nuevo Bixby a España. Pero hay una función que sorprende mucho en Gemini y que, pese a que se puede usar en nuestro país, poca gente conoce: Gemini Live.
Este modo conversacional del asistente permite hablar sin tener que usar continuamente el comando de activación, e incluso nos permite interrumpir sin que eso nos obligue a empezar de nuevo. Tener algo así integrado por defecto en vez de activar un modo aparte sería una mejor notable. Pero es igualmente importante que la gente sea consciente de que puede usarlo.
Uno de los mayores fallos de Gemini es su poca publicidad. Google no presume de lo que puede hacer, y son muchas las personas que no usaban el asistente de voz y que ahora no usan Gemini. Un simple gesto como hacer que el botón del widget de búsqueda active Gemini en vez de la búsqueda por voz podría catapultar el uso del nuevo asistente de Google, que presuponemos que es lo que busca la compañía.
Más voces
Para que el nuevo asistente sea un elemento clave en la vida diaria de las personas Google podría ofrecer más que las dos voces que tiene ahora disponibles. Esto permitiría que cada usuario tuviera una interacción con las voces que más le gustaran, relajaran o incentivaran. Es algo que tiene en la versión Live pero no a nivel global.
Incluso sería viable crear esas nuevas voces con inteligencia artificial, o monetizarlas, como hacen las desarrolladoras de videojuegos con los elementos estéticos. El cambio de voz podría ser una opción de pago, porque no obligaría al usuario a pasar por caja, pero le permitiría hacerlo a cambio de tener una experiencia más personalizada.
E incluso si no se permite una gran personalización con una decena de voces, hay que tener cuidado cuando se cambie una. Actualmente la voz de los asistentes inteligentes es realmente plana. Pareciera que la ha grabado Raúl Llorens, el actor de doblaje de Chris Evans, interpretando a un personaje que está siendo controlado mentalmente. En un aparato en el que el único método de entrada y salida de información es la voz, hay que cuidarla más.