Como si de dos púgiles luchando en un cuadrilátero se tratara, OpenAI ayer lanzó un golpe directo a uno de los servicios en los que Google lleva muchos años trabajando, Assistant. Se ha revuelto a las horas de que se celebre el I/O 2024, y con un vídeo en el que muestra las habilidades para el habla de Gemini y su capacidad para 'entender qué ve'.
El movimiento de pies de OpenAI le ha pillado en parte por sorpresa, y se puede decir que Google no se esperaba que el golpe viniera desde una IA conversacional que expresa emociones y que se parece a la de la película Her, ya que la semana pasada desde Reuters se filtró que la compañía propietaria de GPT-4o tenía preparado un buscador con ChatGPT. Y ahora echando la vista atrás, se dibuja fácilmente la risa irónica de Bruce Willis, el actor estadounidense, en muchas de sus películas cuando se observa todo lo sucedido.
Todavía queda por conocer los siguientes planos de este primer episodio de lo que se antoja como una gran serie de TV de luchas épicas protagonizada por un gigante tecnológico y uno que va camino de serlo si es capaz de devolver los golpes continuos que hoy le tocará recibir por parte de Google en el I/O 2024, y los siguientes que le queda por sufrir.
Se desconoce totalmente qué sucederá esta tarde cuando Sundar Pichai, CEO de Google, entre en escena en la keynote, pero el vídeo que mostró el gigante tecnológico desde su cuenta de X (antes Twitter) da pistas sobre lo que se espera de Gemini. Si OpenAI ha denominado a GPT-4o como 'Omnimodel', Gemini es ahora una inteligencia artificial multimodal.
Lo que significa que puede incorporar texto, audio e imagen en la interacción con el usuario. Bastante similar a lo visto en una de las últimas actualizaciones de las Ray Ban de Meta, en el vídeo se puede observar como se tiene una conversación con Gemini mientras describe todo 'lo que ve' a través de la cámara del móvil. Expresa emociones, aunque no de una manera tan fluida como ChatGPT en las distintas demostraciones que se mostraron ayer.
El golpe de esta tarde de Google ha de ser certero y ha de llegar Gemini con la capacidad de usar la voz en una demostración o una actualización inminente. Es difícil que pueda suceder, aunque nunca se sabe, ya que en poco más de un año el gigante tecnológico ha sido raudo en recuperar terreno frente a OpenAI y su ChatGPT, que siempre se adelanta con ese movimiento de pies tan especial que da en el cuadrilátero del futuro de la IA.