2023 ha sido, sin duda, el año de la inteligencia artificial. Tras un tiempo sin una tecnología verdaderamente disrruptiva, los chatbots y los generadores de imágenes, entre otras herramientas, han supuesto un cambio en el día a día de muchas personas, sobre todo a nivel laboral. Pero eso no quiere decir que la IA no llegue a los aspectos más lúdicos.
Las firmas más importantes de la tecnología se han subido sin dudarlo al carro, con Microsoft como la mejor posicionada, al haber invertido rápidamente en Open AI. También Amazon anunció que llevaría la inteligencia artificial a su asistente de voz, Alexa, aunque por el momento no se ha podido probar. Por último, Google. La empresa de Mountain View ha tardado más que los demás en ofrecer productos, pero una vez ha código carrerilla ha empezado a abrumarnos con chatbots como Bard, con integraciones en móviles como los S24 o los Pixel 8 y a avanzar todo lo que pretende integrar en su suite ofimática, Gmail, etc.
Ante la ofensiva de sus competidores en OpenAI no se han quedado de brazos cruzados y han lanzado todo tipo de mejoras tanto para su modelo de texto, ChatGPT, como para el de imagen, Dall-E 3, que ahora es mucho mejor de lo que vimos en las dos primeras iteraciones. Una de las últimas novedades ha sido la de poder usar Chat GPT por voz en cualquier móvil Android, simplemente instalando la aplicación y realizando una breve configuración.
Soy un usuario muy intensivo de los asistentes de voz. En mi día a día convivo con más de 15 altavoces inteligentes en casa, tanto de Amazon como de Google. Raro es el día que no ejecuto entre 5 y 10 comandos o realizo preguntas, aunque curiosamente no los suelo usar demasiado en el smartphone. Así, he estado unos días utilizando la versión de voz de ChatGPT, para ver si era un sustituto de esos dos asistentes personales, y la respuesta no ha sido la esperada.
Configurando ChatGPT por voz
El uso de ChatGPT ha sido, mayormente, a través de su página web, aunque han surgido formas de usarlo en WhatsApp y en otras aplicaciones, a través de su API. El uso es con lenguaje natural, aunque siempre hay algunos trucos para que los resultados sean lo más óptimos posibles. Hace unas semanas OpenAI permitió a todos los usuarios de este chatbot usarlo mediante comandos de voz.
La configuración de esta función en un móvil es muy sencilla. Hay que instalar la app de ChatGPT en la Google Play Store y luego configurar el acceso directo en la zona de notificaciones, junto a los botones de Wifi o bluetooth. Para ello hay que seguir estos pasos
- Abrir el panel de notificaciones con un gesto hacia abajo.
- Si no se ha expandido por completo se vuelve a deslizar, hasta que aparezca el icono de edición del panel, normalmente, con forma de lápiz.
- Se pulsa en el lápiz.
- Se edita la interfaz correspondiente.
- Se busca el icono de ChatGPT de la parte inferior y se arrastra a la parte superior.
- Se pulsa en Hecho o Guardar, según el móvil.
Hablando con un amigo
Los asistentes de voz se usan, mayormente, para dos cosas. Puedes preguntarle datos o pedirles que te cuenten un chiste, básicamente para entretenerte mientras cocinas, realizas alguna tarea en casa, etc. La otra función es controlar diferentes dispositivos y aplicaciones, desde la que reproduce la música hasta la que controla el televisor.
Esta parte domótica, por así llamarla, es la que no está aún disponible en ChatGPT, al no tener una integración fuerte con las plataformas como Google Home, Alexa o Home Assistant. Es por eso por lo que no he podido sustituir los asistentes de voz en este sentido, ChatGPT no puede controlar la freidora de aire, la puerta del garaje, las luces o decirme si está la alarma de la casa activa.
Lo que sí que ha sustituido, y con creces, es la primera función, la de entretener. Mantener una conversación con ChatGPT es mucho más dinámico y cómodo que hacerlo con cualquiera de los asistentes de voz que teníamos hasta ahora. El lenguaje natural lo entiende perfectamente, y responde de la misma manera. Es cierto que en ocasiones se equivoca, pero no es que Alexa precisamenre sea la adalid de la precisión.
Un buen ejemplo de esto es que, cuando se arranca por primera vez el sistema de sonido del chatbot, por defecto el lenguaje que usa es el inglés. Como no hay ningún tipo de configuración o botones, le pregunté, en español, si sabía hablar este idioma. La respuesta fue rápida, con un "Sí, puedo hablar en español". Es cierto que la síntesis de voz es mejorable, y parecía una mujer anglosajona hablando mi idioma pero con un fuerte acento. Aún así, era plenamente usable.
Sin embargo, la fluidez del habla, la manera en la que reacciona a lo que has dicho y lo similar que es en la coversación con una persona, hace que interactuar con ChatGPT por voz sea más parecido a tener una conversación con un amigo que hablar con uno de los asistentes de voz que conocíamos hasta ahora. Hay un detalle que ayuda, y es que la pantalla del móvil se atenúa, pero se sigue pudiendo mantener la conversación, por lo que parece que estamos en una llamada con el manos libres del móvil puesto.
Sólo hay pequeñas indicaciones sonoras, como un pequeño clip, que permiten saber cuándo has de hablar tú y cuándo está respondiendo el sistema, porque no es viable interrumpirlo, al menos por el momento. Con todo, la experiencia ha sido realmente satisfactoria, aunque con un enfoque muy diferente al que he usado ChatGPT en el ordenador, momento en el que lo uso para tareas laborales, no de ocio, como he hecho con el chat de voz en el móvil.
Ahora mismo parece que Google y Amazon van a intentar convertir a sus asistentes de voz en chatbots avanzados con inteligencia artificial a la vez que Open AI podría convertir a Chat GPT en un asistente integrado con la domótica y los ecosistemas móviles. Para ello ha impulsado su propia tienda, pero aún no está listo para sustituir a los asistentes que controlan la casa. Pero eso podría cambiar.