Nuestro acercamiento al abanico de posibilidades que abre la inteligencia artificial se parece mucho a cuando, en los primeros días de verano, nos atrevemos poco a poco en el bordillo de la piscina.
Primero, desconfiados, metemos el dedito del pie para ver cuán fría está el agua. Después, al ver que no es para tanto, nos atrevemos con el pie entero y antes de darnos cuenta, armados de valor (o de ego), nos estamos lanzando de cabeza a ese lugar que hasta hacía cinco minutos nos parecía completamente temible.
Podría decirse que este ha sido el proceder de la cadena norteamericana NBC, al decidir clonar la voz del ya legendario comentarista deportivo Al Michaels para generar mediante IA un reporte diario personalizado para el oyente durante los Juegos Olímpicos de París: probar las aguas y tirarse de cabeza en una zona en la que aún se hace pie.
Lo curioso es que todas las justificaciones empresariales parten de una misma premisa: queremos proporcionar la mejor experiencia para el cliente, ofrecerle lo mejorcito dentro de nuestras posibilidades.
Pero, como empedernida oyente de radio y persona que trabaja detrás de un micrófono, tengo mis reservas de que el cliente (que palabra tan mal escogida para describir a quien está al otro lado del altavoz) quiera esto, que el cliente quiera "una" voz.
El cliente quiere a la persona que hay detrás de esa voz. A esa imagen que uno se ha construido tras horas y horas de escucha, de entonaciones, de silencios sostenidos. El cliente quiere saber adivinar cuándo se le rasgará un poco por la emoción, cuándo y cómo entonará una noticia de última hora o un touchdown. Qué ingenio empleará para ello.
El cliente quiere la emoción que transita esa voz y que posteriormente queda depositada en sus entrañas. Pero esto sólo es posible, esa emoción sólo existe, porque sabemos que hay alguien de carne y hueso que nos está hablando a través de un micrófono. Porque sabemos que hay alguien al otro lado que nos acompaña.
Nadie se emociona escuchando a Siri, pero hay que tener una piedra en el hueco que habitualmente ocupa un corazón para no reconocer y emocionarse con el inicio de la narración del gol de Iniesta en el Mundial de 2010.
Nadie se emociona con Alexa, pero tiene que ocupar ese agujero un trozo de carbón si no se te ponen los pelos de punta al escuchar a Luis del Olmo la mañana del 11-M, con una compostura de hormigón a través de la cual se intuía el sobrecogimiento por la preocupación ante lo desconocido.
Nos emocionamos porque sabemos que hay una persona detrás que está viviendo lo mismo que nosotros, pero que, además, es capaz de ponerlo en palabras, de amarrarlo, de hacérnoslo palpable.
La IA puede brindarte muchas alternativas de negocio. O puedes decidir no abrazarla y quedar relegado de todo.
— Sole Franco (@SoleFranco1979) June 28, 2024
Esta es la historia del periodista Al Michaels.
La cadena NBC acaba de anunciar que un modelo de IA entrenado con la voz de Al Michaels narrará de forma… pic.twitter.com/ABPPhAaVNu
¿Qué sentido puede tener esto de clonar una voz con inteligencia artificial? ¿Qué fin? ¿Ahorrar costes? ¿Momificar a viejas glorias y condenar a las generaciones venideras? ¿Privar a los oyentes de eso tan fundamental que es dejar que el locutor les guíe en la emoción?
De Siri, Alexa y compañía todos sabemos (o, al menos, la mayoría) que son ficticias, que son un engaño. Que no hay nadie detrás que nos habla mientras estamos en la cocina preparando la cena. Con esta nueva vía que ha abierto NBC, la línea ha pasado a ser muy borrosa, por no decir inexistente.
Michaels dijo en unas declaraciones después de conocerse el anuncio de NBC que al escuchar las pruebas que le mostraron de su voz clonada sintió cómo su trabajo quedaba obsoleto y pensó que en la próxima vida iba a necesitar una nueva profesión. También comentó que no era un tecnólogo ni mucho menos, pero sabía que, preparados o no, aquí llegaba la inteligencia artificial.
Es decir, que mejor subirse al carro mientras aún estuviese en marcha con las puertas abiertas. Y también es decir que tonto el último.
Apuntalar las razones por las que Michaels ha accedido a ceder su voz no requieren de un grado en psicología para ello: ha sido el más puro ego. El afán por no dejar de estar. Como dijo, esta participación pasiva en los Juegos Olímpicos es una forma de estar presente en París sin estarlo. De, aun sin grabar nada, aun sin comentar nada, mantenerse vinculado a una competición que siempre le ha gustado.
Pero en la vida, igual de importante que saber estar es saber cuándo ha llegado el momento de irse.
Sin embargo, lo que no alcanzo a entender son las razones de NBC, porque la excusa de la experiencia de los clientes no acaba de colar. Puede ser avaricia, y también puede ser haber perdido de vista cuál era su propósito.
Clonar la voz para unos comentarios deportivos puede parecer algo anecdótico, pero ¿dónde queda el límite? ¿Hasta dónde está bien llegar?
Porque hasta hace poco, los medios de comunicación éramos los encargados de proteger a los ciudadanos del trampantojo. De delimitar claramente la línea que separaba la realidad de la ficción. De apuntalar la verdad entre tanta mentira.
No sólo lo éramos, sino que también queríamos serlo. Queríamos estar a la altura del encargo y no perder esa credibilidad tan finamente hilada. Una credibilidad que no admite introducir el engaño en sus filas.
Resulta prodigioso el afán de algunos de coger la escopeta cargada y, tras hacer una serie de malabares, decidir que ha llegado el momento de pegarse un tiro en el propio pie.