Imagen del deepfake 'Atention', con Barak Omaba, Maestro  Zikkos, Emmanuel Marcon, Trump, Hillary Clinton...

Imagen del deepfake 'Atention', con Barak Omaba, Maestro Zikkos, Emmanuel Marcon, Trump, Hillary Clinton...

La tribuna

La nueva economía global de las falsificaciones profundas o ‘deepfakes’

17 noviembre, 2020 10:00

Todo el mundo conoce el concepto de economía sumergida, es decir, la está fuera del radar de la fiscalidad pública, pero ahora está emergiendo la nueva economía digital que yo llamo ‘estratosférica’ global, también fuera de ese radar y con nuevos y sorprendentes mecanismos que hacen posible los ‘Señores del Aire' (Echeverría) y sus nubes (cloud computing), sus inmensos data center y los nuevos poderes que otorga la inteligencia artificial, y su aprendizaje profundo o deep learning.

Y todo ello combinado con la potencia olvidada del hipertexto y las tecnologías de búsqueda, hoy imprescindibles. Esta combinación de tecnologías es altamente compleja y su resultado es un conjunto de medios digitales capaz de autorrecombinarse, que producen poderosos y sorprendentes resultados, como el surgimiento de nuevos valores económicos, nuevos modos de economías de escala deslocalizada o sin aparente sede física concreta.

¿Que son las ‘deepfakes’ (falsificaciones profundas)?

La expresión deepfakes podría tomarse erróneamente por una licencia literaria o poética, pero no es así. Es un mecanismo muy específico y avanzado que combina algorítmica, efectos de la red y un subcampo de la IA muy preciso, especializado en tratamiento masivo de imágenes digitales.

Su mecanismo es una sofisticada técnica de la IA que permite crear, editar generar y reconstruir vídeos ‘falsificados’ de personas con apariencia de imagen real filmada, que previamente han sido deconstruidas por la propia IA en fragmentos por palabras pronunciadas, sincronizadas con su sonido correspondiente (la materia prima son filmaciones reales y muchas veces oficiales), a las que después se cambiará el tono para adaptarla a la nota musical concreta manteniendo el tono de voz del personaje reconocible como si fuera voz original sobre una línea de tiempo de una melodía, tal como obedecerían a una partitura, con lo cual crean vídeos con canciones sorprendentemente convincentes y con apariencia de una ‘critica’ humorística audiovisual, pero con imágenes en movimiento, de alta calidad.

La herramienta esencial para este proceso son conjuntos de algoritmos de aprendizaje profundo no supervisados, conocidos en español como RGAs (red neural generativa antagónica), que capturan, deconstruyen y procesan vídeos o imágenes previamente existentes. Su funcionamiento es interesantísimo.

Para generar los vídeos deepfakes se crea una especie de enfrentamiento ‘gamificado’, como si fuera un juego de acierto y error entre dos modelos o conjuntos de estructuras de red neural de algoritmos de inteligencia artificial. En ese juego, se confronta a dos grupos de algoritmos RGAs en el que dos núcleos de aprendizaje automático son enfrentados entre sí, habiendo sido orientados a lo que se llaman ‘objetivos antagónicos’. El primer modelo es alimentado con una base de datos de referentes visuales (innumerables imágenes digitales de un sujeto y objeto que los algoritmos pueden identificar y/o capturar de internet, sobre todo en las redes sociales) y otras fuentes o archivos (muchas veces oficiales o gubernamentales), ya sean en forma de fotos o como parte de vídeos digitales. En base a esta ingente materia prima, el primer modelo comienza a generar imágenes falsificadas.

El otro modelo antagónico, por su lado, se encarga de detectar y evaluar las imágenes falsas creadas por el primero, calificándolas como ‘verdadera’ o ‘falsa’ en cada caso. Este ciclo se repite a una velocidad vertiginosa con una ingente cantidad de imágenes, hasta lograr que el primer modelo consiga generar imágenes que el segundo modelo no logre identificar como falsas. Las que pasan ese filtro se acumulan y van construyendo un flujo a razón entre 24 o 60 imágenes por segundo que van formando un convincente y atractivo vídeo digital de alta calidad que alcanza la alta definición HQ o superior. En paralelo, se construye y adapta el sonido.

Esta técnica en su estado más inicial se usó por Lucas Film para crear secuencias en 2019 de la película del Episodio IX de Star Wars, llamado El ascenso de Skywalker. En esta la última entrega de la saga aparece la actriz Carrie Fisher como un híbrido digital sin que el espectador lo perciba. La productora, al principio lo hizo por pura necesidad, ya que Carrie Fisher, a punto de cumplir los 60 años, falleció durante el rodaje. Gracias a la tecnología de vídeo deepfake, se pudo ver en la pantalla del estreno de 2019 a una jovencísima y esbelta Carrie Fisher, que en el mundo real acababa de fallecer meses antes.

La revista Vice informó por primera vez sobre estas técnicas en diciembre de 2017 denunciando en artículos posteriores, el posiblemente peligroso uso de la técnica deepfake, a cuya explotación masiva se lanzó la industria digital del porno combinando en vídeo cuerpos de actrices porno en los que integraban rostros de actrices muy famosas.

Al poco tiempo, de forma anónima, un desarrollador experto creó y liberó en internet una aplicación basada en IA que facilitaba el uso de estas tecnologías que, en pocos días, alcanzó las 100.000 descargas antes de ser retirada. Pero una vez liberada en la red esa aplicación, los Efectos de Red (O'Reilly) hicieron el resto. Y en breve, el siguiente paso de la tecnología deepfake dio el salto al enorme campo de la ‘celebrity’ política mundial, generando, casi de inmediato, un nuevo, inmenso y opaco sector de negocio global basado en las falsificaciones profundas, con personajes como Donald Trump como mascarón de proa.

La nueva economía global basada en las ‘falsificaciones políticas profundas’

Los algoritmos de las plataformas de redes sociales promueven explotar económicamente las emociones de los usuarios, neutralizando, al tiempo, su pensamiento crítico y racional, y su toma autónoma de decisiones, para cambiarlas además de crear adicciones digitales. Por eso la actual polarización política extrema y populista conviene fuertemente a su modelo de negocio de la que son, al tiempo, generador y consecuencia.

A más tráfico y datos en la red, más difusión e impacto. A mayor crecimiento, más dinero, y mayor publicidad, lo que conduce a una enorme rentabilidad. Es algo así como el bucle virtuoso de los inversores de la especulación bursátil. Y si se trata de archivos de vídeos, en lugar de los textos de las fake news (noticias falsas); la cantidad de datos y tráfico de red se eleva en varios órdenes de magnitud (a más tráfico, más negocio). Son mucho más rentables los vídeos deepfakes que las fake news, y se difunden con el mismo mecanismo viral. Según una investigación de la Escuela de Negocios Sloan del MIT en twitter, por ejemplo, las fake news “se difunden significativamente más lejos, más rápido, más profundo y más ampliamente que la verdad o los hechos, en todas las categorías de información, y en muchos casos, en un orden más de magnitud”. Lo mismo ocurre con los Deepfakes.

Realidad e irrealidad mezcladas

Como este sofisticado mecanismo global es complejo, intentaré describirlo con un ejemplo de explosivo éxito en EEUU donde el principal termómetro de la política mide en términos de popularidad. Lo cuento a través de una experiencia personal de hace unos días. En plena vorágine de la noche de espera de resultados electorales de EEUU me llegó un retuit de un colega americano que rebotó un tuit de Bianca Jagger, en el que estaba hablando Joe Biden. Resultó ser un flujo de vídeo-streaming (retransmisión televisiva en vivo) de su primer discurso tras las votaciones, desde Wilmington, estado de Delaware (EEUU). En ese momento, 7 de noviembre de 2020, y a la hora en que me conecté, pude ver en directo a Joe Biden comenzando con la frase: “Entiendo la decepción de esta noche...” Quizá por deformación profesional, quise ver el contexto de ese streaming en vivo y lo que vi en pantalla me dejó asombrado. Esa ventana del vídeostreaming de Biden estaba incrustada en un artículo del diario Latin Times, un periódico cuya redacción está en el 33 de la calle Whitehall de Nueva York, en el bajo Manhattan, a solo cuatro manzanas de la Bolsa de Wall Street. Lo edita el grupo IBT Media, empresa de noticias digitales globales con más de 90 millones de lectores mensuales, y especializada en noticias, inmigración, fútbol y telenovelas, según su lema, y todo relacionado con la cultura del mundo latino e hispano de EEUU. Pero hay más. El artículo en el que estaba viendo en directo a Joe Biden ese día 7 de noviembre de 2020, llevaba como fecha de publicación el 20 de julio de 2017 (hace ¡más de tres años!).

La segunda sorpresa fue el título del artículo: “El presidente de EEUU, Donald Trump, "canta" el éxito viral ‘Despacito’, y sus nietos lo bailan [VIDEO]". Probablemente, la razón de esta mezcla de ahora es que la popularidad del artículo sigue generando mucho tráfico en la red. Por eso los medios no les importa mezclar pasado con presente para lectores que no entran en esos detalles. Pero imagine el lector que va al quisco ahora a comprar el periódico del día hoy y le dan un ejemplar ¡de 2017! ¿qué le diría al quiosquero?

Pero eso no es todo. El artículo de 2017 incluía (incluye) dos vídeos más: uno es un deepfake en el que, aparentemente (con calidad visual y sonora perfectas), Trump “canta” el éxito de Luis Fonsi y Daddy Yankee y dentro del artículo, puede verse un tercer vídeo, cuya historia es la siguiente. Es una pieza audiovisual que tras filmarla con su smartphone personal publicó en su cuenta de Instagram @ivankatrump. Este último vídeo es auténtico y publicado tal cual, sin editar, junto con una frase: “Nothing better then a post work dance party!”.

La nueva industria global de las falsificaciones profundas

En el caso del artículo citado de Latin Times señalan que han entrevistado al creador del vídeo falsificado Despacito ‘interpretado’ por Trump. Según el artículo, quien ha realizado el vídeo es un joven músico, y creador de contenidos digitales, llamado Chaouch Zakaria, 'alias' Maestro Ziikos, cuya actual profesión confesada es youtuber. Su medio de vida principal, aparentemente, está basado en su canal de YouTube, rotulado en su banner con su alias digital. Según la huella digital sobre él que hay en internet, este youtuber reside y trabaja en Sla, en las afueras de Rabat (Marruecos) y antes fue redactor de radio y televisión en Médi 1 TV. Su canal personal de YouTube, (que combina ‘linkados’ sutilmente con sus otros canales de redes sociales) es aparentemente normal, pero muestra asombrosas cifras: tiene 2,59 millones de suscriptores, más de 60.000 followers en Facebook, con más de 54.000 ‘me gusta’, 59.000 en twitter y más de 135.000 en Instagram. Sume el lector y compare las cifras de audiencia con las de cualquier medio periodístico tradicional.

En cuanto a este nuevo tipo de producción audiovisual falsificada, sus cifras de audiencia son impresionantes. Veamos. Un solo vídeo deepfake del Maestro Ziikos, llamado Shawn Mendes, Camila Cabello-Señorita (Donald Trump Cover), ha alcanzado 28,6 millones de visualizaciones desde su publicación, en YouTube y ha conseguido 1,6 millones de likes. Y si sumamos las cifras de cinco de sus vídeos deefakes alcanzan ¡74 millones de visualizaciones! Imagínense a una agencia de publicidad que ofrece a un anunciante producir un anuncio que garantizaría que vieran casi el doble de habitantes que tiene España o todos los turistas que visitaron España entera en 2019, un año récord. ¿Cuánto dinero valdría un anuncio de una campaña que vieran de forma garantizada a casi 75 millones de espectadores? ¿Qué pagarían los principales anunciantes por algo así?

Cualquiera que conozca el mundo publicitario y sus precios se hará una idea enseguida de que esto deja en ridículo los autobombos por las audiencias conseguidas de las que presumen cada año más de un ganador de cualquier premio Ondas, o las cifras en el EGM, de cualquier programa de TV en España. Sus cifras de audiencia, al lado de las del Maestro Ziikos resultan ridículas.

Junto a la cabecera del canal de Ziikos en YouTube está un primer vídeo deepfake que ya tiene 8,2 millones de visualizaciones. Su escueta frase de presentación dice: “Mi nombre es Chaouch Zakaria alias Maestro Ziikos y hago que todos canten cualquier cosa”. Y literalmente lo consigue gracias a la tecnología de los algoritmos RGAs de inteligencia artificial, que Zikkos maneja con maestría. Por ejemplo, su canal muestra otro vídeo, titulado Attention, en los que las estrellas, aparte de él mismo, son los más famosos líderes mundiales occidentales que cantan con su propia y reconocible voz como su acompañamiento. Son una lista impresionante: Donald Trump, el primer ministro de Canadá, Justin Trudeau; el presidente de Francia, Emmanuel Macron, además de las más conocidas figuras políticas demócratas de EEUU: Obama; Bernie Sanders y Hillary Clinton.  Todos ellos le ‘hacen’ coros cantando primero a capella y luego juntos una canción creada por Ziikos, cuya letra es pura ironía dirigida al oyente. La factura técnica es perfecta y el resultado espectacular.

Otro de sus deepfakes más famosos es una versión, también con una calidad visual y sonora excepcionales, de la canción Bohemian Rhapsody de Freddie Mercury y Queen que interpretada por Donald Trump, a quien introduce un ‘pianista’ excepcional como acompañante, no por su técnica musical, sino por su identidad y su ‘morbo político’. Es Vladímir Putin, que toca el piano acompañado a su lado por el logotipo de RT (Russia Today; (Rusia hoy), la cadena de televisión internacional financiada por el Gobierno ruso que emite noticias, propaganda y desinformación que interesa difundir al gobierno del líder Putin globalmente). La interpretación musical y el sonido son impecables, y su aspecto es una versión falsificada con mucho talento a partir de la original Bohemian Rhapsody.

La letra de esta versión con leves modificaciones es una carga de profundidad de significado en este momento de la actual grave crisis política, que sigue alimentando Trump sobre el resultado electoral EEUU, vista a través de la ‘burla’ del vídeo falsificado cantado por Donald Trump. Tras el título, y la introducción al piano de Putin, Trump canta una despedida: “Adiós a todos” y el estribillo dice: "Adiós a todos, tengo que irme / Adiós a todos, tengo que irme / he de dejaros a todos atrás y afrontar la verdad”. Oír cantar perfectamente con su voz en el vídeo estas palabras a Trump, ahora mismo, con Putin acompañándolo al piano y la música de Freddy Mercury, con una factura técnica perfecta, es impresionante, sobre todo con lo que está ocurriendo ahora mismo en EEUU. Y el presidente que canta en este deepfake, es el mismo que el del vídeo en el que cantaba Despacito, que sus nietos, hijos de Ivanka Trump bailaban y ella publicó en Instagram.

La 'economía estratosférica' de los Deepfakes  

Vistas estas producciones audiovisuales con audiencias millonarias y el resultado visual y musical, aquí se cumple la frase de John Perry Barlow: “Todo lo que usted sabía hasta ahora sobre propiedad intelectual está equivocado”. Los principios clásicos de la autoría musical están deconstruidos por el software de inteligencia artificial y pertenecen a la que yo llamo ‘economía estratosférica’ de la nube, de los Señores del Aire (Echeverría) que es donde están realmente los contenidos.

Economía estratosférica global desregulada fuera del radar del fisco de cualquier país, igual que la economía sumergida, pero en cambio en esta caso pública, famosa y notoria y accesible desde todo el planeta. Y además en venta ya que todos los vídeos llevan publicidad; y la música también se distribuye en un canal abierto de Spotify y en un canal gratuito de Apple Music, aunque también están a la venta en la tienda virtual iTunes de Apple.

En cuanto a su producción audiovisual, las cifras de audiencia aún son más impresionantes (y recuerden que en cada visualización se emiten uno o dos anuncios, como mínimo). Los vídeos de YouTube solo son un nodo, ya que están interconectados mediante sutiles links de hipertexto con el conjunto de distintas cuentas del mismo autor en las principales redes sociales (YouTube, Facebook, Instagram, Twitter, Spotify, Apple Music, iTunes, etc. en un conjunto interconectado y de acceso gratuito, que el youtuber Ziikos habrá podido construir fácilmente desde su ordenador personal y hacerlo desde cualquier lugar conectado.

Pero la cosa no acaba aquí. Ese conjunto de cuentas en redes sociales tiene su propio sistema de monetización para convertir el tráfico y la audiencia en dinero, facilitado por los monopolios de las plataformas digitales globales. Además, bajo la cabecera del canal de YouTube también hay un sorprendente y discreto link con el título: Donald Trump Store, que conduce a una espectacular tienda online e la que se puede comprar graciosas figuras impresas en 3D coloreadas de Donald Trump disfrazado de Capitán América que tiene acompañante al muñeco del ¡líder de Corean del Norte, Kim Jong-un! con una bomba nuclear bajo el brazo. El resto de mercancías a la venta, se completa con merchandising Trump: desde mascarillas Trump2020, hasta simulaciones de llaves de una mansión del presidente o toda una serie de objetos Trump que cualquiera pensaría que es merchandising del partido republicano de EEUU o de la maquinaria electoral de Trump. Estéticamente no había duda, pero recuerden que estamos en una web de falsificaciones profundas en todos los sentidos. Los precios de cada pieza que no son baratos. Incluso hay una sección de Mercadillo de Navidad en la que se venden suéteres con el lema principal de campaña electoral levemente 'falsificado' de Trump junto a su cara: We will make christmas great again / Haremos que las navidades vuelvan a ser geniales. No hay ninguna marca ni logo de empresa visible. Los pictogramas de red social que aparece son una simulación, no tienen link; y el texto legal sobre protección de datos, y reclamaciones comerciales, preceptivos en internet la UE, tiene un solo contacto: el email personal de Google del Maestro Ziikos.

En definitiva, podrían parecer perfectamente merchandising de ese partido para las elecciones. ¿Es legal? Pues… No lo tengo claro, porque el mecanismo es opaco, pero es un hecho que YouTube, –o sea Google–, permite que los compradores entren a comprar en la tienda a través de su plataforma.

Y finalmente… ¿con qué capital ha podido montar todo este ya famoso negocio global? Hay una pista. También en el propio canal de YouTube hay una frase discreta que le dice al usuario ¿Quieres financiarme y ser uno de mis patrocinadores? Esto lleva a un también discreto link de Patreon, la plataforma de micro-mecenazgo (micro-crowdsourcing) para proyectos creativos, fundada en 2013 por el músico Jack Conte, en la que algunos de sus miembros ya son patrocinadores del Maestro Ziikos. Una vez vista en detalle toda la estructura comercial global desplegada por el youtuber Chaouch Zakaria alias Maestro Ziikos, creo que casi todo lo que yo creía saber sobre comercio global online, tendré que actualizarlo a fondo, a raíz de esta potente e inesperada irrupción de la ‘Economía estratosférica’ basada en estas deepfakes.

Thomas Blank, Horst Hahn, Jochen Kriegseis y Martin Limbach del KIT han desarrollado este dispositivo.

Aerobuster: un sistema simple y económico que inactiva el Covid-19

Anterior

Hologramas para las reuniones de trabajo “presenciales”

Siguiente