En 2024 es difícil imaginar un mundo sin internet, sin ordenadores y sin smartphones. Pero todo eso era normal no hace mucho tiempo. Incluso en los primeros años de la década de los 90 en España ninguna de esas tres cosas eran mayoritarias, aunque hubiera familias que usaran esas tecnologías.
Fue en ese momento cuando nació Google como una start-up creada por dos ingenieros que querían ordenar Internet. Sin más. Fue en un momento en el que Microsoft dominaba la informática mediante Windows y donde los ordenadores, con permiso de Apple, eran en su mayoría clónicos. Pero la empresa entonces dirigida por Bill Gates no supo ver lo que iba a significar, de verdad, Internet, y perdió su dominancia total.
Google fue creciendo y ocupando cada vez más espacio, primero con el buscador, luego con un servicio de correo que hacía quedar en evidencia a Hotmail y luego con su propio buscador, algo que en la era de Internet Explorer parecía una ofensa, intentar pelear contra un gigante como Microsoft. La historia ya es conocida.
En esa misma década se empezaron a popularizar los teléfonos móviles, y marcas como Nokia o Siemens dominaban el mercado. La firma finlandesa tenía particularmente una cuota de mercado tan alta que haría palidecer a cualquier compañía actual de telefonía. Pero, al igual que le pasó a Microsoft antes, no supo ver que el paso de los móviles a los smartphones iba a cambiarlo todo.
La era de la IA
El año pasado se inició uno de esos cambios de paradigma que duran años pero que cambian la industria para siempre. 2023 fue el año de la inteligencia artificial, con la consolidación de ChatGPT, el lanzamiento de decenas de servicios y aplicaciones y la normalización del uso de estas herramientas para el trabajo, los estudios, etc. Cada pocos días se ven nuevos modelos de lenguaje, mejoras en los existentes, etc.
Esta nueva etapa no ha sido empezada ni por Google ni por Apple ni siquiera por Microsoft. Ha sido una empresa diferente, Open AI, la que ha dado un paso adelante comercializando una serie de servicios que ninguna otra compañía había comercializado. El primero fue ChatGPT, pero también su generador de imágenes, Dall-E.
La respuesta de los gigantes no ha podido ser más diferente. Dejando de lado a Apple, que va a su ritmo, como le pasa a Nintendo en el sector de los videojuegos, Microsoft y Google se enfrentaron a esta nueva realidad de formas completamente diferentes. La empresa ahora dirigida por Satya Nadella hizo una apuesta de máximos invirtiendo 10.000 millones de dólares en OpenAI, lo que le ha permitido estar en la cresta de la ola de esta hornada de innovación.
Por su parte, Google se quedó con el pie cambiado, viendo cómo su desarrollo de grandes modelos de lenguajes, los que habían puesto a disposición de desarrolladores, ahora se convertían en herramientas en manos de otras empresas que amenazaban su propia posición. Con todo, tardó mucho en reaccionar, en parte porque no sabían si esta tecnología estaba lo suficientemente madura como para que no causara estragos si se hacía pública y en parte porque sabía que iba a amenazar su principal fuente de ingresos, la publicidad. Incluso ahora ve peligrar su mina de oro, porque OpenAI está trabajando en su propio buscador.
Google va un paso por detrás
Tras meses de dudas y de reacciones tibias Sundar Pichai pulsó el botón de emergencia y dio vía libre a la integración de la IA en los productos de la empresa. Esta integración se empezó a ver en algunos servicios, pero nada comparado con lo que ha hecho Microsoft, que permite la creación de imágenes, chatear directamente desde el buscador, etc.
Google entonces anunció Gemini, su nuevo modelo grande de lenguaje que prometía cubrir el salto tecnológico que parecía que OpenAI le llevaba. Incluso ha lanzado una tarifa de Google One que lo integra, en respuesta a ChatGPT Plus, el servicio de pago de la empresa dirigida por Sam Altman. No se puede negar que intentan ponerse a la altura, incluso con actualizaciones de su sistema muy rápidas.
Sin embargo, al contrario que la propuesta de ChatGPT, Gemini Ultra no está disponible en todo el mundo, sólo en algunos países, y en algunos lenguajes. Sí es cierto que se puede probar la versión de menor potencia como sustituto del asistente de Google, pero incluso así no llega a ser un sustituto completo, teniendo que renunciar a algunas cosas si se quiere usar este nuevo asistente de voz.
Llega el vídeo
Esta sensación de permanente liderazgo que tiene OpenAI sobre Google no hace más que aumentar a cada presentación. Hace unas semanas Google presentó VideoPoet, un sistema centrado en el vídeo que permite generarlo mediante lenguaje natural. Esto es un salto con respecto a las aplicaciones que generan imágenes, de las cuales ya hay varias y que están a un gran nivel.
La nueva propuesta de Google aún no está abierta al público, pero en su página web hay decenas de ejemplos de cómo funciona, mostrando sus cinco grandes capacidades, desde crear vídeo a editarlo, además de modificar partes del mismo, todo mediante comandos de texto. Es una alternativa a propuestas como Runwayml, pero bastante más potente.
Esto, que podría suponer un ligero adelante con respecto a lo que había en el mercado, se ha visto completamente eclipsado por el último anuncio de Open AI, Sora, que ha demostrado cómo la creación de vídeo desde texto ha evolucionado en menos de un año. Los resultados son espectaculares y, aunque aún no son perfectos, ya son plenamente usables para sustituir por ejemplo a los vídeos de stock.
Este golpe sobre la mesa ha recordado al lanzamiento de Dall-E 2, que supuso un salto enorme con respecto a las versiones previas, que no eran plenamente utilizables por su calidad. Ahora ha pasado lo mismo con el vídeo y, de nuevo, la que ha liderado ese salto ha sido OpenAI. Parece que Sam Altman ha conseguido acelerar todo lo que querían sin las limitaciones que le estaba poniendo la junta hasta hace poco.
El propio CEO de la empresa ha usado su perfil de la red social X para pedirle a sus seguidores que le enviaran comandos de texto para crear nuevos vídeos, para que se viera la potencia de su producto sin las posibles restricciones de las condiciones ideales en las que algunos podrían imaginar que se crearon los clips. Los resultados son espectaculares, aunque no perfectos como la propia OpenAI deja claro en su página web.
Amenaza a los trabajos
Cuando las primeras versiones de IAs capaces de generar texto e imágenes empezaron a ser usables de manera masiva, algunas voces se alzaron advirtiendo del peligro que podría suponer para muchos puestos de trabajos. Tanto redactores como ilustradores veían cómo en muchos casos sus conocimientos y capacidades no iban a ser tan demandados como antes.
Ahora este problema se extiende a los fotógrafos, videógrafos pero también a actores, maquilladores, modistas, iluminadores... Las capacidades mostradas por Sora son tan avanzadas que no es que pueda suponer una amenaza a 5 o 10 años vista, es que la supone ya mismo. O al menos lo hará cuando Open AI abra al público este servicio, que obviamente será de pago pero que, salvo que tenga un precio prohibitivo, puede suponer el clavo en el ataúd de muchas profesiones.