Convertir vídeos normales a cámara lenta ya es posible gracias a la IA de NVIDIA
Nvidia ha desarrollado una IA capaz de convertir vídeo a cámara lenta, con un efecto superfluido que parece haber sido grabado así.
19 junio, 2018 13:52Noticias relacionadas
- Tomar curvas peligrosas con la moto será menos peligroso con esta IA avisándonos
- El cofundador de Siri se une al equipo de Sherpa, el asistente inteligente español
- Intel crea un "cerebro" digital con 8 millones de neuronas, imitando a los nuestros
- Encontrar a perros perdidos usando fotos de sus hocicos ya es una realidad en China
Las cámaras del móvil graban normalmente a 30 FPS, y no todas tienen cámara lenta, principalmente por el precio del teléfono móvil medio, aunque no es tanto por la cámara sino por el procesador del teléfono, en realidad, que es quien realiza el trabajo.
Por ello, si grabas un vídeo y lo quieres pasar a cámara lenta, se va a ver simplemente horroroso si no tienes un teléfono o cámara preparado. Además, es algo que debemos elegir al momento de grabar, por lo que aún teniendo una cámara que grabe en cámara lenta, si ese vídeo lo hemos grabado en “normal”, no hay nada que hacer.
La razón por la que esto ocurre es porque al reducir el tiempo re reproducción (es decir, al poner el vídeo en cámara lenta), no tenemos suficientes imágenes para rellenar. Es como si tenemos un vídeo de 1 segundos compuesto por 300 imágenes (es decir, un vídeo de 30 FPS). Si queremos convertir ese vídeo a 1 minuto, tendremos que cada una de esas 300 imágenes la veremos durante 0,2 segundos, lo que es bastante.
Tus vídeos a cámara lenta gracias a la IA de Nvidia que ‘inventa’ frames
En otras palabras, faltan imágenes de lo que sucede en medio de lo que ya tenemos grabado, por lo que el vídeo resultante a cámara lenta se verá a trompicones, lo que no es nada agradable. Pero NVIDIA quiere solucionar eso con una Inteligencia Artificial capaz de convertir cualquier vídeo a cámara lenta. Lo que hace es, concretamente, predecir mediante el aprendizaje automático esos frames (escenas) que irían en medio de los que ya tenemos.
En el vídeo superior vemos un poco de lo que hablamos: arriba vemos el vídeo convertido a cámara lenta partiendo de 30 FPS, y debajo el mismo vídeo pero habiendo pasado por la Inteligencia Artificial de NVIDIA. La diferencia es abismal, y en el segundo vídeo directamente no notamos que el vídeo realmente está grabado a menos frames, y que probablemente la mayoría de las imágenes sean sintéticas.
Es literalmente el equivalente de agrandar una imagen a una resolución mayor, predeciendo aquellos píxeles que irían en los lugares donde se está ampliando la imagen.
Para llevar a cabo esta conversión, el equipo de NVIDIA usó una Tesla V100 (una GPU de la firma, por supuesto) y PyTorch, una red neuronal, que su vez estaba acelerada por cuDNN, con la que entrenaron el sistema mediante 11 000 vídeos. Tras analizar esa cantidad de vídeos, el sistema ya es capaz de ‘inventar’ frames casi por completo.