Cambridge Consultants, compañía británica especializada en desarrollo de “innovación disruptiva”, anuncia una tecnología para inteligencia artificial que “se acerca a la visión humana”, explica su director comercial de IA, Tim Ensor. “Es capaz de distinguir imágenes borrosas, oscuras o distorsionadas y corregirlas en tiempo real, aproximándolas a como se verían en realidad” sin la perturbación.
La tecnología DeepRay se basa en recientes avances en deep learning y promete aplicaciones para situaciones impredecibles, aplicando la visión a actividades como la conducción autónoma de coches robóticos, o facilitando imágenes de mayor precisión en procedimientos médicos. Los sistemas de visión artificial se pueden ver muy afectados por factores como la lluvia, presencia de humo o suciedad.
El entrenamiento del sistema se basa en mostrarle la imagen real de objetos y lo que se ve cuando la imagen resulta sufre diversos tipos de distorsión. Al mostrársele objetos que nunca antes ha visto, puede hacer una conjetura en tiempo real sobre la escena “real” que hay tras la imagen deformada.
Cambridge Consultants, que pertenece al grupo de ingeniería Altran, afirma que con este “ojo mental”, DeepRay está en condiciones de superar al propio ojo humano y a los actuales sistemas de visión, reconstruyendo imágenes claras bajo condiciones adversas.
“Entramos en una nueva era de visión artificial, que dará nuevo aire a aplicaciones en muchas industrias, incluyendo el automóvil, agrotech y medicina”, afirma Ensor. “Será posible la creación de imágenes claras a partir de vídeo”.
DeepRay ha sido desarrollado en el Digital Greenhouse de CC, un entorno en el que científicos de datos e ingenieros experimentan con las últimas tendencias de deep learning y, en particular, con el uso de GPUs NVIDIA. Al tiempo que comunicaban este lanzamiento, del que INNOVADORES ya adelantó los primeros desarrollos en septiembre, Tim Ensor lo explicaba en Barcelona, en el curso del evento InSight de NetApp, compañía con la que Cambridge Consultants colabora en el área de IA.
El sistema utiliza extensiones específicas de la arquitectura Generative Adversarial Network (GAN). El entrenamiento requiere seis redes neurales para competir entre ellas por equipos, inventando escenas complicadas para tratar de eliminar la distorsión. Un tipo de actividad, el entrenamiento de principio a fin de tantas redes juntas que apenas es posible desde hace un par de años, con requerimiento de muy altas capacidades.