El espectacular robot de Google DeepMind que juega al ping pong como un humano: se adapta a distintos rivales
Los avances en la investigación de este dispositivo podrían aplicarse a otros campos, dedicados al desarrollo de capacidades robóticas avanzadas.
9 agosto, 2024 17:30Los Juegos Olímpicos de París siguen dando de qué hablar en España por su marcado corte tecnológico. En estos JJ.OO, hemos visto desde plantillas inteligentes hasta voces generadas por IA replicando las de icónicos periodistas. Sin embargo, los deportes en sí son un estupendo campo de entrenamiento para capacidades de los robots. Así lo demuestra Google DeepMind, con su robot jugador de ping pong potenciado con IA.
Google DeepMind es la compañía subsidiaria de Alphabet dedicada a la investigación y el desarrollo de la IA de Google. Una inteligencia artificial que, lógicamente, prueban de manera recurrente en sus robots. La división de robótica ha publicado un nuevo artículo científico en el que muestran su nuevo dispositivo que, en sus palabras, logra "un rendimiento de nivel amateur en este deporte".
Los resultados de este desarrollo son espectaculares. En palabras de Google, este robot pudo derrotar a todos los jugadores iniciados contra los que jugó. Subiendo el nivel a intermedio, el robot ganó el 55% de los partidos, o lo que es lo mismo, más de la mitad de los enfrentamientos los ganó el dispositivo. El robot pudo jugar un conjunto de 29 partidos con contrincantes divididos en 4 niveles de dificultad.
Un robot de Google jugando al ping pong
El fundamento principal que ha promovido el desarrollo de este robot, afirma DeepMind en su artículo de investigación, es la de alcanzar "una velocidad y un rendimiento a nivel humano en tareas del mundo real" en la comunidad de investigación de la robótica. Afirman que el tenis de mesa es un escenario excelente para este tipo de investigaciones, desde al menos los años 80.
La idea detrás de este proyecto es entender que este robot debe ser lo suficientemente bueno en las habilidades que requieran un nivel muy bajo, como devolver la pelota. Pero también es necesario que ejecute tareas exigentes, que impliquen por ejemplo elaborar ciertas estrategias y la planificación a largo plazo para conseguir diversos objetivos.
Meet our AI-powered robot that’s ready to play table tennis. 🤖🏓
— Google DeepMind (@GoogleDeepMind) August 8, 2024
It’s the first agent to achieve amateur human level performance in this sport. Here’s how it works. 🧵 pic.twitter.com/AxwbRQwYiB
El desarrollo de este robot es un paso en este sentido. Según Google, este es el primer agente robótico con las capacidades necesarias para jugar un deporte con humanos y sobre todo a un nivel humano. "Representa un hito en el aprendizaje y el control de los robots", relata el artículo. "Es solo un pequeño paso hacia un objetivo de large data en robótica para lograr un rendimiento a nivel humano en muchas habilidades del mundo real".
Para entrenar este robot, Google usó un conjunto de datos que incluían detalles sobre los estados principales de la pelota en el juego del tenis de mesa. Por ejemplo, estos detalles revelaban información sobre la posición de la pelota, su velocidad y el giro que realizaba, entre otros. Este sistema, por consecuencia, pudo aprender un nuevo conjunto de habilidades relacionadas con el ping pong.
To train the robot, we gathered a dataset of initial table tennis ball states - which included information about position, speed, and spin.
— Google DeepMind (@GoogleDeepMind) August 8, 2024
The system practiced using this library and learned different skills, like forehand topspin, backhand targeting, and returning serves. pic.twitter.com/zqGg1Fxf7F
Lo primero que hizo Google es entrenar este robot en entornos simulados, con modelados precisos que imitaban la física inherente de los partidos de ping pong. Con el entrenamiento ya hecho y el robot ya en uso en entornos reales, Google hizo que el robot recopilase detalles sobre su rendimiento frente a jugadores humanos. De esta forma, el robot podía aprender de sus errores y "refinar sus errores".
Lógicamente, no todos los contrincantes del robot son iguales; el tipo de juego varía enormemente dependiendo del tipo de jugador, lo que añade muchísimas variables a la ecuación. El sistema está específicamente diseñado para ser adaptable a distintos oponentes, ya que rastrea sus comportamientos y determina su estilo de juego.
Para muestra, un botón. El robot puede entender, analizando a su contrincante, a qué lado de la mesa tiende a devolver la pelota. El sistema lo reconoce y prueba distintas habilidades, registrando la tasa de éxito de estas habilidades y ajustando la estrategia casi en tiempo real.
El robot solo tuvo problemas con jugadores profesionales y avanzados. El robot de Google pudo competir contra jugadores muy avanzados en este deporte. De 29 partidos, ganó el 45% de ellos. Una cifra impresionante, sin duda, teniendo en cuenta la alta versatilidad y capacidad de adaptación que tiene el dispositivo. Otro punto débil del robot tiene que ver con la velocidad.
We also designed the system to adapt to various opponents by tracking their behaviors and playing style - such as which side of the table they tend to return the ball to.
— Google DeepMind (@GoogleDeepMind) August 8, 2024
This allows it to try different skills, monitor its success rate and adjust its strategy on the fly. pic.twitter.com/8TExTdKZ0v
DeepMind descubrió que el robot era incapaz de contrarrestar bolas y movimientos rápidos y concretos. Estas limitaciones, en palabras de la firma, obedecen a la latencia del sistema y a la necesidad del sistema de reiniciarse entre disparos y situaciones donde no puede encontrar datos útiles. La solución podría estar en algoritmos de control avanzados y en determinadas optimizaciones de hardware, dicen los investigadores.
Explican que la inclusión de estos elementos "podría incluir la exploración de modelos predictivos para anticipar las trayectorias de las pelotas". También explorarán la implementación de "protocolos de comunicación más rápidos entre los sensores y actuadores del robot". Estos aspectos causaron problemas a la hora de pelear con jugadores de muy alto nivel.
Todos estos hallazgos sirven como demostración, a juicio de Google, para proporcionar entornos ideales en los que probar capacidades robóticas de distinta índole, mucho más allá del deporte del ping pong en sí. Creen que esta investigación podría aplicarse a simulaciones de operabilidad en deportes reales, y así mejorar la capacidad de adaptabilidad de estos robots en tiempo real.