Los ordenadores ya pueden resolver cubos de Rubik sin ayuda de humanos
Un nuevo sistema capaz de resolver cubos de Rubik sin ayuda de humanos ni saber cómo ganar puede revolucionar el sector del aprendizaje automático.
15 junio, 2018 18:49Noticias relacionadas
- Tomar curvas peligrosas con la moto será menos peligroso con esta IA avisándonos
- El cofundador de Siri se une al equipo de Sherpa, el asistente inteligente español
- En Japón ya tienen "consignas para redes sociales", que te bloquean la cuenta el tiempo que quieras desconectar
- Por primera vez, un servicio de música online promete la calidad de sonido de los máster
Un estudio ha conseguido crear un sistema capaz de resolver cubos de Rubik sin ningún tipo de ayuda de parte de humanos.
El cubo de Rubik sigue atrayendo a aquellos que quieren romper los límites de lo que es posible con las máquinas. Mientras los seres humanos aún nos sorprendemos cuando alguien consigue resolver el rompecabezas en segundos, las máquinas ya están raspando milésimas de segundo al proceso. De hecho, podrían ir más rápidas, pero entonces el cubo explotaría.
Sin embargo, hay que tener en cuenta que todas estas IAs, todos estos sistemas “inteligentes”, partían de una gran ventaja: alguien les había enseñado cómo ganar.
El sistema capaz de resolver cubos de Rubik sin ayuda
Si diseñas una máquina para una tarea específica, es evidente que lo hará mejor que cualquier ser humano en poco tiempo; al fin y al cabo, “sólo” tienes que enseñarle las condiciones para “ganar” y los pasos que tiene que dar para llegar esa victoria.
Pero, ¿y si las máquinas no tuviesen esa ventaja? ¿Y si no supieran qué es lo que tienen que hacer? Eso es lo que ha investigado el departamento de ciencias de la computación de la Universidad de California, en un estudio en el que han comprobado hasta qué punto una máquina puede aprender sin conocimientos previos.
La gran diferencia de su sistema de aprendizaje automático para resolver cubos de Rubik respecto a otros, es que el suyo ha partido desde cero.
Pongamos como ejemplo a AlphaGo, el sistema que consiguió vencer a los mejores jugadores de go del mundo. No partió de la nada, sino que los programadores le enseñaron cómo era el juego y las condiciones de victoria.
La mayoría de sistemas de aprendizaje automático funcionan con un sistema de “recompensas”. El sistema ejecuta el juego, y cada vez que gana o consigue una condición ventajosa, recibe una recompensa; de esa forma, la máquina puede distinguir entre jugar bien y jugar mal.
Con un cubo de Rubik este sistema no es viable, porque después de hacer un movimiento, la máquina no puede saber si lo ha hecho bien; es difícil saber si un movimiento es mejor que otro. Para solucionarlo, los ingenieros han creado una nueva técnica llamada “iteración autodidacta”.
Es decir, que el sistema es capaz de enseñarse a si mismo cómo jugar y ganar al juego, sin asistencia humana. Para ello, el programa crea su propio sistema de recompensas, y se las otorga cuando lo hace bien. Pero, ¿cómo sabe que está haciendo algo “bien”?
Para ello, el sistema en realidad parte de un cubo ya resuelto, yendo hacia atrás hasta llegar a un estado similar al movimiento que va a hacer; si lo consigue, es que el movimiento supone un paso más hacia la victoria, y se otorga una recompensa.
Por qué es importante un sistema que no necesita de humanos para funcionar
No es un sistema perfecto, pero es muy efectivo; según sus creadores, es capaz de resolver el 100% de los cubos aleatorios, con unos 30 movimientos de media. No está mal, teniendo en cuenta que se calcula que hacen falta 26 movimientos como mínimo para resolver un cubo de Rubik desde cualquier posición.
Pero lo importante es que es un resultado similar al que consiguen sistemas enseñados por humanos; y sus creadores creen que este sistema tiene más potencial de cara al futuro, sobre todo con problemas que no puedan ser perfectamente comprendidos por humanos, como las estructuras de proteínas.