Esta Inteligencia Artificial aprendió sola a jugar a Super Mario World
MarI/O es una inteligencia artificial que ha aprendido a jugar a Super Mario World por ella misma, aprendiendo poco a poco de sus errores.
14 junio, 2015 19:05Noticias relacionadas
- Tomar curvas peligrosas con la moto será menos peligroso con esta IA avisándonos
- Cámaras y accesorios de 13.000 dólares por 100 dólares, el costoso error de Amazon en el Prime Day
- Crean una computadora dentro de un juego de construir ciudades... y funciona a base de caca
- El cofundador de Siri se une al equipo de Sherpa, el asistente inteligente español
Jugar a Super Mario World ha sido toda una experiencia para esta Inteligencia Artificial.
Cuando jugamos a un videojuego, pasamos por un periodo de aprendizaje en el que nos hacemos a los controles y nos damos cuenta de cuáles son las reglas. Es algo instintivo, pero para un ordenador es muy difícil.
El aprendizaje automático es una de las ramas del desarrollo de IA que más está avanzando en los últimos años, y busca implementar ese método de aprendizaje en los ordenadores para que puedan hacer cosas sin que les tengamos que decir explícitamente cómo se hacen.
Cómo un ordenador consiguió jugar a Super Mario World aprendiendo poco a poco
MarI/O es un ejemplo de este tipo de desarrollos, centrado en aprender a jugar a Super Mario World para Super Nintendo. Aunque en este caso esta IA se ha creado más por diversión y para demostrar las capacidades de estos sistemas, es una buena demostración de hasta qué punto han avanzado las redes neuronales en las que se basa este algoritmo.
No, no sirve de nada ver al ordenador jugando sólo, pero en este caso es más importante fijarse en el “cómo” que en el “qué”. Por ejemplo, MarI/O no ve la pantalla del juego como tú o como yo, sino que divide los elementos de la pantalla en bloques blancos (seguros y en los que puede aterrizar) y bloques negros (enemigos u obstáculos que no debería tocar).
Para aprende esto, MarI/O empieza como el peor de los jugadores: simplemente se queda quieto, pulsando un botón de vez en cuando y comprobando la reacción que produce; cuando pasa un tiempo sin ninguna acción, el control pasa a otra red neuronal. Tarde o temprano, llega una red neuronal que decide avanzar, generando más eventos y aprendiendo de ellos.
También hay otro factor importante, que el desarrollador ha llamado “fitness”, que depende de la distancia recorrida y el tiempo que ha tardado en recorrerla. De esta manera el sistema es capaz de saber qué redes neuronales obtienen el mejor resultado y partir de ellas para la siguiente generación. Para completar un nivel sin morir, se necesitó de 34 generaciones.
Este tipo de desarrollos demuestran el potencial del aprendizaje automático, aplicados a una tarea que es familiar para todo el mundo.