mario inteligencia artificial 1

mario inteligencia artificial 1

Software

Esta Inteligencia Artificial aprendió sola a jugar a Super Mario World

MarI/O es una inteligencia artificial que ha aprendido a jugar a Super Mario World por ella misma, aprendiendo poco a poco de sus errores.

14 junio, 2015 19:05

Noticias relacionadas

Jugar a Super Mario World ha sido toda una experiencia para esta Inteligencia Artificial.

Cuando jugamos a un videojuego, pasamos por un periodo de aprendizaje en el que nos hacemos a los controles y nos damos cuenta de cuáles son las reglas. Es algo instintivo, pero para un ordenador es muy difícil.

El aprendizaje automático es una de las ramas del desarrollo de IA que más está avanzando en los últimos años, y busca implementar ese método de aprendizaje en los ordenadores para que puedan hacer cosas sin que les tengamos que decir explícitamente cómo se hacen.

Cómo un ordenador consiguió jugar a Super Mario World aprendiendo poco a poco

MarI/O es un ejemplo de este tipo de desarrollos, centrado en aprender a jugar a Super Mario World para Super Nintendo. Aunque en este caso esta IA se ha creado más por diversión y para demostrar las capacidades de estos sistemas, es una buena demostración de hasta qué punto han avanzado las redes neuronales en las que se basa este algoritmo.

No, no sirve de nada ver al ordenador jugando sólo, pero en este caso es más importante fijarse en el “cómo” que en el “qué”. Por ejemplo, MarI/O no ve la pantalla del juego como tú o como yo, sino que divide los elementos de la pantalla en bloques blancos (seguros y en los que puede aterrizar) y bloques negros (enemigos u obstáculos que no debería tocar).

mario inteligencia artificial 2

mario inteligencia artificial 2

Para aprende esto, MarI/O empieza como el peor de los jugadores: simplemente se queda quieto, pulsando un botón de vez en cuando y comprobando la reacción que produce; cuando pasa un tiempo sin ninguna acción, el control pasa a otra red neuronal. Tarde o temprano, llega una red neuronal que decide avanzar, generando más eventos y aprendiendo de ellos.

También hay otro factor importante, que el desarrollador ha llamado “fitness”, que depende de la distancia recorrida y el tiempo que ha tardado en recorrerla. De esta manera el sistema es capaz de saber qué redes neuronales obtienen el mejor resultado y partir de ellas para la siguiente generación. Para completar un nivel sin morir, se necesitó de 34 generaciones.

Este tipo de desarrollos demuestran el potencial del aprendizaje automático, aplicados a una tarea que es familiar para todo el mundo.