Overblog
Seguir este blog
Edit post Administration Create my blog
25 febrero 2015 3 25 /02 /febrero /2015 15:25

Demis Hassabis et al. "Human-level control through deep reinforcement learning". Nature (25 de febrero de 2015)

El ordenador superó a personas profesionales en más de la mitad de los videojuegos analizados, como Space Invaders. / Taito Corporation
El ordenador superó a personas profesionales en más de la mitad de los videojuegos analizados, como Space Invaders. / Taito Corporation

.

Un ordenador aprende a jugar a videojuegos por sí mismo gracias a una red neuronal artificial


Investigadores de la empresa Deep Mind, del gigante Google, han creado un algoritmo capaz de aprender a superar juegos clásicos de la videoconsola Atari 2600, como Space Invaders o el comecocos, a partir de una información mínima. Frente a un probador humano profesional, el nuevo agente artificial logró más del 75% de la puntuación en más de la mitad de los juegos.

agenciasinc.es

Para los seres humanos es fácil aprender a controlar un videojuego. La experiencia anterior con la máquina o en la propia vida sirve de ayuda para superar pantallas. ¿Pero un ordenador puede hacer lo mismo? Demis Hassabis y su equipo de investigadores en Inteligencia Artificial de la empresa Deep Mind, de Google, se propusieron el reto de crear un algoritmo que permitiera a una computadora aprender por sí sola, sin apenas información previa.

“Su rendimiento se puede comparar con el de un probador profesional humano de videojuegos" aseguran los investigadores

Hasta ahora, el método que habían empleado los ingenieros computacionales era el aprendizaje por refuerzo, basado en el estímulo y la recompensa pero que, según los investigadores, “es limitado en situaciones complejas y su aplicación se limita a los entornos controlables”.

La novedad que aportan los investigadores de Deep Mind es la combinación de este tipo de aprendizaje con una red neuronal artificial a imagen y semejanza de las biológicas. El resultado, publicado en la revista Nature, es un algortimo denominado deep Q-network (DQN) surgido a partir de un aprendizaje por refuerzo 'profundo'.

El estudio muestra que este agente artificial ha aprendido por sí mismo a jugar a 49 videojuegos clásicos de la videoconsola Atari 2600, entre los que se encuentran Pacman (el popular comecocos) o Space Invaders, partiendo de información sobre los píxeles y el número de acciones posibles en cada juego.

“Usamos los mismos datos iniciales para todos los juegos, lo que demuestra que el agente aprende con éxito los procedimientos de cada uno basándose únicamente en las entradas sensoriales”, explican los investigadores.

Capaz de vencer a seres humanos

La máquina superó las puntuaciones de sus predecesoras en 43 de los 49 videojuegos. Pero sus logros no se quedan ahí, según los autores: “Su rendimiento se puede comparar con el de un probador profesional humano de videojuegos. Logró más del 75% de la puntuación humana en más de la mitad de los juegos”.

El método destacó en actividades de índole muy variada, desde los juegos de boxeo a los de carreras de coches en 3D, “lo que demuestra que utilizando la misma arquitectura, la máquina puede aprender a optimizar estrategias en diferentes ambientes”.

Para los investigadores, este algoritmo también puede ayudar a los científicos a entender el proceso de aprendizaje de las personas. Asimismo, esperan que ayude crear productos más útiles, como “mejorar el motor de búsqueda de Google para completar tareas complejas como, por ejemplo, planear un viaje”.

Referencia bibliográfica:

Demis Hassabis et al. "Human-level control through deep reinforcement learning". Nature (25 de febrero de 2015)

Schematic illustration of the convolutional neural network.

Schematic illustration of the convolutional neural network.

The details of the architecture are explained in the Methods. The input to the neural network consists of an 84 × 84 × 4 image produced by the preprocessing map , followed by three convolutional layers…

Compartir este post

Published by Malcolm Allison H malcolm.mallison@gmail.com - en Ciencias Innovación Tecnología
Comenta este artículo

Comentarios

Présenta

  • : cinabrio blog
  • cinabrio blog
  • : Ecología y sostenibilidad socioambiental, énfasis en conservación de ríos y ecosistemas, denuncia de impacto de megaproyectos. Todo esto es indesligable de la política y por ello esta también se observa. Ecology, social and environmental sustainability, emphasis on conservation of rivers and ecosystems, denounces impact of megaprojects. All this is inseparable from politics, for it, the politics is also evaluated.
  • Contacto

Perfil

  • Malcolm Allison H malcolm.mallison@gmail.com
  • Biólogo desde hace más de treinta años, desde la época en que aún los biólogos no eran empleados de los abogados ambientalistas. Actualmente preocupado …alarmado en realidad, por el LESIVO TRATADO DE(DES)INTEGRACIÓN ENERGÉTICA CON BRASIL
  • Biólogo desde hace más de treinta años, desde la época en que aún los biólogos no eran empleados de los abogados ambientalistas. Actualmente preocupado …alarmado en realidad, por el LESIVO TRATADO DE(DES)INTEGRACIÓN ENERGÉTICA CON BRASIL

Recherche

Liens