Vea También
Los científicos del CSAIL idearon un sistema de aprendizaje para el robot de cuatro patas que aprende a correr totalmente por ensayo y error en la simulación. Crédito: MIT |
En los últimos años, los robots cuadrúpedos inspirados en el movimiento de los
guepardos y otros animales han dado grandes saltos. Ahora estas máquinas
pueden caminar, bailar, evitar obstáculos y abrir la puerta. Pero siguen
estando por detrás de sus homólogos mamíferos cuando se trata de correr a gran
velocidad y desplazarse por diferentes terrenos, lo que resulta algo más
complicado para los robots.
Los investigadores del Laboratorio de
IA Improbable del MIT, que forma parte del Laboratorio de Ciencias de la
Computación e Inteligencia Artificial (CSAIL), han estado trabajando en las
zancadas rápidas de un mini-cheta robótico. El equipo ha desarrollado
ahora un sistema de aprendizaje por refuerzo sin modelos que permite al mini
guepardo del MIT aprender a correr rápido y adaptarse a caminar por terrenos
difíciles.
Programar un robot para que se mueva más rápido y con
más confianza por terrenos variados y cambie su forma de andar y su velocidad
cuando haya identificado una transición es sencillamente muy difícil. El
proceso es tedioso porque si un robot fallara en un terreno concreto, un
ingeniero humano tendría que identificar la causa del fallo y modificar y
actualizar manualmente el programa para adaptarlo a los cambios. Se trata de
un proceso que lleva mucho tiempo y que inevitablemente hace que el robot
falle cada vez que se encuentra con algo nuevo.
Un enfoque mejor es el aprendizaje por ensayo y error,
que elimina la necesidad de que un humano especifique con precisión cómo debe
comportarse el robot en cada situación. Esto funcionaría si - el robot pudiera
experimentar una amplísima gama de terrenos. El robot puede modificar y
alterar automáticamente su comportamiento y sus movimientos por sí mismo
cuando se encuentra con un nuevo terreno.
El nuevo enfoque basado
en el aprendizaje permite que el robot aprenda a funcionar en un simulador,
utilizando una simple red neuronal como controlador. Gracias a las modernas
herramientas de simulación, un robot puede acumular 100 días de experiencia en
diversos terrenos en sólo tres horas de tiempo real. El comportamiento del
robot mejora a partir de la experiencia simulada y el nuevo enfoque permite,
de forma crítica, desplegar con éxito esos comportamientos aprendidos en el
mundo real.
El robot de cuatro patas puede adaptarse a terrenos
inestables como la grava y recuperarse de tropiezos y colisiones con
obstáculos. Como se ve en el vídeo siguiente, el nuevo sistema también puede
adaptarse a cambios en el propio robot, como una pata discapacitada.
Este
método basado en el aprendizaje supera a los anteriores diseñados por el ser
humano y permite al Mini Cheetah establecer un récord de velocidad. El sistema
permitió al minigueta del MIT correr hasta 3,9 m/s, lo que, según los
investigadores, es la mayor velocidad registrada hasta la fecha. Además, el
robot puede girar a gran velocidad, incluso en terrenos resbaladizos como el
hielo.
Lograr una marcha rápida requiere llevar el hardware a sus
límites, cambiando la dinámica del robot. El controlador del MIT se adapta a
este cambio en la dinámica del hardware.
El nuevo enfoque no se
limita a enseñar a los robots a correr. Los investigadores ya han empezado a
aplicar este paradigma a otros sistemas robóticos, como las manos robóticas,
que pueden recoger y manipular muchos objetos diferentes.
Fuentes, créditos y referencias:
Fuente: MIT