Un cerebro similar al humano ayuda a un robot a salir de un laberinto

Vea También

 

Un cerebro similar al humano ayuda a un robot a salir de un laberinto
El robot Lego Mindstorms EV3 está equipado con un cerebro orgánico neuromórfico. Crédito: TU/e

El aprendizaje automático y las redes neuronales se han convertido en un campo apasionante en los últimos tiempos. Teniendo en cuenta su éxito en el diagnóstico médico, el comercio electrónico y otras áreas, se han hecho más populares.

El enfoque de la inteligencia artificial basado en el software tiene un importante inconveniente: consume mucha energía para entrenar los algoritmos.

Este problema de potencia es una de las principales razones por las que los investigadores trabajan en la computación de bajo consumo.

Cuando se trata de soluciones de eficiencia energética, todos se inspiran en el cerebro humano. Funciona de forma muy eficiente con poca energía tanto para la memoria como para el procesamiento.

Un laberinto es un dispositivo muy popular que los psicólogos utilizan para evaluar la capacidad de aprendizaje de ratones o ratas.

Investigadores de la Universidad Tecnológica de Eindhoven (TU/e) y del Instituto Max Planck de Investigación de Polímeros de Maguncia (Alemania) han demostrado que los robots pueden recorrer con éxito los vericuetos de un laberinto.

El estudio, publicado en Science Advances, abre el camino a nuevas e interesantes aplicaciones de los dispositivos neuromórficos en el ámbito de la salud y otros.

Las neuronas de nuestro cerebro se comunican a través de sinapsis, que se refuerzan cada vez que la información fluye a través de ellas. Esta plasticidad es la que garantiza que los seres humanos recuerden y aprendan.

"En nuestra investigación, hemos tomado este modelo para desarrollar un robot que sea capaz de aprender a moverse por un laberinto", explica Imke Krauhausen, estudiante de doctorado en el Departamento de Ingeniería Mecánica de la TU/e y principal autora del trabajo.

"Al igual que una sinapsis en el cerebro de un ratón se refuerza cada vez que da la vuelta correcta en un laberinto psicológico, nuestro dispositivo se "afina" aplicando una determinada cantidad de electricidad. Al afinar la resistencia del dispositivo, se modifica el voltaje que controla los motores. Estos, a su vez, determinan si el robot gira a la derecha o a la izquierda".

Krauhausen y sus colegas utilizaron el robot de investigación Mindstorms EV3, un kit de robótica fabricado por Lego. Equipado con dos ruedas, un software de guiado tradicional para asegurarse de que puede seguir una línea y una serie de sensores de reflexión y tacto, lo enviaron a un laberinto de 2 m*m de tamaño formado por hexágonos de líneas negras en un patrón similar a un panal.

Navegación en el laberinto hacia la salida. (A) Evolución del entrenamiento dentro del laberinto, visualizada como trayectorias. Después de cada paso de entrenamiento (n = 1 a 16), el robot aprende gradualmente a seguir una trayectoria objetivo a través de las señales de navegación hacia la salida del laberinto. (B) Finalización de la trayectoria objetivo 1 dentro del laberinto, una vez establecida la asociación visuomotora (paso de entrenamiento n = 16). (C) Generalización del proceso de aprendizaje en otra ruta arbitraria (ejemplo de la ruta objetivo 2). Fotografía: Imke Krauhausen, Instituto Max Planck para la Investigación de Polímeros.
Navegación en el laberinto hacia la salida. (A) Evolución del entrenamiento dentro del laberinto, visualizada como trayectorias. Después de cada paso de entrenamiento (n = 1 a 16), el robot aprende gradualmente a seguir una trayectoria objetivo a través de las señales de navegación hacia la salida del laberinto. (B) Finalización de la trayectoria objetivo 1 dentro del laberinto, una vez establecida la asociación visuomotora (paso de entrenamiento n = 16). (C) Generalización del proceso de aprendizaje en otra ruta arbitraria (ejemplo de la ruta objetivo 2). Fotografía: Imke Krauhausen, Instituto Max Planck para la Investigación de Polímeros.

El robot está programado para girar a la derecha por defecto. Cada vez que llegue a un callejón sin salida o se desvíe de la ruta designada para la salida (indicada por señales visuales), volverá o girará a la izquierda como se le ha enseñado. Entonces recordará el estímulo corrector en el dispositivo neuromórfico para el siguiente esfuerzo.

"Al final, nuestro robot tardó 16 carreras en encontrar la salida con éxito", dice Krauhausen. "Y, lo que es más, una vez que ha aprendido a navegar por esta ruta específica, puede navegar por cualquier otra ruta que se le indique de una sola vez (ruta objetivo 2). Así que los conocimientos que ha adquirido son generalizables".

Parte del éxito de la capacidad del robot para aprender y salir del laberinto radica en la singular integración de sensores y motores, según Krauhausen, que colaboró estrechamente con el Instituto Max Planck de Investigación de Polímeros de Maguncia para esta investigación. "Esta integración sensoriomotora, en la que los sentidos y el movimiento se refuerzan mutuamente, es también en gran medida la forma en que opera la naturaleza, así que esto es lo que intentamos emular en nuestro robot".

Otro aspecto inteligente de la investigación es el material orgánico utilizado para el robot neuromórfico. Este polímero (conocido como p(g2T-TT)) no solo es estable, sino que también puede "retener" gran parte de los estados específicos en los que se ha afinado durante las distintas carreras por el laberinto. Esto garantiza que el comportamiento aprendido se "pegue", al igual que las neuronas y sinapsis de un cerebro humano, que recuerdan eventos o acciones.

Paschalis Gkoupidenis, del Instituto Max Planck para la Investigación de Polímeros de Maguncia, y Yoeri van de Burgt, de la Universidad Técnica, fueron pioneros en el uso de polímeros en lugar de silicio en la computación neuromórfica. Ambos son coautores del artículo.

Sus investigaciones (que datan de 2015 y 2017) demostraron que el material podía ajustarse en un rango de conducción mucho mayor que el de los materiales inorgánicos.

Puede "recordar" o almacenar los estados aprendidos durante periodos prolongados. Desde entonces, los dispositivos orgánicos se han convertido en un tema candente en las redes neuronales artificiales basadas en hardware.

Los materiales poliméricos también tienen la ventaja de utilizarse en numerosas aplicaciones biomédicas. "Debido a su naturaleza orgánica, estos dispositivos inteligentes pueden, en principio, integrarse con células nerviosas reales. Supongamos que se pierde el brazo durante una lesión. Entonces podrías utilizar estos dispositivos para conectar tu cuerpo con una mano biónica", dice Krauhausen.

Otra aplicación prometedora de la computación neuromórfica orgánica es la de los pequeños dispositivos informáticos de borde, en los que los datos de los sensores se procesan localmente fuera de la nube. Van de Burgt: "Aquí es donde veo que van a ir nuestros dispositivos en el futuro, nuestros materiales serán muy útiles porque son fáciles de afinar, utilizan mucha menos energía y son baratos de fabricar".

Entonces, ¿podrán algún día los robots neuromórficos jugar un partido de fútbol, como los exitosos robots de fútbol de TU/e?

Krauhausen: "En principio, eso es ciertamente posible. Pero hay un largo camino por recorrer. Nuestros robots siguen dependiendo en parte del software tradicional para moverse. Y para que los robots neuromórficos ejecuten tareas realmente complejas, necesitamos construir redes neuromórficas en las que muchos dispositivos trabajen juntos en una red. Es algo en lo que trabajaré en la siguiente fase de mi investigación de doctorado".

Fuentes, créditos y referencias:

Imke Krauhausen et al, Organic neuromorphic electronics for sensorimotor integration and learning in robotics, Science Advances (2021). DOI: 10.1126/sciadv.abl5068

Artículo Anterior Artículo Siguiente

Anuncio publicitario

Reciba actualizaciones por Telegram

¡Únete a nuestro canal de WhatsApp para recibir actualizaciones!