Los robots ya pueden ser más listos que tú en el juego del pilla-pilla

Añadir a tus IAs favoritasQuitar de tus favoritasQuitar de favoritos 0
Puntuación0

2023-09-05 14:26:46

Un nuevo método enseña a los robots la «persecución basada en la visión». En resumen, ahora los robots pueden perseguir a los humanos.

Investigadores de la Universidad de Berkeley han desarrollado un nuevo método para enseñar a los robots a tomar decisiones estratégicas en tareas dinámicas como jugar al pilla-pilla. En lugar de limitarse a seguir a una persona o a otro robot, el robot les corta el paso y los busca activamente.

Aprender este tipo de comportamientos en el mundo real es extremadamente difícil para un robot porque tiene un conocimiento limitado de su entorno y de otros agentes a través de sus sensores, los objetivos de otros agentes no están claros y el movimiento en el mundo físico es fundamentalmente más difícil que en las simulaciones.

Por lo tanto, el aprendizaje directo de tales comportamientos, por ejemplo a través del aprendizaje por refuerzo, ha fracasado debido a estos requisitos.

Un robot perro aprende de un maestro omnisciente de IA

Así que el equipo está utilizando un enfoque diferente llamado «aprendizaje privilegiado». Se trata de una forma de aprendizaje supervisado en el que un profesor que dispone de información adicional ayuda a un alumno que no la tiene.

En el caso de los robots, esto significa que el profesor robot utiliza la trayectoria futura del evasor para deducir las intenciones de éste. Equipado con esta información privilegiada, el robot profesor puede guiar al robot alumno paso a paso sobre las acciones que debe realizar. El complejo problema de la planificación se convierte así en un sencillo problema de aprendizaje supervisado para el alumno.

A pesar de la simplicidad del método, el robot aprende comportamientos dinámicos, como reducir su velocidad cuando el evasor gira, o interceptarlo prediciendo dónde estará.

Los investigadores probaron su método en un robot real de cuatro patas que jugaba al pilla-pilla con humanos y otros robots, basándose únicamente en las cámaras y la propiocepción incorporadas.

El robot real también mostraba los complejos comportamientos que el modelo subyacente había aprendido en la simulación.

Hasta ahora, el sistema no puede enfrentarse a obstáculos; para ello, necesita un entrenamiento más exhaustivo de la IA y mejores sensores, explican los investigadores.

Más información en página del proyecto.

Deja una opinión

      Deje una respuesta

      🤖 AI MAFIA
      Logo