En Drone Racing, los pilotos humanos controlan aviones en miniatura a velocidades impresionantes a través de desafiantes circuitos desde una perspectiva en primera persona. Ahora, la IA está en la pole position, con una clara ventaja y pocas limitaciones.
Con Swift, investigadores de la Universidad de Zúrich e Intel presentan un dron de carreras autónomo que ha vencido a profesionales humanos en carreras de drones. Swift, un dron con IA equipado con cámaras y otros sensores, ganó cinco de nueve carreras contra Alex Vanover, cuatro de siete contra Thomas Bitmatta y seis de nueve contra Marvin Schaepper. En total, Swift ganó el 60% de las carreras.
No todas las carreras acabaron con victoria de la IA: El 40% de sus derrotas se debieron a colisiones con oponentes o puertas, y el 20% a velocidades inferiores a las de los pilotos humanos.
Superar los límites, pensar en el futuro
Las victorias de Swift siguen siendo notables. El dron de IA consiguió el mejor tiempo total de carrera, aunque no fuera más rápido en todas las secciones del circuito, superando al siguiente mejor humano (A. Vanover) por medio segundo. Los profesionales humanos tuvieron una semana para practicar en la pista.
¿Cómo supera Swift a los humanos? Para empezar, el dron tiene un tiempo de reacción más rápido durante el despegue. También mantiene una mayor velocidad en la primera curva y vuela más ajustado en los giros, una estrategia acertada que probablemente refleja la planificación a más largo plazo de Swift.
Los humanos siguen siendo más robustos
Swift también destaca en las pruebas contrarreloj cara a cara. El dron de IA se ajusta constantemente para alcanzar la velocidad máxima. Esto reduce la probabilidad de fluctuaciones en el tiempo por vuelta.
Los pilotos humanos, en cambio, varían más sus tiempos por vuelta porque ajustan su estrategia de vuelo en función de su posición en la carrera. Por ejemplo, si van en cabeza, los pilotos humanos pueden reducir la velocidad para evitar un accidente.
Swift no tiene ese lujo: el dron de IA persigue el mejor tiempo a la mayor velocidad, tanto si va en cabeza como si va detrás en la carrera.
A pesar del éxito de Swift, la robustez de los humanos es notable, señala el equipo de investigación. Los pilotos humanos pueden afrontar un accidente a toda velocidad y continuar la carrera mientras el dron siga intacto.
También son más capaces de adaptarse a los cambios en su entorno, como los cambios de iluminación, que pueden confundir al sistema de percepción de Swift.
Entrenamiento de IA en una simulación de realidad mejorada
Swift se basa en un sistema de percepción que interpreta lo que el dron ve y «siente» a través de sus sensores, y una estrategia de control que utiliza esta información para determinar el siguiente movimiento del dron.
El sistema de percepción es como los ojos y los sentidos del dron. Utiliza un módulo de Odometría Inercial Visual (VIO) que combina los datos recogidos por la cámara del dron con el movimiento y las características inerciales del mismo.
Esto le permite determinar dónde se encuentra en el mundo real. Paralelamente, una red neuronal especial detecta las esquinas de las puertas de carrera basándose en las imágenes de la cámara.
A continuación, mapea estas detecciones en el espacio 3D y combina esta información con las estimaciones de VIO de la posición del dron mediante un filtro matemático de Kalman.
Una vez que el dron sabe en qué parte del mundo se encuentra y dónde están las puertas de la carrera, entra en juego la estrategia de control.
Al igual que un piloto humano decidiría si volar hacia una meta o aumentar la velocidad, la estrategia de control decide lo que el dron debe hacer a continuación.
La estrategia, entrenada con aprendizaje profundo por refuerzo, recompensa a Swift por moverse hacia el centro de la siguiente puerta, al tiempo que garantiza que la siguiente puerta permanezca en el campo de visión del dron.
A pesar de las limitaciones restantes y del trabajo que queda por hacer, el hecho de que un robot móvil autónomo haya logrado un rendimiento de campeón mundial en un deporte físico popular es un hito para la robótica y la inteligencia artificial. Este trabajo puede inspirar el despliegue de soluciones basadas en el aprendizaje híbrido en otros sistemas físicos, como vehículos terrestres autónomos, aeronaves y robots personales, en una amplia gama de aplicaciones.
Del artículo
Uno de los mayores retos para el equipo de investigación fue averiguar cómo transferir las decisiones de control de la simulación virtual inicial de entrenamiento al mundo real.
Para abordar esta «brecha de realidad», la simulación se mejoró con modelos basados en datos que tienen en cuenta cómo percibe el dron su entorno y se mueve en el mundo real. Este ajuste adicional se basó en datos reales recogidos con el dron en la propia pista. Esto permitió a Swift aprender en la simulación y de la realidad.