Investigadores del prestigioso instituto logran un avance significativo al crear un sistema que combina datos heterogéneos para entrenar robots, superando en un 20% los métodos tradicionales.
Un equipo de investigadores del Instituto Tecnológico de Massachusetts (MIT) ha desarrollado una innovadora técnica que promete transformar la manera en que se entrenan los robots de propósito general, acercándonos un paso más al sueño de tener asistentes robóticos versátiles como el legendario Rosie de «Los Supersónicos».
La revolución del aprendizaje robótico
La nueva metodología, denominada Transformadores Pretrenados Heterogéneos (HPT, por sus siglas en inglés), permite combinar grandes cantidades de datos provenientes de diversas fuentes en un sistema unificado.
Este enfoque revolucionario reduce significativamente los costos y tiempos de entrenamiento, mientras mejora la adaptabilidad de los robots a nuevas tareas.
Rendimiento superior demostrado
«En robótica, la gente suele afirmar que no tenemos suficientes datos de entrenamiento. Pero desde mi punto de vista, otro gran problema es que los datos provienen de tantos dominios, modalidades y hardware robótico diferentes», explica Lirui Wang, estudiante graduado de ingeniería eléctrica y ciencias de la computación del MIT y autor principal del estudio.
Los resultados son contundentes: las pruebas demostraron una mejora de más del 20% en el rendimiento tanto en simulaciones como en experimentos del mundo real, comparado con los métodos tradicionales de entrenamiento desde cero.
Base de datos masiva
El sistema se entrenó con una impresionante base de datos que incluye:
- 52 conjuntos de datos diferentes
- Más de 200,000 trayectorias robóticas
- 4 categorías principales de información
- Videos de demostraciones humanas
- Datos de simulación
Inspiración en modelos de lenguaje
La técnica se inspiró en el éxito de los grandes modelos de lenguaje como GPT-4, adaptando el concepto de pretrenamiento masivo al dominio robótico.
«Nuestro sueño es tener un cerebro robótico universal que se pueda descargar y usar en cualquier robot sin necesidad de entrenamiento adicional», señala Wang.
Financiamiento y futuro
El proyecto, financiado en parte por Amazon Greater Boston Tech Initiative y Toyota Research Institute, continúa en desarrollo.
Los investigadores buscan mejorar el sistema para que pueda procesar datos no etiquetados, similar a como lo hacen los modelos de lenguaje actuales.