400 horas doblando toallas: así entrena Xiaomi a su robot para entender lo blando

«El objetivo no es solo mover piezas, sino hacerlo con sentido»: la apuesta robótica de Xiaomi

14 de febrero de 2026 a las 12:55h
400 horas doblando toallas: así entrena Xiaomi a su robot para entender lo blando
400 horas doblando toallas: así entrena Xiaomi a su robot para entender lo blando

Imagina un robot que no solo sigue instrucciones, sino que las entiende. Que ve una toalla arrugada en el suelo, la levanta con delicadeza, la estira con una sola mano y la dobla como lo haría una persona. O que desmonta una estructura de LEGO compleja, pieza por pieza, sin forzar ni romper nada. No estamos hablando de ciencia ficción ni de un prototipo secreto en un laboratorio remoto. Esto ya está aquí, y viene de un nombre que muchos asociamos con móviles y electrodomésticos Xiaomi.

El salto de Xiaomi al control motor inteligente

La compañía china acaba de presentar Xiaomi-Robotics-0, su primer modelo de inteligencia artificial especializado en visión, lenguaje y acción para robótica. Un trío clave ver, comprender y actuar. Pero más allá del nombre técnico, lo interesante es lo que implica. No es un simple algoritmo para reconocer imágenes. Es un sistema diseñado para que un robot entienda su entorno físico y tome decisiones en tiempo real. El objetivo no es solo mover piezas, sino hacerlo con sentido.

El modelo, con 4.700 millones de parámetros, ha sido entrenado con una base de datos masiva 200 millones de pasos de tiempo de trayectorias de robots, más de 80 millones de muestras de datos visión-lenguaje y cientos de horas de vídeos reales. Destacan especialmente las 338 horas de desmontaje de LEGOs y las 400 horas de doblado de toallas. Datos que suenan casi ridículos si no fuera porque, en robótica, estas tareas son verdaderos desafíos. Una toalla no tiene forma fija, cambia con cada arruga, cada pliegue, cada caída al suelo. Y eso, para una máquina, es un rompecabezas en constante movimiento.

Entender lo blando, dominar lo impredecible

La física de los objetos blandos es uno de los grandes dolores de cabeza en robótica. A diferencia de una pieza metálica o un bloque de plástico, una toalla no responde de forma predecible al tacto. Se deforma, se desliza, se enreda. Pero Xiaomi-Robotics-0 parece haber aprendido a lidiar con esa incertidumbre. Es capaz de adaptar la fuerza del agarre en tiempo real, ajustar la posición de los brazos y decidir cuándo soltar o reacomodar.

Uno de los ejemplos más reveladores es este si el robot recoge dos toallas del cesto, no intenta doblarlas juntas como un principiante torpe. En su lugar, deja una en su sitio y se centra en doblar solo una. Es una decisión simple para un humano, pero compleja para una máquina. Requiere percepción, razonamiento y autocontrol. Y eso es exactamente lo que busca el modelo evitar que un robot destroce lo que tiene entre las manos solo porque no entiende qué está tocando.

Resultados que hablan por sí mismos

  • Desmontar estructuras de LEGO de hasta 20 piezas sin dañar ninguna.
  • Doblar toallas de forma consistente, incluso cuando están arrugadas o parcialmente ocultas.
  • Tomar decisiones bimanuales coordinadas, como usar una mano para estirar y la otra para doblar.

Estos logros no son anécdotas. Se han validado en benchmarks reconocidos en la comunidad de robótica. En LIBERO, que mide la capacidad de transferir conocimiento entre tareas, el modelo ha mostrado una notable adaptabilidad. En SimplerEnv, un entorno de simulación realista, ha alcanzado altos niveles de rendimiento. Y en CALVIN, específicamente diseñado para evaluar tareas guiadas por lenguaje, ha demostrado que puede seguir instrucciones complejas con precisión.

Xiaomi afirma que el modelo alcanza tasas altas de éxito en estas pruebas, lo que sugiere que no se trata de un sistema frágil, sino de uno robusto. Y eso es clave si queremos que los robots salgan de los laboratorios y entren en nuestras fábricas, hospitales o casas.

Open source compartir para avanzar

Uno de los movimientos más significativos de Xiaomi es que ha liberado el código de Xiaomi-Robotics-0. Está disponible en GitHub y HuggingFace, plataformas clave para la comunidad de inteligencia artificial. Esto no es solo generosidad técnica. Es una apuesta por la colaboración abierta, por acelerar el progreso compartiendo herramientas.

En un campo donde muchas empresas guardan sus avances bajo llave, abrir el código permite que investigadores, desarrolladores y otras empresas prueben, mejoren y adapten el modelo. Puede sonar técnico, pero tiene una dimensión humana clara cuando el conocimiento circula, todos avanzamos más rápido.

¿Qué viene después?

Las aplicaciones potenciales van mucho más allá de las demostraciones con LEGOs y toallas. Xiaomi menciona escenarios futuros como la robótica industrial, donde robots podrían encargarse de tareas peligrosas como quitar escombros tras un derrumbe. O en cirugía, donde un sistema capaz de entender la física de tejidos blandos podría asistir en intervenciones delicadas.

Pero tal vez el cambio más palpable llegue a nuestros hogares. Imagina un robot que no solo limpia, sino que entiende lo que ve. Que distingue un adorno valioso de un objeto para recoger, que sabe que una manta no es basura y que una taza de café no debe caer al suelo. No es solo eficiencia. Es respeto por el entorno humano.

El lanzamiento de Xiaomi-Robotics-0 no significa que pronto tendremos robots domésticos tan hábiles como los humanos. Pero sí marca un antes y un después. Muestra que la inteligencia artificial ya no se limita a ganar partidas de ajedrez o escribir textos. Ahora también puede doblar una toalla, con cuidado, con paciencia, con sentido.

Y eso, en el fondo, es un pequeño paso para una máquina. Pero un gran salto para la robótica que quiere vivir entre nosotros.

Sobre el autor
Redacción
Ver biografía