Scalabilità del Tracciamento del Movimento Umanoide con 42 Milioni di Parametri e 700 Ore di Dati MoCap
I ricercatori presentano SONIC, un modello fondamentale per il tracciamento del movimento di tutto il corpo umanoide che scala la dimensione della rete, il volume del dataset e la potenza di calcolo. Il modello, che va da 1,2 a 42 milioni di parametri, è addestrato su oltre 100 milioni di fotogrammi provenienti da 700 ore di dati di motion capture utilizzando 21.000 ore GPU. Questa scalabilità produce un controllore generalista in grado di eseguire movimenti naturali e robusti senza ingegneria manuale delle ricompense. Il lavoro dimostra che le leggi di scala si applicano al controllo umanoide, consentendo applicazioni in tempo reale.
Fatti principali
- SONIC scala la capacità del modello da 1,2 a 42 milioni di parametri
- Addestrato su oltre 100 milioni di fotogrammi da 700 ore di motion capture
- Utilizza 21.000 ore GPU di calcolo
- Ottiene movimenti naturali di tutto il corpo senza ingegneria manuale delle ricompense
- Dimostra i benefici della scalabilità per il controllo umanoide
- Consente il tracciamento del movimento in tempo reale
- Pubblicato su arXiv con ID 2511.07820
- Sostituisce cross con replace-cross come tipo di annuncio
Entità
Istituzioni
- arXiv