FaithfulFaces: Framework AI per l'Identità Fedele alla Posa nella Generazione Video
I ricercatori hanno introdotto FaithfulFaces, un nuovo framework per la generazione testo-video con preservazione dell'identità (IPT2V) che affronta la distorsione dell'identità in caso di grandi variazioni di posa e occlusioni. Il sistema utilizza un allineatore di identità condiviso per la posa con un dizionario e un vincolo di invarianza tra variazione di posa e identità per mantenere un'identità facciale coerente in scene dinamiche. Incorporando embedding espliciti degli angoli di Eulero, crea un prior facciale fedele alla posa per una generazione robusta. Il lavoro è dettagliato in un preprint su arXiv (2605.04702) e mira a miglioramenti nella creazione di video dinamici complessi.
Fatti principali
- FaithfulFaces è un framework di apprendimento per la preservazione dell'identità facciale fedele alla posa.
- Migliora la generazione testo-video con preservazione dell'identità (IPT2V).
- Il framework utilizza un allineatore di identità condiviso per la posa.
- Include un dizionario condiviso per la posa e un vincolo di invarianza tra variazione di posa e identità.
- Vengono utilizzati embedding espliciti degli angoli di Eulero per la rappresentazione globale della posa facciale.
- Il sistema affronta la distorsione dell'identità in caso di grandi variazioni di posa e occlusioni.
- La ricerca è pubblicata come preprint arXiv 2605.04702.
- Il framework è mirato a scene dinamiche complesse nella generazione video.
Entità
Istituzioni
- arXiv