Co-Director: Framework gerarchico multi-agente per lo storytelling video
Un nuovo studio introduce Co-Director, un approccio strutturato per aiutare più agenti a collaborare nella narrazione video, trattandola come un problema di ottimizzazione globale. Utilizza una strategia multi-armed bandit per esplorare possibilità creative, implementando anche un ciclo locale di auto-raffinamento che aiuta a mantenere la coerenza dell'identità dei personaggi durante la storia. Questa tecnica trova un buon equilibrio tra la sperimentazione di nuovi stili narrativi e l'uso di metodi efficaci. I ricercatori presentano anche GenAD-Bench, un dataset con 400 scenari che presentano prodotti fittizi per annunci personalizzati. I risultati mostrano che Co-Director migliora la coerenza semantica rispetto agli attuali sistemi basati su agenti, che spesso soffrono di deriva semantica. Puoi trovare l'articolo su arXiv con ID 2604.24842.
Fatti principali
- Co-Director è un framework gerarchico multi-agente per lo storytelling video
- Formalizza lo storytelling video come un problema di ottimizzazione globale
- Utilizza un multi-armed bandit per la direzione creativa globale
- Il ciclo locale di auto-raffinamento multimodale mitiga la deriva dell'identità
- Il dataset GenAD-Bench contiene 400 scenari di prodotti fittizi
- Il dataset è progettato per la valutazione della pubblicità personalizzata
- Affronta la deriva semantica e i guasti a cascata nelle pipeline attuali
- Pubblicato su arXiv con ID 2604.24842
Entità
Istituzioni
- arXiv