Veo 3 di Google DeepMind genera video e audio sincronizzati con l'IA
Al Google I/O 2025, Google ha svelato Flow, un nuovo strumento di generazione video basato su Imagen (ora alla sua quarta versione), Gemini e Veo. Il punto forte è stato Veo 3, sviluppato da Google DeepMind, che per la prima volta genera sia video che audio sincronizzato—inclusi effetti sonori, rumori ambientali e dialoghi—da prompt complessi. Demis Hassabis, CEO di Google DeepMind, ha dichiarato: "Per la prima volta, usciamo dall'era del muto nella generazione video." Veo 3 solleva preoccupazioni note: la provenienza dei dati di addestramento (probabilmente da YouTube, anche se Google non lo ha confermato esplicitamente), i rischi di deepfake mitigati dal watermarking SynthID e il potenziale spostamento di posti di lavoro nelle industrie creative.
Fatti principali
- Google ha annunciato Flow e Veo 3 al Google I/O 2025.
- Veo 3 genera video e audio sincronizzati da prompt complessi.
- Demis Hassabis è CEO di Google DeepMind.
- Veo 3 utilizza i modelli Imagen 4, Gemini e Veo.
- I dati di addestramento potrebbero includere contenuti di YouTube.
- I video sono filigranati per il rilevamento tramite SynthID Detector.
- Veo 3 solleva preoccupazioni su deepfake e spostamento di posti di lavoro.
- TechCrunch ha riportato l'annuncio.
Entità
Artisti
- Demis Hassabis
Istituzioni
- Google DeepMind
- TechCrunch
- Artribune