Google DeepMind Lancia Gemini Omni Flash con Generazione Video

ai-technology · 2026-05-19

Google DeepMind ha presentato Gemini Omni Flash, il primo modello della famiglia Omni, in grado di generare e modificare video a partire da qualsiasi combinazione di input, tra cui testo, immagini, audio e video. Il modello si basa sulle capacità di generazione e modifica di immagini Nano Banana dello scorso anno. Omni Flash utilizza il ragionamento multimodale di Gemini per comprendere fisica, contesto culturale e conoscenze del mondo reale, consentendo funzionalità come modifica coerente dei personaggi, scene fisicamente accurate e video esplicativi. Gli utenti possono modificare i video attraverso conversazioni in linguaggio naturale, con modifiche che si basano sulle istruzioni precedenti. Il modello supporta riferimenti di input per il trasferimento di stile, movimento o personaggio. Tutti i video generati includono la filigrana digitale SynthID. Il lancio è iniziato oggi per gli abbonati a Google AI Plus, Pro e Ultra a livello globale tramite l'app Gemini e Google Flow, e senza costi per gli utenti di YouTube Shorts e YouTube Create App a partire da questa settimana. L'accesso API per sviluppatori e aziende seguirà nelle prossime settimane. Le modalità di output audio sono previste per una versione futura.

Fatti principali

Gemini Omni Flash è il primo modello della famiglia Omni.
Può generare e modificare video da qualsiasi combinazione di testo, immagini, audio e video.
Il modello si basa su Nano Banana, introdotto lo scorso anno per la generazione e modifica di immagini.
Omni Flash utilizza il ragionamento multimodale di Gemini per fisica, storia, scienza e contesto culturale.
Gli utenti possono modificare i video attraverso conversazioni in linguaggio naturale con personaggi coerenti e fisica realistica.
I riferimenti di input consentono il trasferimento di stile, movimento o personaggio da immagini, video o audio.
Tutti i video generati includono la filigrana digitale SynthID.
Il lancio è iniziato oggi per gli abbonati a Google AI Plus, Pro e Ultra a livello globale tramite l'app Gemini e Google Flow.
L'accesso gratuito per gli utenti di YouTube Shorts e YouTube Create App inizia questa settimana.
L'accesso API per sviluppatori e aziende sarà disponibile nelle prossime settimane.

Entità

Istituzioni

Google DeepMind
Google
YouTube
TechCrunch
Luma AI
OpenAI

Fonti

TechCrunch AI — 2026-05-19
Google DeepMind — 2026-05-17