Google DeepMind Lancia Gemini Omni Flash con Generazione Video
Google DeepMind ha presentato Gemini Omni Flash, il primo modello della famiglia Omni, in grado di generare e modificare video a partire da qualsiasi combinazione di input, tra cui testo, immagini, audio e video. Il modello si basa sulle capacità di generazione e modifica di immagini Nano Banana dello scorso anno. Omni Flash utilizza il ragionamento multimodale di Gemini per comprendere fisica, contesto culturale e conoscenze del mondo reale, consentendo funzionalità come modifica coerente dei personaggi, scene fisicamente accurate e video esplicativi. Gli utenti possono modificare i video attraverso conversazioni in linguaggio naturale, con modifiche che si basano sulle istruzioni precedenti. Il modello supporta riferimenti di input per il trasferimento di stile, movimento o personaggio. Tutti i video generati includono la filigrana digitale SynthID. Il lancio è iniziato oggi per gli abbonati a Google AI Plus, Pro e Ultra a livello globale tramite l'app Gemini e Google Flow, e senza costi per gli utenti di YouTube Shorts e YouTube Create App a partire da questa settimana. L'accesso API per sviluppatori e aziende seguirà nelle prossime settimane. Le modalità di output audio sono previste per una versione futura.
Fatti principali
- Gemini Omni Flash è il primo modello della famiglia Omni.
- Può generare e modificare video da qualsiasi combinazione di testo, immagini, audio e video.
- Il modello si basa su Nano Banana, introdotto lo scorso anno per la generazione e modifica di immagini.
- Omni Flash utilizza il ragionamento multimodale di Gemini per fisica, storia, scienza e contesto culturale.
- Gli utenti possono modificare i video attraverso conversazioni in linguaggio naturale con personaggi coerenti e fisica realistica.
- I riferimenti di input consentono il trasferimento di stile, movimento o personaggio da immagini, video o audio.
- Tutti i video generati includono la filigrana digitale SynthID.
- Il lancio è iniziato oggi per gli abbonati a Google AI Plus, Pro e Ultra a livello globale tramite l'app Gemini e Google Flow.
- L'accesso gratuito per gli utenti di YouTube Shorts e YouTube Create App inizia questa settimana.
- L'accesso API per sviluppatori e aziende sarà disponibile nelle prossime settimane.
Entità
Istituzioni
- Google DeepMind
- YouTube
- TechCrunch
- Luma AI
- OpenAI