ARTFEED — Contemporary Art Intelligence

Google DeepMind Lancia Gemini Omni Flash con Generazione Video

ai-technology · 2026-05-19

Google DeepMind ha presentato Gemini Omni Flash, il primo modello della famiglia Omni, in grado di generare e modificare video a partire da qualsiasi combinazione di input, tra cui testo, immagini, audio e video. Il modello si basa sulle capacità di generazione e modifica di immagini Nano Banana dello scorso anno. Omni Flash utilizza il ragionamento multimodale di Gemini per comprendere fisica, contesto culturale e conoscenze del mondo reale, consentendo funzionalità come modifica coerente dei personaggi, scene fisicamente accurate e video esplicativi. Gli utenti possono modificare i video attraverso conversazioni in linguaggio naturale, con modifiche che si basano sulle istruzioni precedenti. Il modello supporta riferimenti di input per il trasferimento di stile, movimento o personaggio. Tutti i video generati includono la filigrana digitale SynthID. Il lancio è iniziato oggi per gli abbonati a Google AI Plus, Pro e Ultra a livello globale tramite l'app Gemini e Google Flow, e senza costi per gli utenti di YouTube Shorts e YouTube Create App a partire da questa settimana. L'accesso API per sviluppatori e aziende seguirà nelle prossime settimane. Le modalità di output audio sono previste per una versione futura.

Fatti principali

  • Gemini Omni Flash è il primo modello della famiglia Omni.
  • Può generare e modificare video da qualsiasi combinazione di testo, immagini, audio e video.
  • Il modello si basa su Nano Banana, introdotto lo scorso anno per la generazione e modifica di immagini.
  • Omni Flash utilizza il ragionamento multimodale di Gemini per fisica, storia, scienza e contesto culturale.
  • Gli utenti possono modificare i video attraverso conversazioni in linguaggio naturale con personaggi coerenti e fisica realistica.
  • I riferimenti di input consentono il trasferimento di stile, movimento o personaggio da immagini, video o audio.
  • Tutti i video generati includono la filigrana digitale SynthID.
  • Il lancio è iniziato oggi per gli abbonati a Google AI Plus, Pro e Ultra a livello globale tramite l'app Gemini e Google Flow.
  • L'accesso gratuito per gli utenti di YouTube Shorts e YouTube Create App inizia questa settimana.
  • L'accesso API per sviluppatori e aziende sarà disponibile nelle prossime settimane.

Entità

Istituzioni

  • Google DeepMind
  • Google
  • YouTube
  • TechCrunch
  • Luma AI
  • OpenAI

Fonti