Google presenta un puntatore del mouse basato sull'IA con integrazione Gemini
I ricercatori di Google DeepMind Adrien Baranes e Rob Marchant stanno sviluppando un puntatore del mouse abilitato all'IA che comprende contesto e intenzioni, basato sul modello Gemini. Il puntatore mira a sostituire i prompt testuali dettagliati con puntamento e parlato intuitivi, consentendo agli utenti di interagire con i pixel come entità azionabili. Quattro principi di progettazione guidano il progetto: mantenere il flusso dell'utente tra le app, abbracciare il linguaggio naturale come 'questo' e 'quello', trasformare i pixel in dati strutturati e adattare la tecnologia al comportamento umano. Demo sperimentali mostrano utenti che modificano immagini o trovano luoghi in Google AI Studio puntando e parlando. La tecnologia viene integrata in Chrome e nel nuovo laptop Googlebook, con funzionalità come Magic Pointer in arrivo a breve. Disco di Google Labs testerà anche concetti futuri.
Fatti principali
- Sviluppato da Adrien Baranes e Rob Marchant presso Google DeepMind
- Basato sul modello AI Gemini
- Quattro principi di interazione: mantenere il flusso, abbracciare 'questo' e 'quello', trasformare i pixel in entità azionabili, adattarsi al comportamento umano
- Demo sperimentali disponibili in Google AI Studio
- Integrazione in Chrome e nel laptop Googlebook
- Funzionalità Magic Pointer in arrivo su Googlebook
- Disco di Google Labs testerà concetti futuri
- Obiettivo di eliminare la necessità di prompt testuali dettagliati
Entità
Artisti
- Adrien Baranes
- Rob Marchant
Istituzioni
- Google DeepMind
- Google AI Studio
- Google Labs
- Chrome
- Googlebook
- Disco