cotomi Act: Agente AI per Browser Impara Osservando gli Utenti
Un nuovo agente AI chiamato cotomi Act è stato presentato dai ricercatori, operando all'interno di un browser per assimilare la conoscenza organizzativa attraverso l'osservazione passiva delle azioni degli utenti. Questo sistema innovativo integra l'esecuzione di attività multi-step con l'astrazione continua della conoscenza. Nelle valutazioni utilizzando il sottoinsieme WebArena di 179 compiti, cotomi Act ha raggiunto un impressionante 80,4%, superando la baseline umana precedentemente stabilita del 78,2%. Le caratteristiche principali includono l'osservazione lazy adattiva, la compressione della cronologia basata su diff verbali e azioni a grana grossa, insieme al ridimensionamento in fase di test tramite selezione dell'azione best-of-N. Il pipeline comportamento-conoscenza trasforma gradualmente le attività di navigazione in artefatti modificabili come bacheche di attività e wiki. Valutazioni proxy controllate indicano che i tassi di successo dei compiti aumentano man mano che la conoscenza derivata dal comportamento cresce. Il sistema è stato presentato in una dimostrazione dal vivo.
Fatti principali
- cotomi Act è un agente basato su browser che utilizza il computer
- Impara la conoscenza organizzativa osservando il comportamento dell'utente
- Raggiunge l'80,4% sul sottoinsieme di valutazione umana WebArena (179 compiti)
- Supera la baseline umana riportata del 78,2%
- Utilizza osservazione lazy adattiva, compressione della cronologia basata su diff verbali, azioni a grana grossa e selezione dell'azione best-of-N
- Il pipeline comportamento-conoscenza astrae la navigazione in bacheche di attività e wiki
- Lo spazio di lavoro condiviso è modificabile sia dall'utente che dall'agente
- Il successo dei compiti migliora con la conoscenza accumulata derivata dal comportamento
Entità
Istituzioni
- arXiv