ARTFEED — Contemporary Art Intelligence

cotomi Act: Agente AI per Browser Impara Osservando gli Utenti

ai-technology · 2026-05-07

Un nuovo agente AI chiamato cotomi Act è stato presentato dai ricercatori, operando all'interno di un browser per assimilare la conoscenza organizzativa attraverso l'osservazione passiva delle azioni degli utenti. Questo sistema innovativo integra l'esecuzione di attività multi-step con l'astrazione continua della conoscenza. Nelle valutazioni utilizzando il sottoinsieme WebArena di 179 compiti, cotomi Act ha raggiunto un impressionante 80,4%, superando la baseline umana precedentemente stabilita del 78,2%. Le caratteristiche principali includono l'osservazione lazy adattiva, la compressione della cronologia basata su diff verbali e azioni a grana grossa, insieme al ridimensionamento in fase di test tramite selezione dell'azione best-of-N. Il pipeline comportamento-conoscenza trasforma gradualmente le attività di navigazione in artefatti modificabili come bacheche di attività e wiki. Valutazioni proxy controllate indicano che i tassi di successo dei compiti aumentano man mano che la conoscenza derivata dal comportamento cresce. Il sistema è stato presentato in una dimostrazione dal vivo.

Fatti principali

  • cotomi Act è un agente basato su browser che utilizza il computer
  • Impara la conoscenza organizzativa osservando il comportamento dell'utente
  • Raggiunge l'80,4% sul sottoinsieme di valutazione umana WebArena (179 compiti)
  • Supera la baseline umana riportata del 78,2%
  • Utilizza osservazione lazy adattiva, compressione della cronologia basata su diff verbali, azioni a grana grossa e selezione dell'azione best-of-N
  • Il pipeline comportamento-conoscenza astrae la navigazione in bacheche di attività e wiki
  • Lo spazio di lavoro condiviso è modificabile sia dall'utente che dall'agente
  • Il successo dei compiti migliora con la conoscenza accumulata derivata dal comportamento

Entità

Istituzioni

  • arXiv

Fonti