CaptchaMind: Risolutore di CAPTCHA basato su RL raggiunge l'82,9% di successo
Un nuovo benchmark chiamato CaptchaBench è stato lanciato dai ricercatori, specificamente mirato all'addestramento su larga scala. Contiene 16.000 campioni generati programmaticamente, suddivisi in otto diverse categorie di compiti, con annotazioni approfondite sia a livello di regione che di processo. Le valutazioni hanno indicato che i metodi attuali faticano con compiti che richiedono dettagli visivi precisi e confronti regionali. Per affrontare questo problema, il team ha creato CaptchaMind, un risolutore basato sull'apprendimento per rinforzo che incorpora una supervisione esplicita del processo di ragionamento, raggiungendo un tasso medio di successo dell'82,9% nelle otto categorie. Questa ricerca è documentata nell'articolo arXiv 2605.19538.
Fatti principali
- CaptchaBench include 16.000 campioni generati programmaticamente in otto categorie di compiti.
- CaptchaBench ha annotazioni dettagliate a livello di regione e di processo.
- I metodi esistenti falliscono su compiti che richiedono la cattura di dettagli visivi fini e il confronto a livello regionale.
- CaptchaMind è un risolutore basato su RL addestrato con supervisione esplicita del processo di ragionamento.
- CaptchaMind raggiunge un tasso medio di successo dell'82,9% nelle otto categorie.
- L'articolo è disponibile su arXiv con ID 2605.19538.
Entità
—