Agenti VLM non riescono a riconoscersi allo specchio
Uno studio recente pubblicato su arXiv (2605.08816) esplora la capacità degli agenti basati su modelli visione-linguaggio (VLM) di riconoscere il proprio riflesso, una misura tradizionale di autoconsapevolezza negli animali. I ricercatori hanno sviluppato un benchmark 3D in cui un agente VLM in prima persona deve dedurre una caratteristica corporea nascosta dalla propria immagine e scegliere un target corrispondente, evitando confusione tra sé e gli altri. Il benchmark include controlli come rimozione dello specchio, indizi ingannevoli e riflessi oscurati per distinguere la vera auto-identificazione da scorciatoie. Lo studio valuta il processo decisionale attraverso l'interazione con lo specchio, la sequenza temporale, l'auto-attribuzione e la coerenza tra ragionamento e azioni. I risultati indicano che solo i VLM più avanzati mostrano auto-riconoscimento basato sullo specchio, mentre i modelli più deboli possono guardare il proprio riflesso ma non riescono a identificare informazioni rilevanti per sé. Questa ricerca sottolinea le attuali limitazioni dell'autoconsapevolezza dell'IA e offre un quadro per valutare la cognizione incarnata negli agenti artificiali.
Fatti principali
- Lo studio testa il riconoscimento di sé allo specchio negli agenti VLM
- Utilizza un benchmark 3D controllato con prospettiva in prima persona
- L'agente deve dedurre un attributo corporeo nascosto dal riflesso
- Include rimozione dello specchio, indizi fuorvianti, riflessi oscurati
- Valuta la ricerca dello specchio, l'ordine temporale, l'auto-attribuzione, la coerenza ragionamento-azione
- I VLM più forti mostrano auto-identificazione; i modelli più deboli falliscono
- Pubblicato su arXiv con ID 2605.08816
- Analogico ai test di auto-riconoscimento allo specchio negli animali
Entità
Istituzioni
- arXiv