Agenti VLM non riescono a riconoscersi allo specchio

other · 2026-05-12

Uno studio recente pubblicato su arXiv (2605.08816) esplora la capacità degli agenti basati su modelli visione-linguaggio (VLM) di riconoscere il proprio riflesso, una misura tradizionale di autoconsapevolezza negli animali. I ricercatori hanno sviluppato un benchmark 3D in cui un agente VLM in prima persona deve dedurre una caratteristica corporea nascosta dalla propria immagine e scegliere un target corrispondente, evitando confusione tra sé e gli altri. Il benchmark include controlli come rimozione dello specchio, indizi ingannevoli e riflessi oscurati per distinguere la vera auto-identificazione da scorciatoie. Lo studio valuta il processo decisionale attraverso l'interazione con lo specchio, la sequenza temporale, l'auto-attribuzione e la coerenza tra ragionamento e azioni. I risultati indicano che solo i VLM più avanzati mostrano auto-riconoscimento basato sullo specchio, mentre i modelli più deboli possono guardare il proprio riflesso ma non riescono a identificare informazioni rilevanti per sé. Questa ricerca sottolinea le attuali limitazioni dell'autoconsapevolezza dell'IA e offre un quadro per valutare la cognizione incarnata negli agenti artificiali.

Fatti principali

Lo studio testa il riconoscimento di sé allo specchio negli agenti VLM
Utilizza un benchmark 3D controllato con prospettiva in prima persona
L'agente deve dedurre un attributo corporeo nascosto dal riflesso
Include rimozione dello specchio, indizi fuorvianti, riflessi oscurati
Valuta la ricerca dello specchio, l'ordine temporale, l'auto-attribuzione, la coerenza ragionamento-azione
I VLM più forti mostrano auto-identificazione; i modelli più deboli falliscono
Pubblicato su arXiv con ID 2605.08816
Analogico ai test di auto-riconoscimento allo specchio negli animali

Agenti VLM non riescono a riconoscersi allo specchio

Fatti principali

Entità

Istituzioni

Fonti