ARTFEED — Contemporary Art Intelligence

Agenti VLM non riescono a riconoscersi allo specchio

other · 2026-05-12

Uno studio recente pubblicato su arXiv (2605.08816) esplora la capacità degli agenti basati su modelli visione-linguaggio (VLM) di riconoscere il proprio riflesso, una misura tradizionale di autoconsapevolezza negli animali. I ricercatori hanno sviluppato un benchmark 3D in cui un agente VLM in prima persona deve dedurre una caratteristica corporea nascosta dalla propria immagine e scegliere un target corrispondente, evitando confusione tra sé e gli altri. Il benchmark include controlli come rimozione dello specchio, indizi ingannevoli e riflessi oscurati per distinguere la vera auto-identificazione da scorciatoie. Lo studio valuta il processo decisionale attraverso l'interazione con lo specchio, la sequenza temporale, l'auto-attribuzione e la coerenza tra ragionamento e azioni. I risultati indicano che solo i VLM più avanzati mostrano auto-riconoscimento basato sullo specchio, mentre i modelli più deboli possono guardare il proprio riflesso ma non riescono a identificare informazioni rilevanti per sé. Questa ricerca sottolinea le attuali limitazioni dell'autoconsapevolezza dell'IA e offre un quadro per valutare la cognizione incarnata negli agenti artificiali.

Fatti principali

  • Lo studio testa il riconoscimento di sé allo specchio negli agenti VLM
  • Utilizza un benchmark 3D controllato con prospettiva in prima persona
  • L'agente deve dedurre un attributo corporeo nascosto dal riflesso
  • Include rimozione dello specchio, indizi fuorvianti, riflessi oscurati
  • Valuta la ricerca dello specchio, l'ordine temporale, l'auto-attribuzione, la coerenza ragionamento-azione
  • I VLM più forti mostrano auto-identificazione; i modelli più deboli falliscono
  • Pubblicato su arXiv con ID 2605.08816
  • Analogico ai test di auto-riconoscimento allo specchio negli animali

Entità

Istituzioni

  • arXiv

Fonti