ARTFEED — Contemporary Art Intelligence

LTE: Framework VLM a Due Stadi Rileva Immagini Generate dall'IA con Ragionamento a Livello di Regione

ai-technology · 2026-04-24

Un nuovo framework forense a due stadi chiamato Locate-Then-Examine (LTE) è stato introdotto dai ricercatori per identificare immagini generate dall'IA utilizzando modelli visione-linguaggio. La fase iniziale di LTE si concentra sull'individuazione di aree sospette, seguita da un esame dettagliato di queste regioni in combinazione con l'intera immagine per migliorare la determinazione dell'autenticità. Questo framework collega le sue conclusioni a prove visive specifiche attraverso proposte di regioni e ragionamenti consapevoli delle regioni. Per facilitare la formazione e la valutazione, i ricercatori hanno sviluppato TRACE, un dataset composto da 20.000 immagini autentiche e sintetiche di alta qualità, complete di annotazioni a livello di regione e spiegazioni forensi generate automaticamente da un VLM. Questa ricerca affronta il problema che i classificatori tradizionali a passaggio singolo spesso trascurano artefatti sottili in immagini sintetiche di alta qualità e forniscono una base a livello di pixel insufficiente. L'articolo è disponibile su arXiv con l'identificatore 2510.04225.

Fatti principali

  • LTE è un framework forense basato su VLM a due stadi per rilevare immagini generate dall'IA.
  • Il primo stadio localizza le regioni sospette nell'immagine.
  • Il secondo stadio riesamina i ritagli insieme all'immagine intera per perfezionare il verdetto.
  • LTE collega esplicitamente le decisioni a prove visive localizzate tramite proposte di regioni e ragionamenti consapevoli delle regioni.
  • Il dataset TRACE contiene 20.000 immagini reali e sintetiche con annotazioni a livello di regione e spiegazioni forensi.
  • TRACE è stato costruito da un VLM.
  • I classificatori standard a passaggio singolo spesso perdono artefatti sottili in immagini sintetiche di alta qualità.
  • Articolo disponibile su arXiv: 2510.04225.

Entità

Istituzioni

  • arXiv

Fonti