Pipeline modulare converte tabelle storiche in Knowledge Graph
Una nuova pipeline modulare e attenta alla provenienza trasforma tabelle d'archivio scritte a mano in Knowledge Graph (KG) attraverso tre fasi: ricostruzione della tabella, estrazione delle informazioni e costruzione del KG. L'approccio espone rappresentazioni intermedie per ispezione, valutazione e correzione umana, affrontando l'opacità dei sistemi AI end-to-end. La provenienza dei dati è sistematicamente integrata in ogni fase, garantendo la tracciabilità di tutte le entità e i letterali estratti. La pipeline supporta la collaborazione uomo-AI consentendo supervisione e fiducia nella conversione di dati storici multimodali complessi.
Fatti principali
- 1. La pipeline converte immagini di tabelle scritte a mano in Knowledge Graph
- 2. Tre fasi: ricostruzione della tabella, estrazione delle informazioni, costruzione del KG
- 3. Design attento alla provenienza che integra la provenienza dei dati in ogni fase
- 4. Espone rappresentazioni intermedie per ispezione e correzione umana
- 5. Affronta l'opacità delle implementazioni AI end-to-end
- 6. Supporta la collaborazione uomo-AI e la fiducia
- 7. Si concentra su tabelle d'archivio storiche con informazioni ricche
- 8. Preprint arXiv:2605.08222v1
Entità
Istituzioni
- arXiv