Riassunto Personalizzato di Grafi di Conoscenza Guidato da Coreset
Viene proposto un nuovo metodo per il riassunto personalizzato di grandi Grafi di Conoscenza (KG), utilizzando la teoria dei coreset per campionare triple rilevanti in base a carichi di query specifici dell'utente. L'approccio, dettagliato in arXiv:2605.14900, applica un campionamento basato sulla sensibilità per creare riassunti compatti che approssimano le caratteristiche dell'intero dataset. Questi riassunti riducono l'archiviazione e il tempo di esecuzione delle query, mantenendo le informazioni rilevanti per i singoli utenti. Il lavoro affronta la sfida dei KG ingombranti in attività come il question answering e la visualizzazione, offrendo un'alternativa valida attraverso il riassunto personalizzato.
Fatti principali
- I Grafi di Conoscenza sono ampiamente utilizzati in vari domini, ma spesso sono molto grandi.
- Il riassunto offre un'alternativa valida per attività come il question answering e la visualizzazione.
- Il riassunto personalizzato dei KG cattura requisiti specifici dell'utente basati sui pattern delle query.
- Il metodo adatta la teoria dei coreset per creare riassunti personalizzati dei KG.
- Il campionamento basato sulla sensibilità seleziona un sottoinsieme rilevante di triple.
- Il sottoinsieme approssima le caratteristiche dell'intero dataset con errore limitato.
- I riassunti personalizzati comportano minori requisiti di archiviazione e tempi di esecuzione delle query.
- L'articolo è pubblicato su arXiv con identificativo 2605.14900.
Entità
Istituzioni
- arXiv