PrimeKG-CL: Benchmark per grafi di conoscenza biomedici in evoluzione
I ricercatori hanno introdotto PrimeKG-CL, un benchmark di apprendimento continuo su grafi costruito da nove database biomedici autorevoli con oltre 129.000 nodi e 8,1 milioni di archi. Utilizza due istantanee temporali reali di giugno 2021 e luglio 2023, catturando 5,83 milioni di archi aggiunti, 889.000 rimossi e 7,21 milioni di archi persistenti. Il benchmark include 10 task raggruppati per tipo di entità, caratteristiche multimodali dei nodi e stratificazione dei test per task. Valuta tre compiti: previsione di relazioni biomediche, classificazione di entità e risposta a domande su grafi di conoscenza. Questo colma una lacuna negli studi esistenti sull'apprendimento continuo su grafi, che si basano su suddivisioni sintetiche di grafi di conoscenza statici e generici, incapaci di replicare l'evoluzione asincrona e strutturata dei veri KG biomedici.
Fatti principali
- PrimeKG-CL è un benchmark di apprendimento continuo su grafi per grafi di conoscenza biomedici.
- Costruito da nove database biomedici autorevoli.
- Contiene oltre 129.000 nodi e 8,1 milioni di archi.
- Utilizza istantanee temporali di giugno 2021 e luglio 2023.
- 5,83 milioni di archi aggiunti, 889.000 rimossi, 7,21 milioni persistenti.
- Include 10 task raggruppati per tipo di entità.
- Presenta caratteristiche multimodali dei nodi e stratificazione dei test per task.
- Valuta previsione di relazioni biomediche, classificazione di entità e KGQA.
Entità
Istituzioni
- arXiv