RDB-PFN: Primo Modello Fondazionale Relazionale Addestrato su Dati Sintetici
I ricercatori hanno presentato RDB-PFN, il primo modello fondazionale per database relazionali addestrato esclusivamente su dati sintetici. Il modello utilizza un Generatore di Priorità Relazionale per creare diversi RDB sintetici, consentendo il pre-addestramento su oltre 2 milioni di compiti. RDB-PFN raggiunge forti prestazioni few-shot su 19 benchmark reali tramite apprendimento in-context.
Fatti principali
- RDB-PFN è il primo modello fondazionale relazionale addestrato esclusivamente su dati sintetici.
- Utilizza un Generatore di Priorità Relazionale per creare diversi RDB sintetici.
- Pre-addestrato su oltre 2 milioni di compiti sintetici a singola tabella e relazionali.
- Raggiunge forti prestazioni few-shot su 19 benchmark reali.
- Impara ad adattarsi istantaneamente a nuovi database tramite apprendimento in-context.
- Ispirato da Prior-Data Fitted Networks (PFN) e Modelli Causali Strutturali (SCM).
- Affronta la scarsità di dati e l'eterogeneità strutturale dei RDB reali.
Entità
—