TabPFN-MT: Apprendimento Multitask In-Context per Dati Tabulari
TabPFN-MT rappresenta un approccio innovativo per la gestione di dati tabulari, potenziando le Prior-Data Fitted Networks (PFN) per eseguire simultaneamente più compiti di previsione all'interno di un quadro unificato. A differenza delle PFN tradizionali, che richiedono passaggi in avanti distinti per ogni variabile target e ostacolano lo scambio di informazioni tra i compiti, TabPFN-MT incorpora un codificatore y ampliato insieme a una testa decodificatrice comune. Questo design facilita l'apprendimento multitask in-context e consente l'inferenza simultanea. Il modello è addestrato su un dataset sintetico multi-target per catturare le dipendenze tra i compiti ed è ottimizzato per dataset di piccole e medie dimensioni, tipicamente inferiori a 1.000 campioni, utilizzando l'apprendimento in-context invece di metodi basati su gradienti. Le valutazioni su 344 dataset dimostrano che TabPFN-MT stabilisce un nuovo punto di riferimento per l'apprendimento multitask profondo su dati tabulari. La ricerca è disponibile su arXiv con ID 2605.20234.
Fatti principali
- TabPFN-MT estende le PFN all'apprendimento multitask in-context.
- Utilizza un codificatore y ampliato e una testa decodificatrice condivisa.
- Addestrato su un prior sintetico multi-target.
- Specializzato per dataset con meno di 1.000 campioni.
- Valutato su 344 dataset.
- Raggiunge lo stato dell'arte nell'apprendimento multitask profondo su dati tabulari.
- Pubblicato su arXiv: 2605.20234.
- Consente l'inferenza simultanea di più valori target.
Entità
Istituzioni
- arXiv