I dati sintetici danneggiano la maggior parte dei modelli di serie temporali, ma aiutano alcuni
Un'ampia indagine empirica sull'uso dell'aumento dei dati sintetici per la previsione di serie temporali ha mostrato che il suo impatto dipende fortemente dall'architettura del modello. Su 4.218 esperimenti, i modelli con miscelazione dei canali, tra cui TimesNet e iTransformer, hanno ottenuto risultati migliori nella maggior parte dei casi, mentre i modelli indipendenti dai canali come DLinear e PatchTST hanno subito un costante declino delle prestazioni. In scenari con risorse limitate, TimesNet, addestrato solo sul 10% dei dati meteorologici utilizzando l'aumento sintetico, ha superato la baseline con dati completi in 4 delle 16 combinazioni di dataset sparsi. Tuttavia, in tutte le architetture, l'aumento ha influenzato negativamente le prestazioni nel 67% delle prove. Il generatore Seasonal-Trend è stato l'unico metodo che ha migliorato costantemente i risultati nei benchmark testati. Questa ricerca, disponibile su arXiv, valuta cinque architetture, quattro segnali sintetici e sette dataset.
Fatti principali
- Lo studio ha condotto 4.218 esecuzioni in nove gruppi di esperimenti.
- I modelli con miscelazione dei canali (TimesNet, iTransformer) beneficiano dei dati sintetici.
- I modelli indipendenti dai canali (DLinear, PatchTST) sono costantemente degradati.
- TimesNet con il 10% dei dati meteorologici più l'aumento sintetico supera la baseline con dati completi in 4 casi.
- L'aumento danneggia il 67% delle prove in tutte le architetture.
- Solo il generatore Seasonal-Trend aiuta in modo affidabile in tutti i benchmark.
- Lo studio valuta cinque architetture, quattro segnali sintetici e sette dataset.
- Pubblicato su arXiv con identificatore 2605.06032.
Entità
Istituzioni
- arXiv