I dati sintetici danneggiano la maggior parte dei modelli di serie temporali, ma aiutano alcuni

ai-technology · 2026-05-09

Un'ampia indagine empirica sull'uso dell'aumento dei dati sintetici per la previsione di serie temporali ha mostrato che il suo impatto dipende fortemente dall'architettura del modello. Su 4.218 esperimenti, i modelli con miscelazione dei canali, tra cui TimesNet e iTransformer, hanno ottenuto risultati migliori nella maggior parte dei casi, mentre i modelli indipendenti dai canali come DLinear e PatchTST hanno subito un costante declino delle prestazioni. In scenari con risorse limitate, TimesNet, addestrato solo sul 10% dei dati meteorologici utilizzando l'aumento sintetico, ha superato la baseline con dati completi in 4 delle 16 combinazioni di dataset sparsi. Tuttavia, in tutte le architetture, l'aumento ha influenzato negativamente le prestazioni nel 67% delle prove. Il generatore Seasonal-Trend è stato l'unico metodo che ha migliorato costantemente i risultati nei benchmark testati. Questa ricerca, disponibile su arXiv, valuta cinque architetture, quattro segnali sintetici e sette dataset.

Fatti principali

Lo studio ha condotto 4.218 esecuzioni in nove gruppi di esperimenti.
I modelli con miscelazione dei canali (TimesNet, iTransformer) beneficiano dei dati sintetici.
I modelli indipendenti dai canali (DLinear, PatchTST) sono costantemente degradati.
TimesNet con il 10% dei dati meteorologici più l'aumento sintetico supera la baseline con dati completi in 4 casi.
L'aumento danneggia il 67% delle prove in tutte le architetture.
Solo il generatore Seasonal-Trend aiuta in modo affidabile in tutti i benchmark.
Lo studio valuta cinque architetture, quattro segnali sintetici e sette dataset.
Pubblicato su arXiv con identificatore 2605.06032.

I dati sintetici danneggiano la maggior parte dei modelli di serie temporali, ma aiutano alcuni

Fatti principali

Entità

Istituzioni

Fonti