ARTFEED — Contemporary Art Intelligence

La generalizzazione OOD delle reti neurali dipende dal bias di ingegneria delle caratteristiche

other · 2026-05-11

Un recente articolo su arXiv (2605.07483) esplora le ragioni alla base dell'incapacità delle reti neurali profonde di estrapolare fuori distribuzione (OOD) nonostante apprendano efficacemente le caratteristiche chiave dai dataset di training in-distribution (ID). I ricercatori dimostrano che l'estrapolazione OOD non è identificabile da una singola finestra di training, poiché numerosi processi generativi dei dati (DGP) possono apparire equivalenti basandosi sui dati di training ma differire al di fuori di essi. Nessun singolo criterio in-distribution può risolvere efficacemente questa ambiguità. Invece, il DGP assunto e la generalizzazione OOD sono influenzati dall'impegno strutturale della mappa delle caratteristiche, della mappa delle etichette e della classe del modello, senza influenzare le prestazioni ID. Il successo si ottiene quando l'architettura, il pre-training, l'aumento dei dati, i formati di input o la conoscenza del dominio forniscono l'impegno necessario. Lo studio separa l'apprendimento delle caratteristiche dall'identificabilità del DGP, mostrando che l'ingegneria delle caratteristiche funge da bias di identificabilità per la generalizzazione OOD.

Fatti principali

  • Articolo arXiv 2605.07483
  • Le reti neurali profonde non riescono ad apprendere rappresentazioni rilevanti per OOD dal training ID
  • L'estrapolazione OOD non è identificabile da una singola finestra di training
  • Infiniti DGP sono osservazionalmente equivalenti sui dati di training ma divergono al di fuori
  • Nessun criterio in-distribution da solo risolve l'ambiguità
  • L'impegno strutturale (mappa delle caratteristiche, mappa delle etichette, classe del modello) governa la generalizzazione OOD
  • Il successo richiede l'iniezione implicita dell'impegno mancante tramite architettura, pre-training, ecc.
  • L'ingegneria delle caratteristiche funge da bias di identificabilità per la generalizzazione OOD

Entità

Istituzioni

  • arXiv

Fonti