La teoria dei giochi evolutiva spiega l'apprendimento di scorciatoie nell'IA
Un nuovo articolo su arXiv (2605.02658v2) fornisce una definizione formale delle caratteristiche core e di scorciatoia nell'apprendimento profondo, utilizzando la teoria dei giochi evolutiva per analizzare il bias delle scorciatoie. Gli autori modellano i campioni di dati come giocatori e le caratteristiche neurali tangenti come strategie, assumendo sottoreti core e di scorciatoia. Scoprono che la discesa del gradiente (GD) ottimizza principalmente la sottorete di scorciatoia, mentre la discesa del gradiente stocastica (SGD) ottimizza principalmente la sottorete core, portando a stati stocasticamente stabili distinti. Un'equazione differenziale stocastica continua rivela l'impatto del rumore dei dati e dell'ottimizzazione sul bias delle scorciatoie, offrendo una visione teorica del perché i modelli si basano su caratteristiche non essenziali.
Fatti principali
- Articolo su arXiv: 2605.02658v2
- Definizione formale delle caratteristiche core e di scorciatoia
- Utilizza la teoria dei giochi evolutiva
- Campioni di dati modellati come giocatori
- Caratteristiche neurali tangenti come strategie
- GD ottimizza la sottorete di scorciatoia
- SGD ottimizza la sottorete core
- Equazione differenziale stocastica continua utilizzata
Entità
Istituzioni
- arXiv