La Fase Silenziosa del Potatura dei Layer Provoca il Collasso delle Prestazioni dei LLM
Un nuovo preprint su arXiv (2605.07271) indaga perché la potatura dei layer nei modelli linguistici di grandi dimensioni (LLM) provoca un improvviso collasso delle prestazioni. Gli autori propongono di studiare la potatura attraverso la rappresentazione delle decisioni, introducendo le metriche di Margine Decisionale e Frequenza delle Opzioni insieme a un metodo di Potatura Iterativa. Analizzando compiti a scelta multipla, scoprono una brusca transizione decisionale che divide la rete in una Fase Silenziosa (incapace di prevedere la risposta corretta) e una Fase Decisiva (emerge la previsione corretta). Potare la Fase Decisiva ha un effetto minimo, ma potare la Fase Silenziosa innesca un collasso immediato, indicando un'estrema sensibilità ai cambiamenti strutturali. L'articolo conclude che il collasso indotto dalla potatura deriva dall'interruzione della Fase Silenziosa.
Fatti principali
- Preprint arXiv 2605.07271
- La potatura dei layer nei LLM provoca un improvviso collasso delle prestazioni
- Lo studio utilizza le metriche di Margine Decisionale e Frequenza delle Opzioni
- Il metodo di Potatura Iterativa analizza le dinamiche decisionali layer per layer
- La rete si divide in Fase Silenziosa e Fase Decisiva
- La Fase Silenziosa è estremamente sensibile alla potatura
- La potatura della Fase Decisiva ha un impatto minimo
- Il collasso è causato dall'interruzione della Fase Silenziosa
Entità
Istituzioni
- arXiv