Quadro termodinamico analizza la stabilità dei LLM sotto stress entropico
Un recente studio propone un approccio basato sulla termodinamica per valutare la stabilità dei grandi modelli linguistici (LLM) in presenza di incertezza e disturbi. I ricercatori presentano un punteggio di stabilità composito che combina l'utilità del compito, l'entropia che rappresenta l'incertezza esterna e due indicatori strutturali interni: l'integrazione interna e la capacità riflessiva allineata. Questo quadro funge da astrazione interpretabile piuttosto che basarsi su variabili fisiche. È stata condotta un'analisi di 80 osservazioni modello-scenario provenienti da quattro LLM moderni utilizzando il protocollo di benchmarking IST-20. L'obiettivo di questa ricerca è migliorare le valutazioni di affidabilità oltre la mera accuratezza aggregata per applicazioni critiche.
Fatti principali
- arXiv:2604.24076v1
- Punteggio di stabilità composito che integra utilità del compito, entropia, integrazione interna e capacità riflessiva allineata
- Protocollo di benchmarking IST-20 utilizzato
- 80 osservazioni modello-scenario su quattro LLM
- Quadro di modellazione ispirato alla termodinamica
- Focus sulla stabilità in condizioni di incertezza e perturbazione
- Astrazione interpretabile, non variabili fisiche
- Affronta l'insufficienza dell'accuratezza aggregata per contesti ad alto rischio
Entità
Istituzioni
- arXiv