RIFT Taxonomy Introduce un Quadro per Diagnosticare i Fallimenti delle Rubriche nella Valutazione dei Modelli Linguistici di Grande Dimensione
È stato introdotto un nuovo quadro chiamato RIFT, acronimo di RubrIc Failure mode Taxonomy. Il suo scopo è aiutare a identificare e classificare i fallimenti nel modo in cui valutiamo i modelli linguistici di grande dimensione utilizzando rubriche. RIFT suddivide questi fallimenti in tre categorie principali: Fallimenti di Affidabilità, Fallimenti di Validità del Contenuto e Fallimenti di Validità Consequenziale, per un totale di otto tipi distinti di fallimento. Questo strumento colma una lacuna significativa nei metodi di valutazione per questi modelli, poiché gli approcci precedenti non diagnosticavano efficacemente i problemi delle rubriche oltre i risultati di base. Sviluppato utilizzando la teoria fondata, RIFT si basa su un'analisi approfondita delle rubriche provenienti da cinque dataset diversi, che includono aree come il seguire istruzioni e la scrittura creativa. Ulteriori dettagli sono disponibili nel preprint arXiv 2604.01375v2.
Fatti principali
- La tassonomia RIFT categorizza otto modalità di fallimento delle rubriche
- Le modalità di fallimento sono organizzate in tre categorie di alto livello: Affidabilità, Validità del Contenuto, Validità Consequenziale
- Sviluppata utilizzando la teoria fondata attraverso annotazioni iterative
- Basata su rubriche provenienti da cinque diverse fonti di dati
- Affronta la lacuna nella diagnosi dei fallimenti delle rubriche a partire da segnali aggregati
- Si applica ai benchmark dei modelli linguistici di grande dimensione e alle pipeline di addestramento per compiti aperti
- Copre i domini: seguire istruzioni, generazione di codice, scrittura creativa, ricerca approfondita
- Identificatore del preprint arXiv: 2604.01375v2
Entità
Istituzioni
- arXiv