L'orchestrazione LLM causa un precipizio universale nel rilevamento dei difetti
Uno studio su arXiv (2605.26174) rivela che quando i sistemi di modelli linguistici di produzione utilizzano agenti lavoratori orchestrati per rispondere alle richieste, perdono universalmente la capacità di rilevare difetti trasversali—contraddizioni tra sezioni distanti del documento. Testando dieci modelli su cinque generazioni di uno sviluppatore e cinque fornitori con paradigmi di allineamento distinti, i ricercatori hanno trovato un precipizio di rilevamento universale: ogni modello che poteva trovare questi difetti sotto un singolo agente falliva sotto orchestrazione, con un calo del rilevamento di due terzi o più. Il precipizio è derivato dal meccanismo e non è mitigato dalla scala o dal ragionamento esteso. Tra i sei modelli che discriminavano sopra il caso dopo la caduta, una decomposizione del rilevamento del segnale ha mostrato comportamenti vari.
Fatti principali
- Articolo arXiv 2605.26174
- Studiato il rilevamento di difetti trasversali
- Testati dieci modelli su cinque generazioni e cinque fornitori
- Osservato un precipizio di rilevamento universale sotto orchestrazione
- Il rilevamento cala di due terzi o più
- Il precipizio è derivato dal meccanismo, non chiuso dalla scala o dal ragionamento
- Sei modelli discriminavano sopra il caso dopo la caduta
- Applicata la decomposizione del rilevamento del segnale
Entità
Istituzioni
- arXiv