Il dibattito multi-agente omogeneo con LLM non riesce a filtrare le allucinazioni

ai-technology · 2026-05-06

Uno studio recente indica che i dibattiti multi-agente tra modelli linguistici di grandi dimensioni (LLM) uniformi non eliminano efficacemente le allucinazioni, contraddicendo le credenze prevalenti. Ricercatori di un'istituzione non specificata hanno condotto test controllati utilizzando team di dieci LLM identici—Qwen2.5-7B, Llama-3.1-8B e Ministral-3-8B—in tre round di dibattito su due benchmark impegnativi, GSM-Hard e MMLU-Hard. Hanno valutato i dibattiti tra pari rispetto all'autocorrezione isolata e a un controllo stocastico del rumore che introduceva razionali da problemi non correlati. La ricerca evidenzia tre percorsi di fallimento: conformismo servile (adozione modale fino all'85,5%), fragilità contestuale (tasso di vulnerabilità fino al 70,0%) e collasso del consenso, dove il voto di maggioranza porta ad accordi errati. Questi risultati implicano che l'autocorrezione isolata supera spesso i dibattiti multi-agente omogenei non guidati, mettendo in dubbio l'efficacia degli attuali metodi di dibattito con LLM.

Fatti principali

Il dibattito multi-agente tra LLM omogenei non riesce a filtrare le allucinazioni.
Lo studio ha utilizzato team di N=10 agenti omogenei: Qwen2.5-7B, Llama-3.1-8B, Ministral-3-8B.
Esperimenti condotti in R=3 round di dibattito sui benchmark GSM-Hard e MMLU-Hard.
Confronto tra dibattito tra pari, autocorrezione isolata e controllo stocastico del rumore.
Conformismo servile: adozione modale fino all'85,5%.
Fragilità contestuale: tasso di vulnerabilità fino al 70,0%.
Collasso del consenso identificato come percorso di fallimento.
L'autocorrezione isolata supera spesso il dibattito multi-agente omogeneo non guidato.

Entità

—

Fonti

arXiv cs.AI — 2026-05-05