I LLM faticano con l'inganno nel gioco Secret Hitler

ai-technology · 2026-05-25

Uno studio recente pubblicato su arXiv presenta un nuovo framework open-source volto a valutare la capacità dei Large Language Models (LLM) di ingannare i giocatori nel gioco da tavolo Secret Hitler. I ricercatori hanno sviluppato nuove metriche come l'Accuratezza nell'Identificazione del Ruolo e il Tasso di Ritenzione dell'Inganno per misurare le prestazioni degli LLM. Hanno scoperto che gli LLM sono in ritardo sia rispetto ai giocatori umani che ai sistemi basati su regole nell'efficacia conversazionale rispetto alle capacità strategiche. Nonostante l'uso del Chain-of-Thought prompting, gli LLM hanno faticato, con i personaggi fascisti che hanno vinto il 23,2% in meno di frequenza. Al contrario, gli agenti basati su regole hanno raggiunto un allineamento dell'86,7% con il voto umano esperto, rivelando sfide significative nella valutazione dell'inganno degli LLM.

Fatti principali

Lo studio valuta gli LLM nel gioco di deduzione sociale Secret Hitler
Introdotto un framework open-source
Nuove metriche: Accuratezza nell'Identificazione del Ruolo, Tasso di Ritenzione dell'Inganno, Tasso di Impatto sullo Stato del Gioco
Identificato un divario tra abilità conversazionale e profondità strategica
Chain-of-Thought prompting e memoria interna non hanno migliorato le prestazioni
I ruoli fascisti hanno avuto tassi di vittoria peggiori fino al 23,2% con miglioramenti del ragionamento
Gli agenti basati su regole si allineano con il voto umano esperto l'86,7% delle volte
Modello Llama 3.1 70B testato

I LLM faticano con l'inganno nel gioco Secret Hitler

Fatti principali

Entità

Istituzioni

Fonti