Anthropic aggiorna le salvaguardie elettorali di Claude per le elezioni di medio termine del 2026 negli Stati Uniti

ai-technology · 2026-04-24

In preparazione per le elezioni di medio termine del 2026 negli Stati Uniti, Anthropic ha rivisto le sue salvaguardie elettorali per il modello AI, Claude. Progettato per mantenere la neutralità, Claude è addestrato a considerare tutte le prospettive politiche allo stesso modo, supportato da prompt di sistema. Valutazioni precedenti hanno indicato che Opus 4.7 e Sonnet 4.6 hanno ottenuto punteggi del 95% e 96% nelle valutazioni di coinvolgimento politico. L'azienda vieta severamente l'uso di Claude per campagne politiche fuorvianti e ha stabilito una Politica di Utilizzo per combattere la frode elettorale e la disinformazione. I test con 600 prompt hanno rivelato che Claude ha fornito risposte appropriate il 100% e il 99,8% delle volte. Nelle conversazioni multi-turno, Sonnet 4.6 e Opus 4.7 sono stati appropriati rispettivamente nel 90% e 94% dei casi. Claude indirizza inoltre gli utenti a TurboVote e avvia ricerche web per domande elettorali rispettivamente nel 92% e 95% dei casi. Anthropic collabora con varie organizzazioni per modellare i comportamenti del modello relativi alla libertà di espressione.

Fatti principali

Claude Opus 4.7 e Sonnet 4.6 hanno ottenuto punteggi del 95% e 96% nelle valutazioni sui pregiudizi politici.
Claude Opus 4.7 ha risposto in modo appropriato il 100% delle volte nei test relativi alle elezioni.
Claude Sonnet 4.6 ha risposto in modo appropriato il 99,8% delle volte nei test relativi alle elezioni.
Sonnet 4.6 e Opus 4.7 hanno risposto in modo appropriato rispettivamente nel 90% e 94% dei test sulle operazioni di influenza.
I banner elettorali indirizzano gli utenti statunitensi a TurboVote di Democracy Works.
La ricerca web è stata attivata per domande elettorali nel 92% dei casi per Opus 4.7 e nel 95% per Sonnet 4.6.
Anthropic ha pubblicato la sua metodologia di valutazione e un dataset open-source.
Collaborazione con The Future of Free Speech, Foundation for American Innovation e Collective Intelligence Project.

Entità

Istituzioni

Anthropic
The Future of Free Speech
Vanderbilt University
Foundation for American Innovation
Collective Intelligence Project
Democracy Works
TurboVote

Luoghi

United States
Brazil

Fonti

Anthropic Blog — 2026-04-24