Anthropic aggiorna le salvaguardie elettorali di Claude per le elezioni di medio termine del 2026 negli Stati Uniti
In preparazione per le elezioni di medio termine del 2026 negli Stati Uniti, Anthropic ha rivisto le sue salvaguardie elettorali per il modello AI, Claude. Progettato per mantenere la neutralità, Claude è addestrato a considerare tutte le prospettive politiche allo stesso modo, supportato da prompt di sistema. Valutazioni precedenti hanno indicato che Opus 4.7 e Sonnet 4.6 hanno ottenuto punteggi del 95% e 96% nelle valutazioni di coinvolgimento politico. L'azienda vieta severamente l'uso di Claude per campagne politiche fuorvianti e ha stabilito una Politica di Utilizzo per combattere la frode elettorale e la disinformazione. I test con 600 prompt hanno rivelato che Claude ha fornito risposte appropriate il 100% e il 99,8% delle volte. Nelle conversazioni multi-turno, Sonnet 4.6 e Opus 4.7 sono stati appropriati rispettivamente nel 90% e 94% dei casi. Claude indirizza inoltre gli utenti a TurboVote e avvia ricerche web per domande elettorali rispettivamente nel 92% e 95% dei casi. Anthropic collabora con varie organizzazioni per modellare i comportamenti del modello relativi alla libertà di espressione.
Fatti principali
- Claude Opus 4.7 e Sonnet 4.6 hanno ottenuto punteggi del 95% e 96% nelle valutazioni sui pregiudizi politici.
- Claude Opus 4.7 ha risposto in modo appropriato il 100% delle volte nei test relativi alle elezioni.
- Claude Sonnet 4.6 ha risposto in modo appropriato il 99,8% delle volte nei test relativi alle elezioni.
- Sonnet 4.6 e Opus 4.7 hanno risposto in modo appropriato rispettivamente nel 90% e 94% dei test sulle operazioni di influenza.
- I banner elettorali indirizzano gli utenti statunitensi a TurboVote di Democracy Works.
- La ricerca web è stata attivata per domande elettorali nel 92% dei casi per Opus 4.7 e nel 95% per Sonnet 4.6.
- Anthropic ha pubblicato la sua metodologia di valutazione e un dataset open-source.
- Collaborazione con The Future of Free Speech, Foundation for American Innovation e Collective Intelligence Project.
Entità
Istituzioni
- Anthropic
- The Future of Free Speech
- Vanderbilt University
- Foundation for American Innovation
- Collective Intelligence Project
- Democracy Works
- TurboVote
Luoghi
- United States
- Brazil