Tassonomia completa dei rischi dell'IA pubblicata su arXiv
Un nuovo articolo su arXiv (2408.12622) presenta una meta-revisione, un database e una tassonomia dei rischi dell'intelligenza artificiale. Gli autori notano che ricercatori, decisori politici e aziende mancano di una terminologia condivisa per discutere i rischi dell'IA. Ad esempio, 'privacy' può riferirsi alla fuga di dati del modello o alla libertà dalla sorveglianza, mentre concetti come 'legge di Goodhart', 'specification gaming', 'reward hacking' e 'mesa-optimization' descrivono tutti lo stesso fenomeno dell'IA che ottimizza per proxy. Questa diversità terminologica ostacola i confronti tra studi e una copertura completa dei rischi. L'articolo affronta questo problema creando una tassonomia unificata.
Fatti principali
- ID articolo: arXiv:2408.12622
- Tipo: sostituzione
- Titolo: The AI risk repository: A meta-review, database, and taxonomy of risks from artificial intelligence
- Affronta la mancanza di terminologia condivisa per i rischi dell'IA
- Esempi di confusione terminologica: 'privacy' ha molteplici significati
- Più termini descrivono lo stesso fenomeno: legge di Goodhart, specification gaming, reward hacking, mesa-optimization
- Obiettivo: consentire confronti tra studi e copertura completa dei rischi
- Metodo: meta-revisione e creazione di database
Entità
Istituzioni
- arXiv