PAVE: Architettura Cognitiva AI per la Violazione delle Regole nelle Emergenze
I ricercatori propongono PAVE (Percezione, Valutazione, Verdetto, Emulazione), un'architettura cognitiva a quattro moduli che consente agli agenti generativi di ragionare sulla legittima violazione delle regole in situazioni di emergenza come le evacuazioni antincendio. Il sistema estrae il contesto con distanza dall'autorità, comportamenti dei pari e segnali di gravità; valuta necessità, proporzionalità e alternative; decide conformità o violazione tramite un rigido gate di legittimità basato sulla personalità dell'agente; e attua il verdetto. Ciò colma una lacuna nel comportamento dell'IA per contesti cooperativi in cui potrebbe essere richiesta la violazione delle regole.
Fatti principali
- 1. PAVE sta per Percezione, Valutazione, Verdetto, Emulazione
- 2. Affronta il ragionamento sulla violazione delle regole in emergenze come l'evacuazione antincendio
- 3. Quattro moduli: Percezione, Valutazione, Verdetto, Emulazione
- 4. La Percezione estrae distanza dall'autorità, comportamenti dei pari e segnali connotati dalla gravità
- 5. La Valutazione valuta il contesto su cinque scalari inclusi il giudizio di legittimità
- 6. Il Verdetto utilizza un rigido gate di legittimità con soglia per agente derivata dalla personalità
- 7. L'Emulazione attua il verdetto e limita la violazione alla regola giustificata
- 8. Basato su modelli linguistici di grandi dimensioni per società di agenti generativi
Entità
Istituzioni
- arXiv