CR4T: Quadro di Sicurezza AI per le Interazioni degli Adolescenti con i LLM
Un nuovo articolo di ricerca da arXiv propone CR4T (Critique-and-Revise-for-Teenagers), un quadro di salvaguardia agnostico rispetto al modello per i grandi modelli linguistici (LLM) utilizzati dagli adolescenti. Gli autori sostengono che gli attuali meccanismi di sicurezza, basati su norme centrate sugli adulti e sulla soppressione tramite rifiuto, creano vicoli ciechi conversazionali e non affrontano le vulnerabilità evolutive. CR4T ricostruisce selettivamente output non sicuri o basati sul rifiuto in risposte appropriate all'età e orientate alla guida, inquadrando la sicurezza degli adolescenti nei LLM come un problema di trasformazione socio-tecnica piuttosto che un problema di filtraggio. L'articolo è pubblicato con ID arXiv 2605.21609.
Fatti principali
- ID articolo arXiv 2605.21609
- Propone il framework CR4T
- CR4T sta per Critique-and-Revise-for-Teenagers
- Approccio agnostico rispetto al modello
- Si concentra sulla sicurezza degli adolescenti nei LLM
- Critica le norme di sicurezza centrate sugli adulti
- Ricostruisce gli output in risposte appropriate all'età
- Inquadra la sicurezza come problema di trasformazione
Entità
Istituzioni
- arXiv