CR4T: Quadro di Sicurezza AI per le Interazioni degli Adolescenti con i LLM

ai-technology · 2026-05-23

Un nuovo articolo di ricerca da arXiv propone CR4T (Critique-and-Revise-for-Teenagers), un quadro di salvaguardia agnostico rispetto al modello per i grandi modelli linguistici (LLM) utilizzati dagli adolescenti. Gli autori sostengono che gli attuali meccanismi di sicurezza, basati su norme centrate sugli adulti e sulla soppressione tramite rifiuto, creano vicoli ciechi conversazionali e non affrontano le vulnerabilità evolutive. CR4T ricostruisce selettivamente output non sicuri o basati sul rifiuto in risposte appropriate all'età e orientate alla guida, inquadrando la sicurezza degli adolescenti nei LLM come un problema di trasformazione socio-tecnica piuttosto che un problema di filtraggio. L'articolo è pubblicato con ID arXiv 2605.21609.

Fatti principali

ID articolo arXiv 2605.21609
Propone il framework CR4T
CR4T sta per Critique-and-Revise-for-Teenagers
Approccio agnostico rispetto al modello
Si concentra sulla sicurezza degli adolescenti nei LLM
Critica le norme di sicurezza centrate sugli adulti
Ricostruisce gli output in risposte appropriate all'età
Inquadra la sicurezza come problema di trasformazione

CR4T: Quadro di Sicurezza AI per le Interazioni degli Adolescenti con i LLM

Fatti principali

Entità

Istituzioni

Fonti