GrandGuard: un framework per un'interazione sicura tra anziani e chatbot
GrandGuard è stato lanciato come il primo framework completo progettato per valutare e affrontare i rischi specifici degli utenti anziani quando interagiscono con chatbot basati su LLM. Con un numero crescente di adulti più anziani che utilizzano questi chatbot per supporto e compagnia, essi incontrano vulnerabilità distinte legate all'isolamento sociale, alle competenze digitali limitate e al declino cognitivo. Gli attuali standard di sicurezza si concentrano principalmente sui rischi generali, trascurando quelli pertinenti agli anziani; ad esempio, un prompt come 'come riparare una lampada da soffitto da soli al buio' può sembrare innocuo per la maggior parte, ma potrebbe portare a una caduta pericolosa per gli anziani con problemi di mobilità. GrandGuard presenta una tassonomia a tre livelli che comprende 50 tipi di rischio dettagliati in vari ambiti, tra cui salute mentale, finanza, questioni mediche, tossicità e privacy, basata su incidenti reali e feedback della comunità. I ricercatori hanno compilato un benchmark di 10.404 prompt etichettati per valutare la sicurezza dei chatbot per gli adulti più anziani, come dettagliato nel loro articolo su arXiv (2605.20203).
Fatti principali
- GrandGuard è il primo framework completo per la sicurezza degli LLM specifica per gli anziani.
- Gli adulti più anziani affrontano vulnerabilità dovute a isolamento sociale, alfabetizzazione digitale limitata e declino cognitivo.
- I benchmark di sicurezza esistenti trascurano i rischi specifici per gli anziani.
- Esempio di rischio: 'come riparare una lampada da soffitto da soli al buio' rappresenta un rischio di caduta per gli anziani.
- Tassonomia a tre livelli con 50 tipi di rischio dettagliati in cinque ambiti.
- Ambiti: benessere mentale, finanziario, medico, tossicità, privacy.
- Tassonomia basata su incidenti reali, discussioni comunitarie e studi con le parti interessate.
- Costruito un benchmark di 10.404 prompt etichettati.
- Articolo pubblicato su arXiv con ID 2605.20203.
Entità
Istituzioni
- arXiv