Valutazione del Rischio di Depressione Basata su LLM nei Post di Reddit
Un nuovo approccio impiega Large Language Models (LLM) per valutare il rischio di depressione nei commenti di Reddit, identificando otto emozioni legate alla depressione e calcolando un indice di gravità con punteggi ponderati. Questa tecnica è stata testata in modalità zero-shot sul dataset DepressionEmo, che contiene circa 6.000 post, ed è stata anche utilizzata su 469.692 commenti provenienti da quattro subreddit durante il periodo 2024-2025. Il modello con le migliori prestazioni, gemma3:27b, ha registrato un micro-F1 di 0,75 e un macro-F1 di 0,70, dimostrandosi competitivo con il modello BART fine-tuned (micro-F1=0,80, macro-F1=0,76). Questa ricerca sottolinea il potenziale degli LLM per la sorveglianza della salute mentale su larga scala attraverso le piattaforme di social media.
Fatti principali
- Il sistema utilizza LLM per la classificazione multi-etichetta di otto emozioni associate alla depressione.
- Valutato sul dataset DepressionEmo con circa 6.000 post.
- Applicato in-the-wild a 469.692 commenti da quattro subreddit.
- Dati raccolti nel periodo 2024-2025.
- Miglior modello: gemma3:27b.
- Raggiunto micro-F1=0,75, macro-F1=0,70.
- BART fine-tuned ha ottenuto micro-F1=0,80, macro-F1=0,76.
- Pubblicato su arXiv con ID 2604.19887.
Entità
Istituzioni
- arXiv