Le rubriche LLM potenziano l'apprendimento supervisionato clinico
Un recente preprint su arXiv (2603.11679) introduce un pipeline agentico che consente ai grandi modelli linguistici (LLM) di creare rubriche sia globali che locali, migliorando l'apprendimento supervisionato per complessi dataset multimodali. La rubrica globale è una specifica programmatica derivata da una raccolta variegata di esempi serializzati in testo, volta a standardizzare i formati di input. Al contrario, le rubriche locali fungono da riassunti interpretativi adattati a compiti specifici. Valutato su 15 compiti clinici del benchmark EHRSHOT, il metodo delle rubriche ha superato i modelli basati sul conteggio delle caratteristiche, i baseline LLM semplici e un modello clinico fondamentale preaddestrato su dataset simili. Questo approccio riduce la necessità di competenze di dominio nella progettazione delle rappresentazioni di input.
Fatti principali
- arXiv:2603.11679v3
- Pipeline agentico LLM per apprendimento supervisionato
- Rubrica globale sintetizzata da diversi esempi serializzati in testo
- Le rubriche locali sono riassunti interpretativi condizionati dal compito
- Testato su 15 compiti clinici del benchmark EHRSHOT
- Ha superato i modelli basati sul conteggio delle caratteristiche, i baseline LLM ingenui e un modello clinico fondamentale
- Riduce la necessità di competenze di dominio nella rappresentazione dell'input
- Si concentra su dati multimodali: serie temporali, testo libero, record strutturati
Entità
Istituzioni
- arXiv
- EHRSHOT