Modelli Linguistici Piccoli Auto-Promptanti per l'Estrazione di Entità Cliniche

ai-technology · 2026-05-07

Un nuovo framework consente a piccoli modelli linguistici di creare, validare, migliorare e valutare autonomamente prompt specifici per il riconoscimento di entità cliniche da note odontoiatriche. Questo metodo affronta problemi legati a documentazione non strutturata, specializzata e sensibile alla privacy. I ricercatori hanno testato modelli open-weight utilizzando 1.200 note annotate, impiegando inferenza ensemble multi-prompt e perfezionando i modelli selezionati tramite supervised fine-tuning basato su QLoRA e ottimizzazione diretta delle preferenze. Il modello Qwen2.5-14B-Instruct ha mostrato i migliori risultati di base. Dopo DPO, Qwen2.5-14B-Instruct e Llama-3.1-8B-Instruct hanno registrato punteggi F1 micro/macro rispettivamente di 0,864/0,837 e 0,806/0,797. I risultati rivelano significative discrepanze di performance tra i modelli, sottolineando l'importanza di valutazioni specifiche per compito piuttosto che fare affidamento su benchmark generici.

Fatti principali

Il framework consente a piccoli modelli linguistici di auto-generare, verificare, perfezionare e valutare prompt specifici per entità
Applicato al riconoscimento di entità cliniche da note odontoiatriche
1.200 note annotate utilizzate per la valutazione
Inferenza ensemble multi-prompt per valutare i modelli open-weight candidati
Modelli selezionati adattati tramite supervised fine-tuning basato su QLoRA e ottimizzazione diretta delle preferenze
Qwen2.5-14B-Instruct ha ottenuto le migliori performance di base
Dopo DPO, Qwen2.5-14B-Instruct F1 micro/macro: 0,864/0,837
Dopo DPO, Llama-3.1-8B-Instruct F1 micro/macro: 0,806/0,797

Modelli Linguistici Piccoli Auto-Promptanti per l'Estrazione di Entità Cliniche

Fatti principali

Entità

Istituzioni

Fonti