Override dei clinici come segnali impliciti di preferenza per l'IA clinica

ai-technology · 2026-05-01

Un nuovo articolo su arXiv propone di reinterpretare gli override dei clinici sulle raccomandazioni dell'IA come dati di preferenza impliciti, simili a RLHF ma più ricchi. Gli autori introducono una tassonomia degli override in cinque categorie, una formulazione delle preferenze condizionata allo stato del paziente, al contesto organizzativo e alla capacità del clinico, e un'architettura di apprendimento duale per addestrare congiuntamente modelli di ricompensa e di capacità. Questo approccio mira a prevenire il bias di soppressione, in cui raccomandazioni corrette ma difficili vengono sistematicamente soppresse. Il lavoro è rivolto a contesti di assistenza basata sul valore.

Fatti principali

Gli override dei clinici sulle raccomandazioni dell'IA sono reinterpretati come dati di preferenza impliciti.
La struttura del segnale è simile a RLHF ma più ricca grazie alla competenza di dominio e ai risultati osservabili.
Una tassonomia degli override in cinque categorie mappa i tipi di override agli obiettivi di aggiornamento del modello.
La formulazione delle preferenze è condizionata allo stato del paziente s, al contesto organizzativo c e alla capacità del clinico kappa.
Kappa si scompone in capacità di esecuzione kappa-exec e capacità di allineamento kappa-align.
Un'architettura di apprendimento duale addestra congiuntamente un modello di ricompensa e un modello di capacità tramite ottimizzazione alternata.
Il metodo previene il bias di soppressione: soppressione sistematica di raccomandazioni corrette ma difficili.
L'articolo è pubblicato su arXiv con ID 2604.28010.

Override dei clinici come segnali impliciti di preferenza per l'IA clinica

Fatti principali

Entità

Istituzioni

Fonti