Override dei clinici come segnali impliciti di preferenza per l'IA clinica
Un nuovo articolo su arXiv propone di reinterpretare gli override dei clinici sulle raccomandazioni dell'IA come dati di preferenza impliciti, simili a RLHF ma più ricchi. Gli autori introducono una tassonomia degli override in cinque categorie, una formulazione delle preferenze condizionata allo stato del paziente, al contesto organizzativo e alla capacità del clinico, e un'architettura di apprendimento duale per addestrare congiuntamente modelli di ricompensa e di capacità. Questo approccio mira a prevenire il bias di soppressione, in cui raccomandazioni corrette ma difficili vengono sistematicamente soppresse. Il lavoro è rivolto a contesti di assistenza basata sul valore.
Fatti principali
- Gli override dei clinici sulle raccomandazioni dell'IA sono reinterpretati come dati di preferenza impliciti.
- La struttura del segnale è simile a RLHF ma più ricca grazie alla competenza di dominio e ai risultati osservabili.
- Una tassonomia degli override in cinque categorie mappa i tipi di override agli obiettivi di aggiornamento del modello.
- La formulazione delle preferenze è condizionata allo stato del paziente s, al contesto organizzativo c e alla capacità del clinico kappa.
- Kappa si scompone in capacità di esecuzione kappa-exec e capacità di allineamento kappa-align.
- Un'architettura di apprendimento duale addestra congiuntamente un modello di ricompensa e un modello di capacità tramite ottimizzazione alternata.
- Il metodo previene il bias di soppressione: soppressione sistematica di raccomandazioni corrette ma difficili.
- L'articolo è pubblicato su arXiv con ID 2604.28010.
Entità
Istituzioni
- arXiv