Nuova ricerca sull'IA dimostra che l'apprendimento per rinforzo migliora l'analisi dei referti medici
Un recente studio nel campo della ricerca sull'intelligenza artificiale rivela che l'apprendimento per rinforzo può migliorare sia la precisione che le capacità di ragionamento dei grandi modelli linguistici durante la valutazione dei referti radiologici per l'identificazione di patologie. La ricerca presenta una metodologia in due fasi: un primo affinamento supervisionato basato sulle etichette delle malattie, seguito dall'Ottimizzazione Relativa di Politica di Gruppo (GRPO), che migliora le previsioni senza necessitare di una guida esplicita al ragionamento. Valutato su tre dataset annotati da radiologi, questo approccio ha superato i metodi tradizionali, con il GRPO che ha aumentato significativamente l'accuratezza della classificazione e il richiamo del ragionamento. Questo lavoro affronta il problema di migliorare l'accuratezza preservando il ragionamento nell'IA medica. È stato pubblicato su arXiv nei campi dell'informatica e dell'intelligenza artificiale, con potenziali benefici per l'assistenza sanitaria nell'interpretazione dei referti radiologici per diagnosi e strategie terapeutiche.
Fatti principali
- L'apprendimento per rinforzo migliora l'accuratezza dei LLM nella classificazione delle patologie dai referti radiologici
- L'approccio in due fasi utilizza l'affinamento supervisionato seguito dall'Ottimizzazione Relativa di Politica di Gruppo (GRPO)
- Il GRPO affina le previsioni ottimizzando accuratezza e formato senza supervisione del ragionamento
- Metodo testato su tre dataset annotati da radiologi
- L'affinamento supervisionato ha superato gli approcci di base
- Il GRPO ha ulteriormente migliorato le prestazioni di classificazione
- Migliorato il richiamo del ragionamento e la completezza
- Pubblicato su arXiv nelle categorie informatica e intelligenza artificiale
Entità
Istituzioni
- arXiv