La disomogeneità degli LLM sblocca la creatività scientifica
Un nuovo studio su arXiv introduce SciAidanBench, un benchmark che misura la creatività scientifica nei modelli linguistici di grandi dimensioni (LLM). I ricercatori hanno valutato 19 modelli base di 8 fornitori (30 varianti totali) su domande scientifiche aperte, contando le idee uniche e coerenti come proxy del potenziale creativo. Lo studio rileva che il progresso nelle capacità degli LLM è disomogeneo: irregolare tra compiti, domini e scale dei modelli. I miglioramenti nella creatività generale non si traducono uniformemente in creatività scientifica, rivelando disomogeneità sia tra i modelli che all'interno di essi. Il lavoro evidenzia la natura irregolare del progresso dell'IA e le sue implicazioni per la scoperta scientifica.
Fatti principali
- SciAidanBench misura la creatività scientifica degli LLM
- Valutati 19 modelli base di 8 fornitori (30 varianti)
- I modelli generano idee uniche e coerenti per domande scientifiche
- Il progresso negli LLM è disomogeneo, non uniforme
- I miglioramenti nella creatività generale non si trasferiscono uniformemente alla creatività scientifica
- Disomogeneità osservata sia tra i modelli che al loro interno
- Studio pubblicato su arXiv (2605.10574)
- Focus sulla generazione di idee scientifiche aperte
Entità
Istituzioni
- arXiv