ARTFEED — Contemporary Art Intelligence

La disomogeneità degli LLM sblocca la creatività scientifica

ai-technology · 2026-05-12

Un nuovo studio su arXiv introduce SciAidanBench, un benchmark che misura la creatività scientifica nei modelli linguistici di grandi dimensioni (LLM). I ricercatori hanno valutato 19 modelli base di 8 fornitori (30 varianti totali) su domande scientifiche aperte, contando le idee uniche e coerenti come proxy del potenziale creativo. Lo studio rileva che il progresso nelle capacità degli LLM è disomogeneo: irregolare tra compiti, domini e scale dei modelli. I miglioramenti nella creatività generale non si traducono uniformemente in creatività scientifica, rivelando disomogeneità sia tra i modelli che all'interno di essi. Il lavoro evidenzia la natura irregolare del progresso dell'IA e le sue implicazioni per la scoperta scientifica.

Fatti principali

  • SciAidanBench misura la creatività scientifica degli LLM
  • Valutati 19 modelli base di 8 fornitori (30 varianti)
  • I modelli generano idee uniche e coerenti per domande scientifiche
  • Il progresso negli LLM è disomogeneo, non uniforme
  • I miglioramenti nella creatività generale non si trasferiscono uniformemente alla creatività scientifica
  • Disomogeneità osservata sia tra i modelli che al loro interno
  • Studio pubblicato su arXiv (2605.10574)
  • Focus sulla generazione di idee scientifiche aperte

Entità

Istituzioni

  • arXiv

Fonti