Test di creatività per LLM sotto esame in un nuovo studio
Un nuovo studio su arXiv (2605.13450) analizza attentamente quanto bene possiamo misurare la creatività umana rispetto ai grandi modelli linguistici (LLM). Si concentra su tre aspetti principali: scrittura creativa, pensiero divergente e ideazione scientifica. I risultati mostrano che il Divergent Association Task (DAT) e il Conditional DAT sono le migliori misure per la scrittura creativa e il pensiero divergente. Tuttavia, lo studio evidenzia anche problemi riguardo all'utilità di queste valutazioni per giudicare la creatività delle macchine, notando che hanno una validità limitata persino per misurare la creatività umana. Questa è la prima valutazione dettagliata del genere.
Fatti principali
- Studio da arXiv (2605.13450) valuta i test di creatività per LLM
- Valuta scrittura creativa, pensiero divergente e ideazione scientifica
- DAT e Conditional DAT sono i migliori predittori per scrittura creativa e pensiero divergente
- Mette in dubbio la validità dei test di creatività umana per le macchine
- Primo studio sistematico su larga scala su questo argomento
Entità
Istituzioni
- arXiv