I GPT Mostrano Potenziale ma Rimangono Inaffidabili per la Modellazione di Fogli di Calcolo
Uno studio recente pubblicato su arXiv (2604.25689) esamina le applicazioni basate su GPT per la creazione di modelli analitici di fogli di calcolo. I ricercatori hanno valutato cinque estensioni GPT e scelto Excel AI di pulsrai.com per un'analisi approfondita. Hanno condotto esperimenti strutturati utilizzando dichiarazioni di problemi semplici per misurare Excel AI secondo i criteri ERFR (input in ogni cella; formule; assenza di numeri hardcoded; etichette; precisione). I risultati indicano che, sebbene Excel AI possa generare modelli ben organizzati, spesso manca di coerenza e riproducibilità. Lo studio evidenzia due ostacoli principali: "il problema della fiducia" e "il problema del flusso di lavoro", sottolineando la necessità che utenti esperti verifichino e modifichino i fogli di calcolo generati da GPT. Nonostante il potenziale dei GPT di creare modelli bozza che potrebbero accelerare lo sviluppo e ridurre le competenze richieste, gli strumenti attuali sono considerati inaffidabili per applicazioni professionali. L'articolo si conclude con suggerimenti per future ricerche sulle tecniche di prompting.
Fatti principali
- L'articolo indaga gli strumenti basati su GPT per costruire modelli di fogli di calcolo analitici riutilizzabili.
- Sono state esaminate cinque estensioni GPT; Excel AI di pulsrai.com è stato selezionato per test dettagliati.
- Gli esperimenti sono stati condotti su dichiarazioni di problemi semplici.
- Excel AI è stato valutato secondo i criteri ERFR: ogni input in una cella; formule di cella; nessun numero hardcoded; etichette; accuratezza.
- Excel AI produce modelli ben strutturati ma è incoerente e spesso non riproducibile.
- Due sfide centrali identificate: 'il problema della fiducia' e 'il problema del flusso di lavoro'.
- Utenti esperti sono necessari per verificare e adattare i fogli di calcolo generati da GPT.
- Gli attuali strumenti GPT rimangono inaffidabili per uso professionale.
- Vengono fornite raccomandazioni per future ricerche sulle strategie di prompting.
Entità
Istituzioni
- arXiv
- pulsrai.com