I Sistemi di Auto-Ricerca Mancano di Chiusura Scientifica
Un nuovo articolo sostiene che la chiusura del flusso di lavoro nei sistemi di auto-ricerca non equivale alla chiusura scientifica. Sebbene questi sistemi possano completare cicli simili alla ricerca—dalla generazione di idee all'esecuzione di esperimenti, scrittura e autovalutazione—i risultati mancano di validità scientifica. Gli autori propongono che un'auto-ricerca affidabile dovrebbe mirare all'esecuzione autonoma sotto controllo epistemico non autonomo, non all'autosufficienza autonoma. Basato su un'indagine di oltre 100 articoli e repository recenti, e su un audit strutturato di 21 sistemi rappresentativi, l'articolo identifica tre modelli ricorrenti di fallimento: collasso dell'obiettivo (obiettivi singoli proxy che sostituiscono obiettivi multi-obiettivo), collasso della validazione (autovalutazione interna che sostituisce la validazione indipendente) e collasso dell'accettazione. I risultati evidenziano limitazioni fondamentali negli attuali approcci di auto-ricerca.
Fatti principali
- L'articolo sostiene che la chiusura del flusso di lavoro non è chiusura scientifica nei sistemi di auto-ricerca.
- I sistemi possono completare cicli simili alla ricerca internamente.
- L'auto-ricerca affidabile dovrebbe mirare all'esecuzione autonoma sotto controllo epistemico non autonomo.
- Condotta un'indagine su oltre 100 articoli e repository recenti.
- Eseguito un audit strutturato di 21 sistemi rappresentativi.
- Identificati tre modelli di fallimento: collasso dell'obiettivo, collasso della validazione, collasso dell'accettazione.
- Collasso dell'obiettivo: obiettivi singoli proxy sostituiscono obiettivi scientifici multi-obiettivo.
- Collasso della validazione: autovalutazione interna sostituisce la validazione indipendente.
Entità
—