La R&S automatizzata dell'IA potrebbe arrivare entro il 2028, secondo l'analisi di Import AI
Un'analisi dettagliata pubblicata nella newsletter Import AI sostiene che esiste una probabilità superiore al 60% che la ricerca e lo sviluppo dell'IA completamente automatizzati—dove un sistema di IA costruisce autonomamente il proprio successore—si verifichino entro la fine del 2028. L'autore, Jack Clark, sintetizza dati pubblici da benchmark come SWE-Bench, METR time horizons, CORE-Bench, MLE-Bench, PostTrainBench e i compiti di ottimizzazione dell'addestramento LLM di Anthropic per mostrare rapidi progressi nella codifica IA, riproducibilità scientifica, progettazione del kernel e fine-tuning. I sistemi di IA ora completano compiti che richiedono fino a 12 ore agli umani e possono gestire sotto-agenti. Aziende come OpenAI, Anthropic e DeepMind hanno dichiarato pubblicamente l'obiettivo di automatizzare la R&S dell'IA, e startup come Recursive Superintelligence (500 milioni di dollari raccolti) e Mirendil stanno perseguendo lo stesso obiettivo. Il saggio mette in guardia su profonde implicazioni: rischi di allineamento, moltiplicatori di produttività e l'emergere di un'economia delle macchine ad alta intensità di capitale e a bassa intensità umana. Clark stima una probabilità del 30% entro il 2027 e del 60% entro il 2028, ma nota che l'IA non ha ancora mostrato una creatività trasformativa.
Fatti principali
- I sistemi di IA possono ora completare compiti che richiedono fino a 12 ore agli umani (Opus 4.6).
- I punteggi SWE-Bench sono passati da circa il 2% (Claude 2, fine 2023) al 93,9% (Claude Mythos Preview, 2026).
- CORE-Bench è stato dichiarato risolto al 95,5% (Opus 4.5, dicembre 2025).
- I punteggi MLE-Bench sono migliorati dal 16,9% (ottobre 2024) al 64,4% (febbraio 2026).
- Il compito di accelerazione dell'addestramento LLM di Anthropic ha raggiunto 52x (Claude Mythos Preview, aprile 2026).
- PostTrainBench mostra che i sistemi di IA ottengono circa il 25-28% rispetto al 51% di miglioramento umano.
- OpenAI punta a un tirocinante di ricerca IA automatizzato entro settembre 2026.
- Recursive Superintelligence ha raccolto 500 milioni di dollari per automatizzare la ricerca sull'IA.
Entità
Istituzioni
- OpenAI
- Anthropic
- DeepMind
- Recursive Superintelligence
- Mirendil
- METR
- University of British Columbia
- University of New South Wales
- Stanford University
- Google DeepMind
- Import AI
Luoghi
- Silicon Valley