Il recap di Simon Willison al PyCon US 2026: progressi degli LLM in sei mesi
Simon Willison ha tenuto un lightning talk al PyCon US 2026 riassumendo gli sviluppi chiave dei modelli linguistici di grandi dimensioni (LLM) da novembre 2025 a maggio 2026. Ha evidenziato il punto di svolta del novembre 2025, quando il modello "migliore" è cambiato cinque volte tra OpenAI, Google e Anthropic. Partendo da Claude Sonnet 4.5 (rilasciato il 29 settembre), il testimone è passato a GPT-5.1, Gemini 3, GPT-5.1 Codex Max e infine Claude Opus 4.5. Gli agenti di codifica sono migliorati drasticamente, passando da strumenti spesso fallimentari a strumenti affidabili per uso quotidiano grazie al Reinforcement Learning from Verifiable Rewards di OpenAI e Anthropic. L'ecosistema open-source di assistente AI personale "Claw" è emerso dal progetto Warelay (primo commit novembre 2025), rinominato OpenClaw entro febbraio 2026, causando carenze di Mac Mini nella Silicon Valley. A febbraio, Gemini 3.1 Pro ha dimostrato capacità avanzate di generazione di immagini, e Jeff Dean di Google ha twittato un pellicano animato in bicicletta. Sviluppi recenti includono i modelli open-weight Gemma 4 di Google, il GLM-5.1 (1,5 TB di parametri) del laboratorio cinese GLM, e il Qwen3.6-35B-A3B di Qwen, che ha superato Claude Opus 4.7 su un laptop. Willison ha concluso che i modelli disponibili su laptop ora superano ampiamente le aspettative.
Fatti principali
- Simon Willison ha presentato al PyCon US 2026.
- Il talk ha coperto gli sviluppi degli LLM da novembre 2025 a maggio 2026.
- Novembre 2025 è stato un punto di svolta con cinque cambi di leadership dei modelli.
- Claude Sonnet 4.5 è stato rilasciato il 29 settembre 2025.
- Sono seguiti GPT-5.1, Gemini 3, GPT-5.1 Codex Max e Claude Opus 4.5.
- Gli agenti di codifica sono diventati affidabili grazie al Reinforcement Learning from Verifiable Rewards.
- OpenAI e Anthropic hanno guidato i miglioramenti degli agenti di codifica.
- Il progetto Warelay (primo commit novembre 2025) è diventato OpenClaw entro febbraio 2026.
- I Mac Mini sono andati esauriti nella Silicon Valley per eseguire Claws.
- Gemini 3.1 Pro è stato rilasciato a febbraio 2026.
- Jeff Dean ha twittato un pellicano animato in bicicletta.
- Google ha rilasciato i modelli open-weight Gemma 4 nell'aprile 2026.
- GLM ha rilasciato GLM-5.1, un modello open-weight da 1,5 TB.
- Qwen ha rilasciato Qwen3.6-35B-A3B, superando Claude Opus 4.7 su un laptop.
- Il talk di Willison è stato pubblicato il 19 maggio 2026.
Entità
Artisti
- Simon Willison
- Drew Breunig
- Jeff Dean
- Charles
- Pete
Istituzioni
- PyCon US
- OpenAI
- Anthropic
- GLM
- Qwen
- Bluesky
Luoghi
- Silicon Valley
- United States
- China