ARTFEED — Contemporary Art Intelligence

Il recap di Simon Willison al PyCon US 2026: progressi degli LLM in sei mesi

ai-technology · 2026-05-19

Simon Willison ha tenuto un lightning talk al PyCon US 2026 riassumendo gli sviluppi chiave dei modelli linguistici di grandi dimensioni (LLM) da novembre 2025 a maggio 2026. Ha evidenziato il punto di svolta del novembre 2025, quando il modello "migliore" è cambiato cinque volte tra OpenAI, Google e Anthropic. Partendo da Claude Sonnet 4.5 (rilasciato il 29 settembre), il testimone è passato a GPT-5.1, Gemini 3, GPT-5.1 Codex Max e infine Claude Opus 4.5. Gli agenti di codifica sono migliorati drasticamente, passando da strumenti spesso fallimentari a strumenti affidabili per uso quotidiano grazie al Reinforcement Learning from Verifiable Rewards di OpenAI e Anthropic. L'ecosistema open-source di assistente AI personale "Claw" è emerso dal progetto Warelay (primo commit novembre 2025), rinominato OpenClaw entro febbraio 2026, causando carenze di Mac Mini nella Silicon Valley. A febbraio, Gemini 3.1 Pro ha dimostrato capacità avanzate di generazione di immagini, e Jeff Dean di Google ha twittato un pellicano animato in bicicletta. Sviluppi recenti includono i modelli open-weight Gemma 4 di Google, il GLM-5.1 (1,5 TB di parametri) del laboratorio cinese GLM, e il Qwen3.6-35B-A3B di Qwen, che ha superato Claude Opus 4.7 su un laptop. Willison ha concluso che i modelli disponibili su laptop ora superano ampiamente le aspettative.

Fatti principali

  • Simon Willison ha presentato al PyCon US 2026.
  • Il talk ha coperto gli sviluppi degli LLM da novembre 2025 a maggio 2026.
  • Novembre 2025 è stato un punto di svolta con cinque cambi di leadership dei modelli.
  • Claude Sonnet 4.5 è stato rilasciato il 29 settembre 2025.
  • Sono seguiti GPT-5.1, Gemini 3, GPT-5.1 Codex Max e Claude Opus 4.5.
  • Gli agenti di codifica sono diventati affidabili grazie al Reinforcement Learning from Verifiable Rewards.
  • OpenAI e Anthropic hanno guidato i miglioramenti degli agenti di codifica.
  • Il progetto Warelay (primo commit novembre 2025) è diventato OpenClaw entro febbraio 2026.
  • I Mac Mini sono andati esauriti nella Silicon Valley per eseguire Claws.
  • Gemini 3.1 Pro è stato rilasciato a febbraio 2026.
  • Jeff Dean ha twittato un pellicano animato in bicicletta.
  • Google ha rilasciato i modelli open-weight Gemma 4 nell'aprile 2026.
  • GLM ha rilasciato GLM-5.1, un modello open-weight da 1,5 TB.
  • Qwen ha rilasciato Qwen3.6-35B-A3B, superando Claude Opus 4.7 su un laptop.
  • Il talk di Willison è stato pubblicato il 19 maggio 2026.

Entità

Artisti

  • Simon Willison
  • Drew Breunig
  • Jeff Dean
  • Charles
  • Pete

Istituzioni

  • PyCon US
  • OpenAI
  • Anthropic
  • Google
  • GLM
  • Qwen
  • Bluesky

Luoghi

  • Silicon Valley
  • United States
  • China

Fonti