ARTFEED — Contemporary Art Intelligence

Agenti AI Raggiungono l'Auto-Evoluzione Spontanea Senza Ricompense Umane

ai-technology · 2026-04-22

Un recente articolo di ricerca presenta una tecnica innovativa per addestrare agenti di intelligenza artificiale a evolversi autonomamente, eliminando la necessità di ricompense esterne o supervisione umana. Questo metodo incorpora una capacità intrinseca di meta-evoluzione, consentendo agli agenti di apprendere informazioni su nuovi ambienti in modo indipendente prima di intraprendere compiti. Durante il processo di addestramento, un sistema di ricompensa basato sui risultati valuta quanto le conoscenze auto-acquisite da un agente migliorino le sue prestazioni nei compiti successivi. Questo meccanismo di ricompensa fornisce al modello efficaci capacità di esplorazione e sintesi. Durante l'inferenza, l'agente funziona senza incentivi esterni o guida umana, affidandosi interamente ai suoi parametri interni per navigare in ambienti sconosciuti. Applicato ai modelli Qwen3-30B e Seed-OSS-36B, questo approccio ha prodotto un miglioramento del 20% nelle prestazioni, segnando un cambiamento significativo rispetto ai sistemi di agenti tradizionali che si basano su ricompense definite dall'uomo. La ricerca affronta la limitazione critica della supervisione esterna negli agenti AI moderni, che tipicamente cessano di evolversi senza intervento umano.

Fatti principali

  • La ricerca addestra agenti AI per l'auto-evoluzione spontanea senza ricompense esterne
  • Gli agenti sviluppano capacità intrinseca di meta-evoluzione per apprendere informazioni su ambienti non visti
  • Il meccanismo di ricompensa basato sui risultati misura il miglioramento nel successo dei compiti successivi
  • Il segnale di ricompensa viene utilizzato solo durante la fase di addestramento per insegnare esplorazione e sintesi
  • Al momento dell'inferenza, gli agenti non richiedono ricompense esterne o istruzioni umane
  • Il metodo applicato ai modelli Qwen3-30B e Seed-OSS-36B
  • L'approccio di evoluzione nativa produce un miglioramento del 20% nelle prestazioni
  • I sistemi di agenti attuali dipendono tipicamente da ricompense e regole definite dall'uomo

Entità

Istituzioni

  • arXiv

Fonti