ARTFEED — Contemporary Art Intelligence

BoostAPR: Riparazione Automatica di Programmi Basata su RL con Doppie Ricompense

other · 2026-05-12

BoostAPR è un sistema innovativo che migliora la riparazione automatica dei programmi attraverso l'apprendimento per rinforzo basato sull'esecuzione. Opera in tre fasi chiave: messa a punto iniziale con esempi convalidati dall'esecuzione, creazione di modelli di ricompensa basati su approfondimenti sequenziali e a livello di riga, e utilizzo dell'ottimizzazione della politica prossimale (PPO) per enfatizzare le ricompense importanti a livello di riga. Nei test condotti sulla piattaforma SWE-Gym, BoostAPR ha registrato metriche di performance impressionanti, raggiungendo il 40,7% di accuratezza su SWE-bench Verified (un miglioramento di 22,9 punti percentuali), il 24,8% su Defects4J (da Python a Java), l'84,5% su HumanEval-Java e il 95,0% su QuixBugs, dimostrando la sua versatilità tra i linguaggi di programmazione.

Fatti principali

  • BoostAPR è un framework a tre fasi per la riparazione automatica dei programmi
  • Utilizza l'apprendimento per rinforzo basato sull'esecuzione con modelli di ricompensa duali
  • Include un valutatore a livello di sequenza e un allocatore di credito a livello di riga
  • Addestrato su SWE-Gym e valutato su quattro benchmark
  • Raggiunge il 40,7% su SWE-bench Verified
  • Raggiunge il 24,8% su Defects4J (trasferimento da Python a Java)
  • Raggiunge l'84,5% su HumanEval-Java
  • Raggiunge il 95,0% su QuixBugs

Entità

Fonti