Il Test Metamorfico Rivela la Memorizzazione nella Riparazione di Programmi Basata su LLM

ai-technology · 2026-04-25

Un nuovo studio da arXiv (2604.21579) indaga la fuga di dati nella riparazione automatica di programmi (APR) basata su LLM. I ricercatori combinano il test metamorfico (MT) con la log-verosimiglianza negativa (NLL) per diagnosticare la memorizzazione. Costruiscono benchmark varianti applicando trasformazioni che preservano la semantica ai dataset Defects4J e GitBug-Java. Valutando sette LLM sulle versioni originali e trasformate, scoprono che tutti i modelli all'avanguardia mostrano cali sostanziali nei tassi di successo delle patch, indicando che la memorizzazione gonfia le stime delle prestazioni.

Fatti principali

Il paper arXiv 2604.21579 indaga la memorizzazione nell'APR basata su LLM
Combina test metamorfico con log-verosimiglianza negativa
Utilizza i dataset Defects4J e GitBug-Java
Applica trasformazioni che preservano la semantica per creare benchmark varianti
Valuta sette LLM sulle versioni originali e trasformate
Tutti i LLM valutati mostrano cali sostanziali nei tassi di successo delle patch
La fuga di dati gonfia le stime delle prestazioni nell'APR
Il test metamorfico aiuta a rivelare la memorizzazione

Il Test Metamorfico Rivela la Memorizzazione nella Riparazione di Programmi Basata su LLM

Fatti principali

Entità

Istituzioni

Fonti