ARTFEED — Contemporary Art Intelligence

Il Modello CodeMMR Unifica il Recupero di Linguaggio Naturale, Codice e Immagini per l'Ingegneria del Software

ai-technology · 2026-04-20

È stato lanciato un nuovo benchmark chiamato MMCoIR per valutare il recupero di informazioni sul codice multimodale, coprendo cinque domini visivi, otto linguaggi di programmazione e undici librerie. Questo benchmark sottolinea le sfide dell'integrazione di strutture visive e di programmazione nei sistemi di recupero. Per affrontarle, i ricercatori hanno sviluppato CodeMMR, un modello di recupero versatile che combina linguaggio naturale, codice e immagini in un quadro semantico unificato. Grazie al suo allineamento multimodale basato su istruzioni, il modello mostra un'eccellente adattabilità tra diverse modalità. La ricerca di codice svolge un ruolo vitale nell'ingegneria del software moderna, migliorando la scoperta e il riutilizzo del codice mentre aumenta l'affidabilità con i grandi modelli linguistici. I tradizionali modelli di recupero spesso trascurano i componenti visivi negli artefatti di programmazione, come interfacce web e diagrammi. La ricerca evidenzia l'efficacia del modello, dettagliata nella prestampa arXiv:2604.15663v1, mostrando un approccio interdisciplinare.

Fatti principali

  • CodeMMR è un modello di recupero unificato per linguaggio naturale, codice e immagini.
  • Incorpora più modalità in uno spazio semantico condiviso utilizzando l'allineamento basato su istruzioni.
  • Il modello affronta le limitazioni testocentriche dei sistemi esistenti di recupero di informazioni sul codice.
  • MMCoIR è il primo benchmark completo per valutare il recupero di informazioni sul codice multimodale.
  • Il benchmark copre cinque domini visivi, otto linguaggi di programmazione e undici librerie.
  • La ricerca di codice sostiene l'ingegneria del software moderna e alimenta la generazione aumentata dal recupero.
  • Gli artefatti di programmazione visiva includono interfacce web, visualizzazioni di dati, SVG, diagrammi schematici e UML.
  • La ricerca è documentata nella prestampa arXiv:2604.15663v1, annunciata come interdisciplinare.

Entità

Istituzioni

  • arXiv

Fonti