ARTFEED — Contemporary Art Intelligence

Fine-Tuning di LLM per la Previsione delle Risorse nei Workflow Cloud

ai-technology · 2026-05-18

I ricercatori hanno introdotto LASER, un framework che esegue il fine-tuning di grandi modelli linguistici su configurazioni serializzate di job di workflow per prevedere il consumo di risorse e il tempo di esecuzione per attività di cloud computing. L'approccio affronta la sfida delle configurazioni di job semi-strutturate—che includono comandi shell, parametri, grafi di dipendenza e metadati—che i metodi tradizionali di machine learning faticano a elaborare senza un'estensiva ingegneria delle caratteristiche. LASER impiega una codifica dell'output in notazione scientifica per la regressione multi-target su diversi ordini di grandezza e un decoding vincolato con riempimento di prefissi, riducendo la latenza di inferenza di oltre il 30% garantendo al contempo la validità dell'output. Il fine-tuning con attenzione completa migliora ulteriormente l'accuratezza. Il lavoro è dettagliato in un articolo su arXiv (ID 2512.19701).

Fatti principali

  • LASER esegue il fine-tuning di LLM su configurazioni serializzate di job di workflow.
  • Prevede il consumo di risorse e il tempo di esecuzione per job di workflow cloud.
  • Le configurazioni di job semi-strutturate includono comandi shell, parametri, grafi di dipendenza e metadati.
  • Il ML tradizionale richiede un'ingegneria delle caratteristiche fragile per appiattire queste informazioni.
  • La codifica dell'output in notazione scientifica gestisce target che coprono diversi ordini di grandezza.
  • Il decoding vincolato con riempimento di prefissi riduce la latenza di inferenza di oltre il 30%.
  • Il fine-tuning con attenzione completa migliora l'accuratezza.
  • L'articolo è disponibile su arXiv con ID 2512.19701.

Entità

Istituzioni

  • arXiv

Fonti