Fine-Tuning di LLM per la Previsione delle Risorse nei Workflow Cloud

ai-technology · 2026-05-18

I ricercatori hanno introdotto LASER, un framework che esegue il fine-tuning di grandi modelli linguistici su configurazioni serializzate di job di workflow per prevedere il consumo di risorse e il tempo di esecuzione per attività di cloud computing. L'approccio affronta la sfida delle configurazioni di job semi-strutturate—che includono comandi shell, parametri, grafi di dipendenza e metadati—che i metodi tradizionali di machine learning faticano a elaborare senza un'estensiva ingegneria delle caratteristiche. LASER impiega una codifica dell'output in notazione scientifica per la regressione multi-target su diversi ordini di grandezza e un decoding vincolato con riempimento di prefissi, riducendo la latenza di inferenza di oltre il 30% garantendo al contempo la validità dell'output. Il fine-tuning con attenzione completa migliora ulteriormente l'accuratezza. Il lavoro è dettagliato in un articolo su arXiv (ID 2512.19701).

Fatti principali

LASER esegue il fine-tuning di LLM su configurazioni serializzate di job di workflow.
Prevede il consumo di risorse e il tempo di esecuzione per job di workflow cloud.
Le configurazioni di job semi-strutturate includono comandi shell, parametri, grafi di dipendenza e metadati.
Il ML tradizionale richiede un'ingegneria delle caratteristiche fragile per appiattire queste informazioni.
La codifica dell'output in notazione scientifica gestisce target che coprono diversi ordini di grandezza.
Il decoding vincolato con riempimento di prefissi riduce la latenza di inferenza di oltre il 30%.
Il fine-tuning con attenzione completa migliora l'accuratezza.
L'articolo è disponibile su arXiv con ID 2512.19701.

Fine-Tuning di LLM per la Previsione delle Risorse nei Workflow Cloud

Fatti principali

Entità

Istituzioni

Fonti