Pianificazione Dinamica dei Dati Basata su Grafi per l'Addestramento di LLM

ai-technology · 2026-06-01

Un nuovo framework chiamato D$^3$ (Dynamic Directional graph-constrained Data scheduling) affronta le interazioni trascurate tra i campioni di addestramento nell'ottimizzazione dei modelli linguistici di grandi dimensioni (LLM). La maggior parte delle strategie esistenti di pianificazione dei dati regola la distribuzione complessiva dei dati ma ignora le influenze direzionali tra i campioni, che influenzano l'ordine di addestramento. D$^3$ modella queste interazioni come un grafo di influenza dinamico con archi basati sulla perdita, quindi risolve un'ottimizzazione vincolata per determinare la sequenza di addestramento che dà priorità alle unità di addestramento più influenti. L'approccio mira a migliorare l'efficienza dell'apprendimento rispettando le dipendenze tra i campioni. L'articolo è disponibile su arXiv con identificativo 2605.31164.

Fatti principali

D$^3$ è un framework di pianificazione dinamica dei dati basata su grafi direzionali per l'addestramento di LLM.
Formalizza le interazioni tra le unità di addestramento come un grafo di influenza dinamico con dipendenze basate sulla perdita.
Il framework risolve un problema di ottimizzazione vincolata sul grafo per derivare l'ordine di addestramento.
Le strategie esistenti di pianificazione dei dati trascurano le interazioni sottostanti tra i campioni.
I campioni di dati reali mostrano influenze direzionali reciproche.
Dare priorità alle unità di addestramento con maggiore influenza migliora l'efficienza dell'apprendimento.
L'articolo è pubblicato su arXiv con ID 2605.31164.
L'approccio è progettato per l'ottimizzazione di modelli linguistici di grandi dimensioni.

Pianificazione Dinamica dei Dati Basata su Grafi per l'Addestramento di LLM

Fatti principali

Entità

Istituzioni

Fonti