CEDAR: Agente LLM automatizza la scienza dei dati tramite ingegneria del contesto
CEDAR è un'applicazione che automatizza le attività di scienza dei dati utilizzando una configurazione agentica con modelli linguistici di grandi dimensioni. Affronta sfide come la complessità dei compiti, la dimensione dei dati, i limiti computazionali e le restrizioni di contesto attraverso un'efficace ingegneria del contesto. Il sistema struttura i prompt iniziali con campi di input specifici per la scienza dei dati, quindi genera una sequenza enumerata di blocchi di piano e codice intervallati tramite agenti LLM separati. Le chiamate di funzione mantengono i dati locali, iniettando solo statistiche aggregate nei prompt. L'approccio migliora la tolleranza ai guasti e la gestione del contesto.
Fatti principali
- CEDAR automatizza le attività di scienza dei dati con una configurazione agentica LLM.
- Utilizza l'ingegneria del contesto per superare la complessità dei compiti, la dimensione dei dati e le restrizioni di contesto.
- I prompt iniziali sono strutturati con campi di input specifici per la scienza dei dati.
- La soluzione è una sequenza enumerata di blocchi di piano e codice intervallati.
- Agenti LLM separati generano blocchi di piano e codice.
- I dati rimangono locali; solo statistiche aggregate vengono iniettate nei prompt.
- Il sistema migliora la tolleranza ai guasti e la gestione del contesto.
- L'articolo è su arXiv con ID 2601.06606.
Entità
Istituzioni
- arXiv