PRAXIS: strumento basato sull'IA diagnostica gli incidenti cloud 6 volte più velocemente
I ricercatori hanno presentato PRAXIS, un orchestratore che utilizza una traversata strutturata basata su LLM su grafi di dipendenza dei servizi e grafi di dipendenza del programma per diagnosticare incidenti cloud. Migliora l'accuratezza dell'analisi delle cause profonde fino a 6,3 volte rispetto ai baselines ReAct, riducendo al contempo il consumo di token di 5,3 volte. Il sistema è dimostrato su 30 incidenti reali in fase di compilazione in un benchmark.
Fatti principali
- 1. Gli incidenti cloud di produzione non risolti costano in media oltre 2 milioni di dollari all'ora.
- 2. PRAXIS è un orchestratore che gestisce e implementa un flusso di lavoro agentico per diagnosticare incidenti cloud causati da codice e configurazione.
- 3. PRAXIS impiega una traversata strutturata basata su LLM su due tipi di grafi: un grafo di dipendenza dei servizi (SDG) e un grafo di dipendenza del programma a blocchi hammock (PDG).
- 4. SDG cattura le dipendenze a livello di microservizio.
- 5. PDG cattura le dipendenze a livello di codice per ogni microservizio.
- 6. Rispetto ai baselines ReAct all'avanguardia, PRAXIS migliora l'accuratezza dell'RCA fino a 6,3 volte.
- 7. PRAXIS riduce il consumo di token di 5,3 volte.
- 8. PRAXIS è dimostrato su un insieme di 30 incidenti reali completi in fase di compilazione in un benchmark RCA.
Entità
Istituzioni
- arXiv