TelecomTS: Un Dataset di Osservabilità Multi-Modale per l'Analisi di Serie Temporali e Linguaggio
Per affrontare la mancanza di grandi dataset di osservabilità nei benchmark pubblici, è stato lanciato un nuovo dataset chiamato TelecomTS. Proveniente da una rete di telecomunicazioni 5G, TelecomTS include covariate eterogenee e de-anonimizzate che contengono chiari dettagli di scala assoluta. Offre un'ampia gamma di compiti downstream, come l'analisi delle cause profonde e il rilevamento di anomalie, facilitando il ragionamento multi-modale. Questo dataset mira a superare le carenze degli attuali dataset anonimizzati e normalizzati, che eliminano le informazioni essenziali sulla scala.
Fatti principali
- TelecomTS è un dataset di osservabilità su larga scala derivato da una rete di telecomunicazioni 5G.
- Presenta covariate eterogenee e de-anonimizzate con informazioni esplicite sulla scala assoluta.
- Il dataset fornisce compiti downstream tra cui rilevamento di anomalie e analisi delle cause profonde.
- I dataset di osservabilità esistenti sono spesso anonimizzati e normalizzati, rimuovendo le informazioni sulla scala.
- I dati di osservabilità sono zero-inflazionati, altamente stocastici e mostrano una struttura temporale minima.
- Il dataset è introdotto per affrontare la sottorappresentazione dei dati di osservabilità nei benchmark pubblici.
- Restrizioni proprietarie e preoccupazioni per la privacy hanno limitato la disponibilità di tali dataset.
- TelecomTS abilita compiti di ragionamento multi-modale.
Entità
—