Google AlphaEarth: Caratterizzazione dell'Embedding Geometrico per il Ragionamento Ambientale
Google AlphaEarth ha sviluppato embedding a 64 dimensioni che catturano dati della superficie terrestre da 12,1 milioni di campioni negli Stati Uniti continentali, dal 2017 al 2023. La geometria di queste rappresentazioni del modello di osservazione terrestre è stata analizzata, rivelando una struttura non euclidea con una dimensionalità effettiva di 13,3 derivata dalle 64 dimensioni originali. La dimensionalità intrinseca locale è stimata a 10, e si verifica una significativa rotazione negli spazi tangenti, con l'84% delle località che supera i 60 gradi. Il coseno medio assoluto per l'allineamento locale-globale è 0,17, vicino alla linea di base casuale di 0,125. Le sonde lineari supervisionate rivelano che le direzioni concettuali ruotano lungo la varietà, ed è stato creato un sistema agentico per utilizzare questa intuizione geometrica per il ragionamento ambientale, con implicazioni che vengono esplorate per i successivi compiti di ragionamento.
Fatti principali
- Gli embedding di Google AlphaEarth sono a 64 dimensioni
- L'analisi copre 12,1 milioni di campioni degli Stati Uniti continentali
- I dati vanno dal 2017 al 2023
- La dimensionalità effettiva è 13,3 dalle 64 dimensioni grezze
- La dimensionalità intrinseca locale è approssimativamente 10
- L'84% delle località ha rotazioni dello spazio tangente superiori a 60 gradi
- Il coseno medio assoluto per l'allineamento locale-globale è 0,17
- È stato sviluppato un sistema agentico per il ragionamento ambientale
Entità
Istituzioni
Luoghi
- Continental United States