Geo-Expert: LLM a Efficienza Parametrica per il Ragionamento Geologico
I ricercatori introducono Geo-Expert, una famiglia di modelli linguistici di grandi dimensioni a efficienza parametrica, ottimizzati per il ragionamento geologico a livello esperto. I modelli sono costruiti affinando tre architetture di base—Qwen3-8B, Qwen3-32B e Gemma-3-27B—utilizzando Low-Rank Adaptation (LoRA) su un dataset di istruzioni curato su misura. È stato sviluppato un nuovo benchmark, Geo-Eval, per la valutazione. I risultati mostrano che un modello da 8B allineato al dominio supera i generalisti da 70B a pesi aperti e il GPT-4o proprietario in compiti geologici specializzati, mentre una variante da 32B si avvicina ai modelli di ragionamento all'avanguardia. Il lavoro affronta il divario in cui i LLM di uso generale allucinano sul ragionamento geologico del sottosuolo e del tempo profondo, mentre l'attuale IA nelle scienze della Terra si concentra sul telerilevamento superficiale e sui GIS.
Fatti principali
- Geo-Expert è una famiglia di LLM geologici a efficienza parametrica.
- Affinati su un dataset di istruzioni curato su misura e di alta qualità.
- Tre modelli di base utilizzati: Qwen3-8B, Qwen3-32B, Gemma-3-27B.
- Metodo di affinamento: Low-Rank Adaptation (LoRA).
- Benchmark di valutazione: Geo-Eval (specifico del dominio).
- Il modello da 8B supera i generalisti da 70B e GPT-4o nel ragionamento geologico.
- La variante da 32B si avvicina ai modelli di ragionamento all'avanguardia.
- Affronta l'allucinazione nel ragionamento geologico del sottosuolo e del tempo profondo.
Entità
—