La distribuzione a legge di potenza dei dati potenzia il ragionamento compositivo dell'IA

ai-technology · 2026-04-29

Un recente studio pubblicato su arXiv indica che l'addestramento di modelli di IA utilizzando dati in linguaggio naturale che seguono una distribuzione a legge di potenza—caratterizzata da occorrenze poco frequenti della maggior parte delle conoscenze—produce risultati migliori rispetto all'addestramento con una distribuzione uniforme per compiti che coinvolgono il ragionamento compositivo, come il tracciamento degli stati e l'aritmetica a più passaggi. Gli autori presentano un compito minimalista di composizione di abilità per illustrare che il campionamento a legge di potenza richiede significativamente meno dati di addestramento. I loro risultati teorici suggeriscono che questa distribuzione crea un'asimmetria benefica nel panorama della funzione di perdita, consentendo ai modelli di apprendere inizialmente composizioni di abilità ad alta frequenza con una complessità dei dati inferiore, facilitando successivamente l'apprendimento di abilità meno comuni. L'articolo, intitolato "The Power of Power Law: Asymmetry Enables Compositional Reasoning", è stato presentato su arXiv il 26 aprile 2025.

Fatti principali

ID articolo arXiv: 2604.22951
Pubblicato: 26 aprile 2025
La distribuzione a legge di potenza supera quella uniforme per il ragionamento compositivo
Compiti testati: tracciamento degli stati, aritmetica a più passaggi
Il campionamento a legge di potenza richiede meno dati di addestramento
L'asimmetria benefica nel panorama della funzione di perdita è il meccanismo chiave
Compito minimalista di composizione di abilità utilizzato per la dimostrazione teorica
I dati in linguaggio naturale seguono una distribuzione a legge di potenza

La distribuzione a legge di potenza dei dati potenzia il ragionamento compositivo dell'IA

Fatti principali

Entità

Istituzioni

Fonti