Studio sul parametro di scala gaussiana nelle reti di Kolmogorov-Arnold
Uno studio recente pubblicato su arXiv esamina come il parametro di scala gaussiana ε influenzi le reti di Kolmogorov-Arnold gaussiane (KAN). Rivela che la selezione della scala è determinata principalmente dal primo strato, che è costruito unicamente sul dominio di input. Qualsiasi perdita di distinguibilità che si verifica in questa fase non può essere corretta dagli strati successivi. I ricercatori valutano la matrice delle caratteristiche del primo strato e propongono un intervallo pratico per ε: [1/(G-1), 2/(G-1)], dove G rappresenta il numero di centri gaussiani. Per il KAN gaussiano convenzionale a centri condivisi, questo intervallo non è visto come un criterio di ottimalità definitivo, ma piuttosto come una raccomandazione per una scalatura efficace.
Fatti principali
- L'articolo arXiv 2604.21174 studia i KAN gaussiani
- Il parametro di scala gaussiana ε è centrale per il comportamento dei KAN gaussiani
- La selezione della scala è governata principalmente dal primo strato
- Il primo strato è l'unico strato costruito direttamente sul dominio di input
- La perdita di distinguibilità nel primo strato non può essere recuperata in seguito
- Intervallo operativo pratico per ε: [1/(G-1), 2/(G-1)]
- G denota il numero di centri gaussiani
- L'intervallo non è un risultato di ottimalità universale per il KAN gaussiano a centri condivisi
Entità
Istituzioni
- arXiv