Hasty Briefsbeta

双语

The Annotated Kolmogorov-Arnold Network (Kan)

a year ago

#neural-networks
#machine-learning
#KAN

Kolmogorov-Arnold网络（KANs）作为多层感知机（MLPs）的替代方案被提出，其核心在于通过函数应用而非标量乘法来参数化激活函数。
KANs基于Kolmogorov-Arnold表示定理，该定理允许任何连续平滑函数通过一元函数表达，但这一理论保证仅适用于2层KAN模型。
KANs采用模块化架构，每层对输入施加可学习的非线性函数，类似于MLPs中的矩阵向量运算，但以函数应用形式实现。
B样条曲线被用作KANs中的可学习激活函数，通过分段多项式近似提供灵活性，其系数可在训练过程中学习。
KANs训练采用标准深度学习技术，包括反向传播和正则化（L1与熵正则化），以促进稀疏性并避免激活函数冗余。
相比MLPs，KANs在可解释性和参数效率方面具有潜在优势，但在计算效率和可扩展性方面面临挑战。
文章展示了KANs在合成函数上的实际应用与可视化，同时指出当前在MNIST分类等任务扩展性方面的局限。
关于KANs效率优化的开放性问题仍然存在，包括参数化函数族的选择和计算内核的潜在改进方向。