Alice's Adventures in a Differentiable Wonderland
a year ago
- #Machine Learning
- #Differentiable Programming
- #Neural Networks
- 神经网络被广泛应用于各种场景,如大语言模型、语音转录、分子发现和机器人技术。
- 神经网络由可微分基元组合而成,研究它们需要学习可微分编程。
- 本入门指南介绍了通过自动微分优化函数的基础知识,以及处理序列、图结构、文本和音频的常见设计方法。
- 涵盖的核心设计技术包括卷积块、注意力块和循环块,弥合了理论知识与代码实现(PyTorch和JAX)之间的鸿沟。
- 本指南旨在帮助读者理解大语言模型(LLMs)和多模态架构等先进模型。