Hasty Briefsbeta

双语

Language Models Are Injective and Hence Invertible

7 months ago

#Language Models
#Machine Learning
#Invertibility

Transformer语言模型已被证明是单射的，这意味着不同的输入不可能映射到相同的输出。
该论文提出了SipIt算法，能够在线性时间内从隐藏激活状态精确重构输入文本。
在六个最先进语言模型上的实证测试表明不存在碰撞现象，支持了单射性主张。
这些发现对语言模型的透明度、可解释性及安全部署具有重要意义。