Hasty Briefsbeta

双语

Text Embeddings are All Alike

a year ago

#Embeddings
#Machine Learning
#Security

提出了一种无监督方法，用于在不同向量空间之间转换文本嵌入，无需配对数据或预定义的匹配。
提出了一种通用的潜在嵌入表示，与柏拉图表示假说相一致。
在多样化的模型架构和训练数据集上实现了较高的余弦相似度。
强调了向量数据库的安全隐患，因为攻击者可以从嵌入中推断出敏感信息。