Text Embeddings are All Alikea year ago#Embeddings#Machine Learning#Securityhttps://arxiv.org/abs/2505.12540Copy Link提出了一种无监督方法,用于在不同向量空间之间转换文本嵌入,无需配对数据或预定义的匹配。提出了一种通用的潜在嵌入表示,与柏拉图表示假说相一致。在多样化的模型架构和训练数据集上实现了较高的余弦相似度。强调了向量数据库的安全隐患,因为攻击者可以从嵌入中推断出敏感信息。