Hasty Briefsbeta

双语

King – man and woman is queen; but why?

4 months ago
  • #natural-language-processing
  • #word2vec
  • #machine-learning
  • word2vec将词语转化为向量,可实现类似‘国王 - 男 + 女 = 女王’的词语类比
  • 该算法基于词语共现和分布式假设:词语的意义由其上下文语境决定
  • 点互信息(PMI)用于量化词语共现概率与随机预期的偏离程度
  • 词向量构成线性空间,相似词语距离相近,通过向量运算即可实现类比推理
  • word2vec的类比可表示语义关系(性别转换)、语法关系(时态变化)等多种关联
  • 词向量差值(如‘女 - 男’)能揭示性别等语义关系
  • 预训练词向量及GloVe、TensorFlow嵌入投影器等工具支持可视化探索
  • 技术细节包括双重向量表示(词语向量/上下文向量)及实际数据集中的PPMI应用
  • 词嵌入会反映训练数据中的偏见,例如‘医生 - 男 + 女 = 护士’
  • 延伸学习资源含TensorFlow教程、GloVe项目及对word2vec假设的批判性分析