King – man and woman is queen; but why?
4 months ago
- #natural-language-processing
- #word2vec
- #machine-learning
- word2vec将词语转化为向量,可实现类似‘国王 - 男 + 女 = 女王’的词语类比
- 该算法基于词语共现和分布式假设:词语的意义由其上下文语境决定
- 点互信息(PMI)用于量化词语共现概率与随机预期的偏离程度
- 词向量构成线性空间,相似词语距离相近,通过向量运算即可实现类比推理
- word2vec的类比可表示语义关系(性别转换)、语法关系(时态变化)等多种关联
- 词向量差值(如‘女 - 男’)能揭示性别等语义关系
- 预训练词向量及GloVe、TensorFlow嵌入投影器等工具支持可视化探索
- 技术细节包括双重向量表示(词语向量/上下文向量)及实际数据集中的PPMI应用
- 词嵌入会反映训练数据中的偏见,例如‘医生 - 男 + 女 = 护士’
- 延伸学习资源含TensorFlow教程、GloVe项目及对word2vec假设的批判性分析