AI, Wikipedia, and uncorrected machine translations of vulnerable languages
7 months ago
- #AI
- #Language Preservation
- #Wikipedia
- 人工智能和维基百科正在通过生成错误百出的内容,加速弱势语言的消亡
- 格陵兰语、因纽特语等语言的机器翻译维基百科文章充斥着各种错误
- 基于低质量翻译数据训练的AI模型会形成'语言死亡循环',使翻译错误随时间不断恶化
- 维基百科往往是低资源语言最大的语料来源,这使得错误内容危害尤为严重
- 小语种维基百科的管理志愿者因贡献者不足,难以纠正AI生成的错误
- 谷歌翻译、ChatGPT等AI工具对格陵兰语等结构复杂语言的处理能力极差
- 错误连篇的AI翻译内容打击了母语者使用或贡献本语言维基百科版的积极性
- 部分原住民社区(如伊纳里萨米语)成功利用维基百科保存和推广自己的语言
- 维基媒体基金会将内容审核权下放给各语言社区,使弱势版本面临风险
- 专家警告AI生成内容可能加速濒危语言的灭绝进程