Hasty Briefsbeta

双语

AI, Wikipedia, and uncorrected machine translations of vulnerable languages

7 months ago
  • #AI
  • #Language Preservation
  • #Wikipedia
  • 人工智能和维基百科正在通过生成错误百出的内容,加速弱势语言的消亡
  • 格陵兰语、因纽特语等语言的机器翻译维基百科文章充斥着各种错误
  • 基于低质量翻译数据训练的AI模型会形成'语言死亡循环',使翻译错误随时间不断恶化
  • 维基百科往往是低资源语言最大的语料来源,这使得错误内容危害尤为严重
  • 小语种维基百科的管理志愿者因贡献者不足,难以纠正AI生成的错误
  • 谷歌翻译、ChatGPT等AI工具对格陵兰语等结构复杂语言的处理能力极差
  • 错误连篇的AI翻译内容打击了母语者使用或贡献本语言维基百科版的积极性
  • 部分原住民社区(如伊纳里萨米语)成功利用维基百科保存和推广自己的语言
  • 维基媒体基金会将内容审核权下放给各语言社区,使弱势版本面临风险
  • 专家警告AI生成内容可能加速濒危语言的灭绝进程