Hasty Briefsbeta

双语

Wikipedia offers AI developers its article data on Kaggle to stop scraping

a year ago
  • #AI
  • #Kaggle
  • #Wikipedia
  • 维基媒体基金会在Kaggle平台发布AI就绪版维基百科数据集以避免网络爬取
  • 数据集包含结构化JSON格式的摘要、描述、信息框数据及图片链接
  • 内容遵循知识共享许可协议和GNU自由文档许可证
  • Kaggle平台现托管超46.1万份数据集,新增英文版和法文版维基百科
  • 该数据集旨在减轻服务器负载,为AI训练提供清洁的预解析数据
  • 早期测试版发布诚邀社区反馈与讨论