Wikipedia offers AI developers its article data on Kaggle to stop scraping
a year ago
- #AI
- #Kaggle
- #Wikipedia
- 维基媒体基金会在Kaggle平台发布AI就绪版维基百科数据集以避免网络爬取
- 数据集包含结构化JSON格式的摘要、描述、信息框数据及图片链接
- 内容遵循知识共享许可协议和GNU自由文档许可证
- Kaggle平台现托管超46.1万份数据集,新增英文版和法文版维基百科
- 该数据集旨在减轻服务器负载,为AI训练提供清洁的预解析数据
- 早期测试版发布诚邀社区反馈与讨论