A New List Reveals Top Websites Meta Is Scraping of Copyrighted Content
9 months ago
- #Data Privacy
- #AI Ethics
- #Copyright Infringement
- Meta从600万个网站(包括顶级域名)抓取数据用于训练其AI模型。
- 抓取内容包含受版权保护、盗版和成人内容,部分可能涉嫌违法。
- Meta绕过'robots.txt'等网络协议进行抓取,引发伦理和法律争议。
- 举报者泄露数据,谴责Meta支持以色列及不道德的商业行为。
- 因AI训练数据侵权,Meta面临作家和出版商的集体诉讼。
- 该公司重金招募顶尖AI人才,包括从OpenAI挖角。
- Meta的抓取行为延伸至内容分发网络(CDN),会重复捕获数据。
- 针对Meta数据抓取的法律诉讼曾以'合理使用'为由驳回,但争议持续。
- 公司内部对其配合以色列政府及审查亲巴勒斯坦内容存在不满。
- Meta以'法律不确定性'为由拒绝签署欧盟AI行为准则。