Hasty Briefsbeta

双语

A New List Reveals Top Websites Meta Is Scraping of Copyrighted Content

9 months ago

#Data Privacy
#AI Ethics
#Copyright Infringement

Meta从600万个网站（包括顶级域名）抓取数据用于训练其AI模型。
抓取内容包含受版权保护、盗版和成人内容，部分可能涉嫌违法。
Meta绕过'robots.txt'等网络协议进行抓取，引发伦理和法律争议。
举报者泄露数据，谴责Meta支持以色列及不道德的商业行为。
因AI训练数据侵权，Meta面临作家和出版商的集体诉讼。
该公司重金招募顶尖AI人才，包括从OpenAI挖角。
Meta的抓取行为延伸至内容分发网络(CDN)，会重复捕获数据。
针对Meta数据抓取的法律诉讼曾以'合理使用'为由驳回，但争议持续。
公司内部对其配合以色列政府及审查亲巴勒斯坦内容存在不满。
Meta以'法律不确定性'为由拒绝签署欧盟AI行为准则。