Hasty Briefsbeta

双语

A New List Reveals Top Websites Meta Is Scraping of Copyrighted Content

9 months ago
  • #Data Privacy
  • #AI Ethics
  • #Copyright Infringement
  • Meta从600万个网站(包括顶级域名)抓取数据用于训练其AI模型。
  • 抓取内容包含受版权保护、盗版和成人内容,部分可能涉嫌违法。
  • Meta绕过'robots.txt'等网络协议进行抓取,引发伦理和法律争议。
  • 举报者泄露数据,谴责Meta支持以色列及不道德的商业行为。
  • 因AI训练数据侵权,Meta面临作家和出版商的集体诉讼。
  • 该公司重金招募顶尖AI人才,包括从OpenAI挖角。
  • Meta的抓取行为延伸至内容分发网络(CDN),会重复捕获数据。
  • 针对Meta数据抓取的法律诉讼曾以'合理使用'为由驳回,但争议持续。
  • 公司内部对其配合以色列政府及审查亲巴勒斯坦内容存在不满。
  • Meta以'法律不确定性'为由拒绝签署欧盟AI行为准则。