Hasty Briefsbeta

双语

Researchers suggest OpenAI trained AI models on paywalled O'Reilly books

a year ago
  • #AI Ethics
  • #Copyright Infringement
  • #OpenAI
  • OpenAI被指控未经许可使用受版权保护内容训练AI
  • 新论文指控OpenAI使用非公开、未授权书籍训练GPT-4o
  • GPT-4o等AI模型依赖海量数据进行内容预测与生成
  • 使用合成数据训练可能导致模型性能下降
  • AI披露项目称GPT-4o能识别付费墙后的O'Reilly Media书籍
  • DE-COP方法用于检测训练数据中的版权内容
  • GPT-4o对付费墙内容的识别率高于GPT-3.5 Turbo
  • OpenAI可能通过用户输入获取了付费墙内容
  • OpenAI寻求高质量训练数据,聘请专家优化模型
  • OpenAI虽签署版权协议,仍面临侵权诉讼