Researchers suggest OpenAI trained AI models on paywalled O'Reilly books
a year ago
- #AI Ethics
- #Copyright Infringement
- #OpenAI
- OpenAI被指控未经许可使用受版权保护内容训练AI
- 新论文指控OpenAI使用非公开、未授权书籍训练GPT-4o
- GPT-4o等AI模型依赖海量数据进行内容预测与生成
- 使用合成数据训练可能导致模型性能下降
- AI披露项目称GPT-4o能识别付费墙后的O'Reilly Media书籍
- DE-COP方法用于检测训练数据中的版权内容
- GPT-4o对付费墙内容的识别率高于GPT-3.5 Turbo
- OpenAI可能通过用户输入获取了付费墙内容
- OpenAI寻求高质量训练数据,聘请专家优化模型
- OpenAI虽签署版权协议,仍面临侵权诉讼