Show HN: I extracted the safety filters from Apple Intelligence models
10 months ago
- #Safety Filters
- #Generative Models
- #Apple
- 苹果智能(Apple Intelligence)生成模型安全文件的解密内容,包含过滤规则。
- 目录结构包含:'decrypted_overrides/'、'com.apple.*/'、'Info.plist' 和 'AssetData/'。
- 提供脚本:'get_key_lldb.py'用于获取加密密钥,'decrypt_overrides.py'用于解密覆盖文件。
- 依赖要求:需通过pip安装'cryptography'库。
- 使用LLDB和Shortcuts应用获取加密密钥的步骤说明。
- 解密覆盖文件的示例命令:'python decrypt_overrides.py'需指定路径和密钥文件。
- 覆盖文件为JSON格式,包含生成模型的安全过滤规则,涉及reject(拒绝)、remove(移除)、replace(替换)、regexReject(正则拒绝)、regexRemove(正则移除)和regexReplace(正则替换)字段。
- 示例metadata.json展示了针对有害内容的过滤规则。