JavelinGuard: Low-Cost Transformer Architectures for LLM Security
a year ago
- #LLM Security
- #Machine Learning
- #Transformer Architectures
- JavelinGuard简介:一套低成本、高性能的Transformer架构,专为LLM安全设计
- 针对生产环境优化,最小模型仅需4亿参数
- 研究五种基于Transformer的架构:Sharanga、Mahendra、Vaishnava、Ashwina和Raudra
- 在九个对抗性数据集(包括NotInject、BIPIA、Garak和JavelinBench)上进行严格基准测试
- 与开源防护模型及GPT-4o等大型LLM的对比分析
- Raudra的多任务设计展现出最强的鲁棒性
- 每种架构在速度、可解释性和资源需求方面呈现独特权衡