Hasty Briefsbeta

双语

JavelinGuard: Low-Cost Transformer Architectures for LLM Security

a year ago
  • #LLM Security
  • #Machine Learning
  • #Transformer Architectures
  • JavelinGuard简介:一套低成本、高性能的Transformer架构,专为LLM安全设计
  • 针对生产环境优化,最小模型仅需4亿参数
  • 研究五种基于Transformer的架构:Sharanga、Mahendra、Vaishnava、Ashwina和Raudra
  • 在九个对抗性数据集(包括NotInject、BIPIA、Garak和JavelinBench)上进行严格基准测试
  • 与开源防护模型及GPT-4o等大型LLM的对比分析
  • Raudra的多任务设计展现出最强的鲁棒性
  • 每种架构在速度、可解释性和资源需求方面呈现独特权衡