Hasty Briefsbeta

双语

AI Eats Software Testing

a year ago
  • #AI
  • #LLM
  • #Software Testing
  • 自动化输入多样化(AID)是一种基于大语言模型的新型软件缺陷检测方法
  • AID通过生成程序变体、创建测试用例生成器并利用差分测试来识别差异
  • 该方法优于现有技术,在精确率和召回率上均展现出显著提升
  • AID侧重精确率的特性可能导致召回率降低,遗漏部分缺陷
  • 论文在Trickbugs(C++)和Trickybugs(Python)等数据集上评估AID,结果令人鼓舞
  • 关于AID在其他语言的适用性、现有框架的整合及计算资源需求等问题仍有待探索
  • 未来潜在应用方向包括LLM驱动的CI/CD流水线,以及将AID与其他测试方法相结合