Hasty Briefsbeta

双语

AI Eats Software Testing

a year ago

#AI
#LLM
#Software Testing

自动化输入多样化(AID)是一种基于大语言模型的新型软件缺陷检测方法
AID通过生成程序变体、创建测试用例生成器并利用差分测试来识别差异
该方法优于现有技术，在精确率和召回率上均展现出显著提升
AID侧重精确率的特性可能导致召回率降低，遗漏部分缺陷
论文在Trickbugs(C++)和Trickybugs(Python)等数据集上评估AID，结果令人鼓舞
关于AID在其他语言的适用性、现有框架的整合及计算资源需求等问题仍有待探索
未来潜在应用方向包括LLM驱动的CI/CD流水线，以及将AID与其他测试方法相结合