Training Qwen 4B to Beat Large Models on Work Tasks
3 months ago
- #AI
- #Machine Learning
- #Salesforce
- Neurometric专注于为特定任务自动生成小型语言模型(SLMs)
- CRMArena基准测试在真实的Salesforce CRM任务(如潜在客户筛选和活动优先级排序)上评估模型性能
- 通过微调40亿参数的Qwen模型,在CRM任务上以95%的准确率超越更大规模的模型
- 最初尝试教导SLMs生成SQL查询较为困难,但随着训练数据的扩充得到改善
- 第二阶段采用BANT框架进行直接答案生成,获得了0.825的评估分数
- 关键结论:经过任务特定微调的SLMs可以超越大模型、合成数据存在质量挑战、受限答案空间能提升结果质量