Hasty Briefsbeta

双语

TeapotLLM- an open-source <1B model for hallucination-resistant Q&A on a CPU

a year ago

#NLP
#AI
#OpenSource

Teapot是一个开源的小型语言模型（约8亿参数），专为智能手机和CPU等资源受限设备优化。
该模型基于合成数据进行微调以减少幻觉生成，并专注于提供基于上下文的回答。
Teapot支持问答系统（QnA）、检索增强生成（RAG）和JSON提取等任务。
模型经过训练可提供对话式回答，并通过在缺乏足够上下文时拒绝回答来避免幻觉。
Teapot能跨多文档执行RAG，并以JSON等格式提取结构化信息。
内置teapotai库便于生产环境集成。
该模型基于flan-t5-large微调，训练数据集为约10MB的合成数据。
采用MIT开源协议，社区驱动开发，可通过Discord获取支持。