Hasty Briefsbeta

双语

LLMs are bad at returning code in JSON

10 months ago

#LLM
#JSON
#Code Quality

大语言模型以结构化JSON格式返回代码时，代码质量会显著下降
基准测试表明模型在JSON包裹的代码中易出现语法错误，尤其是引号和转义问题
纯文本(Markdown)格式在代码质量和问题解决能力上均优于JSON格式
OpenAI的'严格'JSON模式对代码质量提升毫无帮助
Claude-3-5-Sonnet和DeepSeek Coder等模型受JSON格式影响最为严重
JSON格式可能分散模型注意力，削弱其解决编程问题的推理能力
GPT-4o在使用JSON时性能下降最小，但纯文本格式仍具优势