Hasty Briefsbeta

双语

Everything around LLMs is still magical and wishful thinking

10 months ago

#LLMs
#AI Criticism
#Hype vs Reality

对AI的批评往往来自那些开发者，他们除了调用大语言模型的API外，并未深入使用MCP等当前工具。
存在显著分歧：部分用户认为大语言模型有时/经常很有帮助，而另一些用户则认为它们完全无效。
这种认知差距源于缺乏对不同场景下大语言模型使用方式的量化、详细描述。
关键未知因素包括：项目性质、代码库规模、用户专业水平，以及使用大语言模型后仍需额外投入的工作量。
大语言模型具有非确定性特征——即使是针对同一问题，其效果也可能随时间波动。
由于使用场景差异和非确定性结果，不同用户对大语言模型的使用体验难以直接比较。
业界对大语言模型的炒作常常忽视批判性评估，导致在没有实质证据的情况下形成两极分化的观点。
关于大语言模型成功案例的轶事往往缺失关键细节，比如代码库大小、具体错误类型以及所需人工监督的程度。
尽管持怀疑态度，作者仍大量使用大语言模型工具，承认其部分有效性，但反对将其神化或单纯视为工程解决方案的观点。
围绕大语言模型的讨论过于简单化，要么将其神化要么视为工程产物，忽视了其统计性、非确定性的本质特征。