Cursor's latest "browser experiment" implied success without evidence4 months agohttps://embedding-shapes.github.io/cursor-implied-success-without-evidence/Cursor发布了一篇关于为大型项目扩展自主编码代理的博客文章他们通过尝试从零开始构建网页浏览器来测试系统,生成了超过100万行代码该博客暗示项目成功但缺乏证据,例如可运行的构建版本或演示独立尝试编译该浏览器会导致大量错误,表明其无法正常运行Cursor关于'有意义进展'和'数百个代理协同工作'的主张缺乏可复现结果的支持该代码库更像是低质量的'AI垃圾'而非工程化软件这篇博客营造了成功的假象,却未达到基本的可复现性标准
High-Level Is the Goal4 months agohttps://bvisness.me/high-level/手工开发者社区批评现代软件尽管硬件进步显著,却仍存在速度缓慢、臃肿低效的问题底层编程被视为构建优质软件的解决方案,但人们对其实际可行性存在担忧'Truckla'改装车案例生动说明:软件开发如同选择车辆底盘,技术栈的选择如同选择改装基础通过对比新旧Reddit的性能表现,分析React+Redux技术栈选择导致的效率低下问题探讨当前技术栈的局限性,强调需要在更底层提供更多技术选项和优质工具指出底层编程的困难性源于文档和工具的缺失,而非其本质属性,这种现状完全可以改变批判'底层'概念只是反映当前工具现状的标签,通过改进工具链可使底层开发更平易近人展望手工开发者社区的使命:在坚实的底层基础上构建新型高级工具,推动软件行业革新
The Death of Software Development4 months agohttps://mike.tech/blog/death-of-software-developmentEffectful Technologies首席执行官Michael Arnaldi探讨了AI对软件开发带来的变革性影响「Ralph Wiggum」技术展示了AI通过迭代方式构建大型系统的能力,这仅仅是AI潜力的开端AI高级用户已能运用尖端技术在数小时内克隆整个公司,其技术前沿远超公众认知关于「最佳模型」的争论偏离重点——决定成果的是流程而非模型本身最先进的AI技术因其颠覆性潜力被保密,像Ralph这样的工具只是冰山一角Arnaldi仅用2小时就为Polymarket搭建了现代化彭博终端系统,全程未编写或审查任何代码开源项目Accountability旨在证明:无需专有技术,仅用AI就能构建会计系统等复杂应用软件开发不再是专家垄断的手艺,AI让普通操作者也能创造软件软件工程正从编写代码转向设计能生成代码的系统,这需要新的最佳实践和团队架构AI驱动的软件工业革命正在使软件变得丰富而廉价,这将带来深远的经济影响
Things I learned from burning myself out with AI coding agents4 months agohttps://arstechnica.com/information-technology/2026/01/10-things-i-learned-from-...使用Claude Code和Claude Opus 4.5等AI编程助手进行软件开发,就像当初3D打印技术刚出现时那样令人兴奋。AI助手可以生成炫酷的原型和简单应用,但在生产级工作、复杂项目或创新性创作方面仍存在困难。作者分享了使用AI辅助编程的个人体验,称这是自童年以来与计算机相处最有趣的经历。尽管潜力巨大,但要创建持久的生产级代码仍需要人类经验、耐心和超越当前AI能力的技能。
Catching API regressions with snapshot testing4 months agohttps://kreya.app/blog/api-snapshot-testing/快照测试通过捕获系统输出作为基准,便于未来进行对比。在API测试中尤为实用,可避免为大型JSON/XML响应编写冗长的断言。优势包括快速创建测试、全面覆盖逻辑,以及简化代码审查流程。需警惕动态数据(如时间戳、UUID)可能导致的误报失败。若测试频繁失败可能引发'快照疲劳',导致团队忽视失败结果。通过Kreya的实操案例演示了如何为API实施快照测试。虽不能替代所有测试类型,但对复杂API响应验证具有极高的投入产出比。
libcurl memory use some years later4 months agohttps://daniel.haxx.se/blog/2026/01/21/libcurl-memory-use-some-years-later/软件开发中的渐进式退化可能导致长期未被发现的问题,例如内存使用量逐渐增加。curl和libcurl始终将最小化内存使用和分配次数作为首要目标,以确保在全球数十亿安装实例中保持可扩展性和高效性。2025年7月,curl测试套件新增了强制关键结构体大小固定上限的测试用例,有效防止了未经检查的内存增长。对比curl 7.75.0与当前版本的结构体大小,显示部分增长部分缩减,特定场景下总体内存使用量有所下降。下载单个512MB文件的内存使用量微增1.6%,分配调用次数增加11%,但考虑到新增功能,仍保持较高效率。并行下载测试显示分配调用次数呈线性增长,而内存使用量呈次线性增长,体现了优异的扩展效率。TLS加密会显著增加内存分配,但这类优化被认为不属于curl的职责范围。可视化数据证实,尽管不断增加新功能和性能改进,curl仍保持着高效的内存使用效率。
The GNU C Library version 2.43 released4 months agohttps://sourceware.org/pipermail/libc-alpha/2026-January/174374.htmlGNU C 库 2.43 版本现已发布。该库遵循 ISO C23 和 POSIX.1-2024 标准,用于 GNU 及 GNU/Linux 系统。新增特性包括 ISO C23 函数:free_sized、free_aligned_sized 和 memset_explicit。集成了来自 CORE-MATH 项目的优化数学函数。新增实验性支持使用 clang(18 或更高版本)进行编译。Linux 平台新增 mseal 函数用于密封内存映射。AArch64 架构改进:支持 2MB 透明大页及 SME/BTI 扩展指令集。RISC-V 平台新增 RVV 优化的 memset 实现。x86 平台新增对 Intel Nova Lake 和 Wildcat Lake 处理器的支持。Unicode 支持已更新至 17.0.0 版本。废弃功能包括移除堆转储支持及 pthread 互斥锁的 TX 锁省略机制。安全修复涉及堆损坏、内存泄漏等 CVE 漏洞。修复大量错误,提升功能性与稳定性。
AI Tribalism4 months agohttps://nolanlawson.com/2026/01/24/ai-tribalism/作者最初认为大语言模型不适合严肃的软件开发,但现在90%的编码工作都使用Claude Code完成。关于大语言模型的争论已高度政治化和部落化,观点从革命性到毁灭性不一而足。尽管早期因幻觉问题和漏洞对大语言模型持怀疑态度,但2025年的重大改进使其成为作者不可或缺的工具。大语言模型现可协助完成多种任务,包括发现安全漏洞、编写基准测试、提升可访问性等,虽非完美无缺。作者理解开发者对职业未来的恐惧与不安,但建议保持实验精神和开放心态。评论反映出将大语言模型融入编程工作流时存在抵触、谨慎乐观和热情三种态度。大语言模型的快速进化表明,适应力和持续学习对开发者未来发展至关重要。
After two years of vibecoding, I'm back to writing by hand4 months agohttps://atmoio.substack.com/p/after-two-years-of-vibecoding-im最初对AI编程的兴奋感促使人们不断给它分配更复杂的任务当AI出现错误且无法保持与项目整体目标的一致性时,挫折感油然而生试图通过详细规范改进AI输出的努力收效甚微,因为AI无法动态演进设计AI生成的代码单独看很惊艳,但作为大型代码库的一部分时缺乏连贯性和完整性作者决定回归手动编程,发现比依赖AI更高效、准确且更具创造性
There is an AI code review bubble4 months agohttps://www.greptile.com/blog/ai-code-review-bubbleAI代码审查市场竞争激烈,参与者众多,包括OpenAI、Anthropic以及Greptile等专业工具由于性能指标的主观性,AI代码审查工具的差异化具有挑战性;用户应亲自试用以做出决策Greptile对代码审查未来的观点基于三大支柱:独立性、自主性和反馈循环独立性:Greptile主张代码生成与验证应由独立代理完成,以避免利益冲突自主性:Greptile致力于代码验证的全自动化,目标是未来实现最小化人工干预循环机制:Greptile的Claude Code插件实现了编码与验证代理间的迭代反馈,仅在必要时引入人工输入Greptile将自身定位为企业级长期解决方案,强调自动化与后台流程,而非聚焦用户界面的审查方式
Codeless: From Idea to Software4 months agohttps://www.anildash.com/2026/01/22/codeless/无代码软件开发利用AI来协调编码机器人集群,使人们能够通过简单的英语战略目标实现大规模软件创作。关键创新包括协调机制(控制多个机器人)和容错能力(处理不可靠的代码输出),使系统具备鲁棒性和可扩展性。无代码工具是开源、非商业化的,允许自由替换大语言模型组件,有效解决伦理问题和供应商锁定风险。与'低代码'平台不同,无代码输出可在任何基础设施上运行,为开发者提供灵活性和控制权。无代码技术改变了权力结构,使普通个人(不仅是程序员)无需大量资源或审批就能创建软件。管理界面简单易用,通常采用Markdown文件,产品经理和设计师等非开发人员也能轻松上手。由于上下文限制和复杂遗留系统描述困难,无代码技术不太适合传统代码库改造。这种方法延续了编码抽象化的趋势,让开发者专注于问题解决而非手工编码。早期采用面临高成本和技术复杂性的挑战,但比企业级AI工具更具发展潜力。无代码技术源于独立开发者而非大公司,促进了创新并减少了对专有AI供应商的依赖。
Aperture: Senior QA (2004-2005)4 months agohttps://substack.techreflect.org/p/aperture-senior-qa-2004-2005作者回顾了参与苹果Aperture项目的经历,将其形容为一段跌宕起伏的情感过山车。导师Paul Marcos在作者离开邮件团队后,对其加入Aperture团队起到了关键作用。这个由相互尊重的成员组成的团队包括了Randy Ubillos和Stan Jirman等杰出人物。Aperture是在必须赶超Adobe Lightroom的巨大压力下开发的,最终锁定2005年PhotoPlus+Expo展会作为硬性发布日期。团队技术精湛且凝聚力强,充满幽默感与战友情怀。独特的工作方式包括软件工程师与测试工程师在编码前共同制定测试方案。项目组聘请专业摄影师参与测试,极大提升了产品开发质量。随着发布日期临近,管理层问题逐渐显现:功能削减、咆哮式管理、强制加班接踵而至。作者公开反对强制加班政策,导致与管理层的直接冲突。空降的QA经理未经团队协商就上任,引发更大矛盾并导致灾难性会议。管理层试图用礼品安抚团队,但分配不均引发偏袒质疑。开发后期突然增派130多名工程师导致项目陷入混乱,进度进一步延误。尽管困难重重,Aperture最终如期发布,但创始团队因管理不善集体出走。Bertrand Serlet帮助核心工程师在苹果内部转岗,有效遏制了负面流言。作者等人因长期高压工作留下健康隐患,但仍保留着某些美好回忆。多年后作者与Randy Ubillos重逢,共同追忆Aperture团队的光辉岁月。
The Cults of TDD and GenAI4 months agohttps://drewdevault.com/2026/01/29/2026-01-29-Cult-of-TDD-and-LLMs.html作者对测试驱动开发(TDD)表示怀疑,尽管承认其在提供快速反馈循环方面的实用性。TDD的主要缺陷在于它使代码变得'可测试',但这并不总能产生更好或更正确的软件行为。'TDD崇拜'通过100%测试覆盖率等指标制造了勤奋和高效工作的假象,这些指标可能无法反映真实的软件质量。与TDD类似,编程代理工具利用心理奖励机制,让平庸的程序员获得成就感,却未必提升其技能或产出质量。作者警告称,AI驱动的编程工具虽然提高了生产力,但可能产出劣质作品,并对社会和环境产生更广泛的负面影响。尽管存在缺陷,成为'10倍效率程序员'的诱惑仍驱使许多人采用这些工具,无视长期后果。
Code is cheap. Show me the talk4 months agohttps://nadh.in/blog/code-is-cheap/随着LLM编程工具的出现,软件开发发生了根本性变革,传统方法已然过时。Linus Torvalds的格言'空谈无益,给我看代码'在AI生成代码普及的当下已不合时宜。LLM能快速生成高质量、文档完善的代码,使人难以区分人类与AI的产出。编写优质代码所需的精力大幅减少,开发者得以更专注于架构设计与问题解决。随着AI能规模化生产功能性代码,代码作为产物的价值正在弱化,引发关于责任归属与来源溯源的质疑。FOSS(自由开源软件)的生态正在改变——代码变得廉价且易定制,可能削弱协作动力。'氛围编程'的兴起让非技术人员也能开发软件,但同时也可能导致生态圈充斥低质量的AI生成垃圾。资深开发者通过LLM降低认知与生理负荷获益,但初级开发者可能面临基础技能培养的困境。批判性思维与表达能力的价值现已超越语法知识,因为编码工作可由AI代劳。软件开发领域正经历颠覆性变革,传统角色与方法论逐渐退出历史舞台。
Amdahl's Law and Agentic Coding4 months agohttps://evnm.substack.com/p/amdahls-law-and-agentic-coding阿姆达尔定律指出,系统某部分优化带来的加速效果受限于该部分在总运行时间中的占比。示例:将蔬菜准备时间从15分钟缩短至1分钟,仅使总烹饪时间减少23%,因为烘烤环节仍占主导。AI编程工具虽能加速代码编写,但开发生命周期的其他环节(如规划、测试、部署)会成为新瓶颈。智能编码暴露出开发者工具链投入不足的问题,使得缓慢的构建、持续集成系统和代码审查更显突出。解决方案包括:用AI重构开发生命周期,并投资工具链以应对新出现的瓶颈环节。
Developers say AI coding tools work–and that's precisely what worries them4 months agohttps://arstechnica.com/ai/2026/01/developers-say-ai-coding-tools-work-and-thats...Anthropic公司的Claude Code和OpenAI的Codex等AI编程工具已进化到能根据文本提示构建完整应用程序OpenAI利用Codex开发Codex自身,展现了该工具的自我改进能力专业开发者对AI工具态度分化——部分人视其为革命性突破,另一些人则对炒作持怀疑态度开发者David Hagerty承认AI的影响力,但质疑其完成小说创作等创造性任务的能力软件工程师Roland Dreier指出AI能力显著提升,预估复杂任务处理速度可提高10倍
A Step Behind the Bleeding Edge: A Philosophy on AI in Dev4 months agohttps://somehowmanage.com/2026/01/22/a-step-behind-the-bleeding-edge-monarchs-ph...人工智能正在改变软件工程师的工作方式,既带来机遇也带来挑战。Monarch Engineering的价值观指导着他们应用AI的方法,在保障安全的前提下聚焦生产力和质量提升。采用比技术前沿稍慢半拍的AI工具,既能避免技术动荡又能规避安全风险。为团队预留探索新技术和知识共享的时间,保持对AI发展的敏锐度。工程师必须对自己的工作成果负责,即使使用AI辅助也要确保质量和可追溯性。深度思考不可外包给AI,应将其作为处理琐事的助手和思维碰撞的伙伴,而非替代独立思考。保持对工作的深度参与,避免过度依赖AI,为灵感迸发留出空间。建立AI输出验证机制,在赋予AI自主权的同时保留人工监督环节。在原型设计、内部工具开发等安全场景中可更自由地使用AI技术。AI不会取代以解决问题为核心的工作,但将重塑工作方式。只要工程师坚持审阅和验证AI产出,将其视为资源而非拐杖,专业技能就不会退化。
GitHub - cline/cline: Autonomous coding agent right in your IDE, capable of creating/editing files, executing commands, using the browser, and more with your permission every step of the way.4 months agohttps://github.com/cline/clineCline是一个具备代理编码能力的人工智能助手,能够处理复杂的软件开发任务。它可以创建和编辑文件、探索项目、使用浏览器,并在用户许可下执行终端命令。Cline采用模型上下文协议(MCP)来创建新工具并扩展其功能。功能包括将设计稿转换为应用程序、通过截图修复错误,以及分析文件结构和源代码抽象语法树(AST)。它能执行终端命令、管理开发环境,并对编译时错误等问题作出反应。Cline支持多种API提供商,包括OpenRouter、Anthropic、OpenAI,以及通过LM Studio/Ollama连接的本地模型。包含API使用成本跟踪和任务执行期间的令牌计数功能。借助Claude Sonnet的计算机使用能力,Cline可在浏览器中进行交互式调试和端到端测试。可添加自定义工具以适应特定工作流程,例如获取Jira票据或管理AWS EC2实例。工作区快照支持差异视图和回滚到先前状态,便于测试不同版本。企业级功能包括单点登录(SSO)、全局策略、私有网络和自托管部署。
In Praise Of –Dry-Run4 months agohttps://henrikwarne.com/2026/01/31/in-praise-of-dry-run/作者受Subversion和Linux命令类似功能的启发,开发了一个带有–dry-run选项的报告应用程序。–dry-run选项会打印应用程序将执行的步骤而不实际进行任何更改,作为快速完整性检查。其优势包括安全的预执行检查,以及通过避免耗时的报告生成来加速测试过程。缺点是dryRun标志需要在主要阶段进行检查,略微污染了代码结构。–dry-run功能对于会产生变更的命令行调用应用程序特别有用,比如生成报告。作者建议在开发早期就加入–dry-run功能,以便在开发过程中最大化其效益。
Applications where agents are first-class citizens3 months agohttps://every.to/guides/agent-native软件代理现在工作可靠,这通过Claude Code能够自主完成复杂的多步骤任务得到证明。一个好的编码代理也是一个好的通用代理,能够组织文件、管理阅读列表和自动化工作流程。Claude Code SDK允许构建应用程序,其中功能被描述为代理使用工具实现的结果。核心原则包括对等性(代理可以做UI能做的任何事情)、细粒度(原子工具)、可组合性(通过提示实现新功能)、涌现能力(处理未预期的请求)和随时间改进(上下文和提示优化)。代理原生应用程序通过积累的上下文和提示优化而改进,无需更改代码。文件作为代理的通用接口,利用现有的文件操作如cat、grep、mv和mkdir。移动设备为代理原生应用程序提供了独特的机会,iCloud实现了跨设备的无缝同步。移动设备上的挑战包括处理应用程序中断和后台执行限制。动态能力发现允许代理与API交互,而无需静态工具映射。反模式包括将代理视为路由器、防御性工具设计和启发式完成检测。