One AI Model Creates a Physical Intuition of Its Environment8 months agohttps://www.quantamagazine.org/how-one-ai-model-creates-a-physical-intuition-of-...Meta的V-JEPA人工智能模型通过视频学习直觉物理知识,无需预先假设。V-JEPA利用潜在表征聚焦关键细节,避免像素级干扰。该模型遇到物理不可能事件时会表现出类似婴儿的'惊讶'反应。在直觉物理理解测试IntPhys中,V-JEPA准确率高达98%。新一代V-JEPA 2模型基于2200万段视频进行预训练,并已应用于机器人领域。V-JEPA 2在处理长序列时存在困难,被类比为金鱼的记忆跨度。
Scientists race to make 'living' computers powered by human cells8 months agohttps://www.bbc.co.uk/news/articles/cy7p1lzvxjro科学家正在利用干细胞培育的微型人脑(类器官)开发生物计算机。这些连接着电极的类器官能对简单电信号作出反应,模拟基本计算功能。目标是创建节能的'活体'服务器,作为传统硅基人工智能系统的补充。当前挑战包括延长类器官存活时间,以及理解其行为和学习过程。生物计算在疾病建模和减少动物实验方面具有潜力,但仍处于早期阶段。包括Cortical Labs和约翰霍普金斯大学在内的其他团队也在探索不同用途的生物计算。该技术仍存在伦理和现实问题,如类器官的反应机制,以及与硅芯片相比的性能局限。
DeepSeek-v3.2-Exp8 months agohttps://api-docs.deepseek.com/news/news250929DeepSeek-V3.2-Exp 是基于 V3.1-Terminus 的最新实验模型。引入 DeepSeek 稀疏注意力(DSA)机制,在长上下文训练和推理中实现更快、更高效的性能。现已在 App、Web 和 API 上线,API 价格降低 50% 以上。DSA 提升了长上下文性能并降低计算成本,同时对输出质量影响极小。基准测试显示 V3.2-Exp 与 V3.1-Terminus 表现相近。V3.1-Terminus 仍可通过临时 API 使用至 2025 年 10 月 15 日,供对比测试。欢迎通过提供的链接反馈 DSA 使用体验。模型和技术报告已在 Hugging Face 和 GitHub 开源。包含 TileLang 和 CUDA 的关键 GPU 内核,推荐使用 TileLang 进行快速原型开发。
I do not want to be a programmer anymore7 months agohttps://mindthenerd.com/i-do-not-want-to-be-a-programmer-anymore-after-losing-an...作者与妻子争论时,人工智能站在妻子那边并提供了令人信服的论据,这让他开始质疑自己的判断力。人工智能正在改变专业领域的格局,客户和非专业人士使用AI生成详细方案,使得专业人士的角色转变为解释为何AI建议可能并不总是可行。作者承认自己在撰写邮件、编写代码甚至做个人决定时都依赖AI,既体现了便利性,也揭示了过度依赖的隐患。AI真正的危险不在于取代工作,而在于人类将判断权让渡给机器——AI的自信可能压制批判性思维与人类智慧。文章探讨了人们对自信答案的心理偏好:即便AI出错,其不容置疑的确定性仍会导致人们盲目服从。作者思考了这种现象对各行业的深层影响——专业领域的挑战不再仅是知识储备,更在于说服他人相信人类判断仍有价值。文章最后呼吁保持质疑精神,在自信机器时代坚守人类判断力的重要性。
Who needs Git when you have 1M context windows?8 months agohttps://www.alexmolas.com/2025/07/28/unexpected-benefit-llm.htmlAI帮助恢复了被删除的代码,使某项指标提升了5%。作者重构了代码但丢失了原始改进,导致该指标下降了2%。通过使用长上下文LLM(gemini-2.5-pro),从内存中检索出了原始代码。突显了具备大上下文窗口的LLM在代码恢复中意想不到的效用。
Historian uses AI to help identify Nazi in notorious Holocaust murder image7 months agohttps://www.theguardian.com/world/2025/oct/02/historian-uses-ai-to-help-identify...这张令人毛骨悚然的大屠杀照片记录了一名纳粹士兵在尸坑前枪杀跪地男子的场景,长期被误称为'文尼察最后一位犹太人'。历史学家于尔根·马特乌斯借助AI技术和档案研究,确认凶手很可能是特别行动队C支队的党卫军成员雅各布斯·奥南。屠杀发生于1941年7月28日的乌克兰别尔季切夫——一个历史悠久的犹太文化中心,正值希特勒到访前夕。贝尔林卡特志愿者协助进行了AI图像分析,但历史照片匹配仍难以达到高置信度。低阶纳粹奥南从未获得晋升,1943年战死沙场,其作案动机至今成谜。马特乌斯指出AI对历史研究的辅助作用,同时强调人文因素不可替代。这张作为'战利品'拍摄的照片,赤裸展现了纳粹在东欧实施处决时的残暴手法。正如纳粹所愿,苏联占领区大多数受害者至今姓名成谜。马特乌斯正通过苏联时期档案与AI技术,继续努力确认照片中遇难者的身份。
Launch HN: Grapevine (YC S19) – A company GPT that actually works7 months agohttps://getgrapevine.ai/Grapevine是一款AI智能体,专为搜索企业文档、代码和通讯记录而设计,旨在节省时间。它提供经济高效的企业定制GPT解决方案,与其他昂贵方案形成鲜明对比。Grapevine可在30分钟内完成部署,并在两天内开始基于完整历史背景回答问题。该AI系统会持续学习并随时间推移不断优化,变得更加精准实用。Grapevine通过AES-256加密、独立数据库和SOC II合规认证确保数据安全。系统不会利用客户数据训练模型,充分保障隐私与安全。内部测试显示,该工具85%以上的回答都具有实用性和准确性。
OpenAI, Jony Ive struggle with technical details on secretive new AI gadget7 months agohttps://arstechnica.com/ai/2025/10/openai-jony-ive-struggle-with-technical-detai...OpenAI与Jony Ive正合作开发一款神秘AI设备,在计划2025年发布前面临技术挑战。该设备为手掌大小、无屏幕设计,能对环境中的音频和视觉线索作出响应。关键待解决问题包括AI的'个性'设定、隐私顾虑及算力需求。硬件设计由Ive团队主导,但软件与基础设施障碍仍未解决。设备将保持'常开状态',通过持续收集数据构建虚拟助手的'记忆'功能。OpenAI受限于算力资源,项目进度落后于亚马逊、谷歌等竞争对手。这款智能手机大小的设备将配备摄像头、麦克风和扬声器以实现人机交互。
JetBrains × Zed: Open Interoperability for AI Coding Agents in Your IDE7 months agohttps://blog.jetbrains.com/ai/2025/10/jetbrains-zed-open-interoperability-for-ai...JetBrains与Zed合作开发面向IDE人工智能编程助手的Agent Client Protocol (ACP)协议ACP协议确保无供应商锁定,开发者可在任何兼容ACP的IDE中使用首选编程助手开发者可完全掌控助手行为,所有操作透明可见并深度集成至开发工作流JetBrains系列IDE支持编辑器无关的编程助手,提供完整用户控制权与熟悉的工作体验本次合作融合Zed的协议创新与JetBrains的IDE专业优势,打造强大且可移植的智能编程助手未来计划包括分享ACP协议的早期实现方案,以及JetBrains IDE中ACP功能的预览版本
OpenAI ChatKit7 months agohttps://github.com/openai/chatkit-jsChatKit是一个用于快速构建AI聊天体验的框架提供深度UI定制和内置的响应流功能包含工具集成、交互式小组件和附件处理支持带来源标注的会话和消息管理框架无关且只需极简配置集成步骤:生成客户端令牌、安装React绑定、添加JS脚本、渲染ChatKit基于Apache 2.0许可证开源
DeepMind: CodeMender: an AI agent for code security7 months agohttps://deepmind.google/discover/blog/introducing-codemender-an-ai-agent-for-cod...CodeMender介绍:一款旨在通过修复漏洞自动提升代码安全性的AI代理工具CodeMender采用双重机制:既能被动修补新漏洞,也能主动重写现有代码以消除漏洞类型在六个月内,CodeMender已为开源项目提交72个安全补丁,包括代码量达450万行的大型项目运用Gemini深度思考模型自主调试和修复复杂漏洞,配备代码变更推理与验证工具链集成先进程序分析技术(静态/动态分析、模糊测试、SMT求解器)和多智能体系统实现高效漏洞识别与修复已证实具备漏洞根因分析能力,可创建非平凡补丁(包括复杂对象生命周期问题)主动重构代码使用安全数据结构和API,例如应用-fbounds-safety注解防御缓冲区溢出包含错误自动修正和测试失败处理功能,通过验证流程确保功能完整性当前所有补丁均经研究人员人工审核后提交,计划逐步增加提交量并收集社区反馈未来计划包括发表技术论文、分享研究成果,并向全体开发者开放CodeMender以提升软件安全
Robin Williams' Daughter Tells Fans to 'Stop Sending Me AI Videos of Dad'7 months agohttps://variety.com/2025/film/news/robin-williams-daughter-ai-recreations-gross-...罗宾·威廉姆斯的女儿泽尔达·威廉姆斯呼吁人们停止向她发送已故父亲的AI生成视频。她认为这些AI重现作品令人不安,并非父亲所愿。泽尔达批评AI技术是在回收利用过去,称其为'内容版的人体蜈蚣'。她此前就曾公开反对用AI技术重现父亲形象,称这些作品'令她个人感到不适'。泽尔达强调真人演员应有机会通过自主选择和努力来塑造表演的重要性。
Why Aren't We Partying Like It's 1999? – Paul Krugman7 months agohttps://paulkrugman.substack.com/p/why-arent-we-partying-like-its-1999经济学家曾预测2025年经济叙事将围绕关税展开,但AI投资热潮已使其黯然失色尽管特朗普关税政策造成冲击,AI领域支出仍为经济注入活力,成功避免衰退与1990年代科技繁荣不同,当前AI热潮未能激发普遍经济乐观情绪尽管经济持续增长,消费者信心却跌至全球金融危机时期的低迷水平劳动力市场陷入僵局:招聘低迷、离职率骤降,折射出工人的普遍不安AI技术引发大规模就业焦虑,这与互联网初问世时的社会反响形成鲜明对比特朗普执政下的政治动荡扭曲经济感知,关于经济强劲的宣称与负面叙事持续角力科技繁荣可能以崩盘告终,特朗普政策或将为未来经济埋下隐患
The Most Reviled Tech CEO in New York Confronts His Haters7 months agohttps://www.theatlantic.com/technology/2025/10/friend-ai-companion-ads/684451/Friend公司CEO阿维·希夫曼对纽约地铁AI吊坠广告引发的抵制浪潮表示欢迎这款售价129美元的可穿戴AI伴侣通过挑衅性广告进行营销,引发大规模涂鸦和批评希夫曼声称涂鸦破坏本就是计划一环,为产品带来免费公关和公众讨论广告暗示AI伴侣优于人类关系,刻意激发公众反应希夫曼将AI吊坠比作心理治疗师、挚友甚至'与神明对话'批评者指出AI伴侣存在缺陷,包括传播错误信息和心理健康风险Friend公司仅售出约1000个吊坠,目前尚未明确盈利路径希夫曼更看重'心智占有率'而非即时利润,旨在使AI友谊常态化该营销活动折射出AI行业整体趋势,混杂着反讽、炒作和真实野心广告与抵制浪潮反映了公众对AI社会影响的怀疑与愤怒
After nine years of grinding, Replit found its market. Can it keep it?7 months agohttps://techcrunch.com/2025/10/02/after-nine-years-of-grinding-replit-finally-fo...Replit以30亿美元估值的崛起之路缓慢而艰难,经历了多次商业模式失败和大规模裁员自2009年起,CEO Amjad Masad就致力于编程民主化,其使命是培养十亿程序员Replit近期完成2.5亿美元融资,估值增长近三倍,年收入在不到一年内从280万美元飙升至1.5亿美元该公司将重心从专业开发者转向非技术人员,瞄准白领员工新市场Replit Agent人工智能编程助手代表重大突破,尽管曾发生删除生产数据库的高调事故面对OpenAI和Anthropic等AI实验室的竞争,Replit通过服务非技术用户的基础设施和资本高效模式实现差异化Masad对成功保持冷静,强调原则性增长和长期愿景
Gemini 2.5 Computer Use model7 months agohttps://blog.google/technology/google-deepmind/gemini-computer-use-model/Gemini 2.5计算机视觉模型正式发布,该模型基于Gemini 2.5 Pro的视觉理解与推理能力构建该模型支持智能体通过用户界面(UI)执行表单填写、点击操作和页面滚动等交互任务在网络和移动端控制基准测试中,其表现优于主流替代方案且延迟更低模型输入包括用户请求、屏幕截图和操作历史记录,可选择性排除特定内容或添加自定义功能采用循环工作机制:分析输入→生成界面操作→执行动作→循环直至任务完成针对网页浏览器进行优化,具备移动端UI控制潜力,但暂不支持桌面操作系统级任务内置安全防护机制,可降低滥用风险、规避异常行为及防止提示词注入攻击开发者可实施额外安全管控,例如分步骤安全检查与系统指令限制早期测试者已将其应用于UI测试、个人助手和工作流自动化等场景现通过Google AI Studio和Vertex AI的Gemini API开放公测,提供演示案例和技术文档
A tiny recursive reasoning model achieves 45% on ARC-AGI-1 and 8% on ARC-AGI-27 months agohttp://alexiajm.github.io/2025/09/29/tiny_recursive_models.html提出Tiny Recursion Model(TRM),这是一个仅含700万参数的递归推理模型,在ARC-AGI-1上达到45%准确率,在ARC-AGI-2上达到8%挑战了'解决复杂任务必须依赖大规模基础模型'的传统认知通过递归推理的效率优势,实证'少即是多'的模型规模理念TRM简化了递归推理机制,无需依赖生物学论证或不动点定理阐述其递归过程:通过逐步更新潜在状态和答案实现高效精准推理
Investing in America 20257 months agohttps://blog.google/inside-google/company-announcements/investing-in-america-202...谷歌投资40亿美元在阿肯色州建设新数据中心、推进能效计划等项目谷歌在美国的基础设施、研发和AI能源能力投资正支撑着美国创新这些投资旨在加强网络安全、创造就业机会并推动科学突破谷歌正在扩大其在美国多地区的影响力,更多项目正在规划中
A terminal command that tells you if your USB-C cable is bad7 months agohttps://kau.sh/blog/usbi/苹果修改了针对Tahoe系统的命令。不同USB线缆的充电速度和数据传输速率存在差异。Android Studio在连接手机时会提示低速USB线缆的警告。创建了名为'usbi'的脚本用于通过命令行检查USB连接状态。该脚本解析macOS的system_profiler SPUSBHostDataType命令以生成更清晰的输出。初始版本是杂乱的bash脚本,难以维护。改用Go语言重写后获得了更好的代码结构、可维护性和跨平台兼容性。人工智能极大缩短了脚本创建和重构所需的时间与精力。AI降低了开发小型工具脚本的门槛,从而改变了我们时间投入的性价比判断。
Pamela Samuelson – Does Using In-Copyright Works as Training Data Infringe?7 months agohttps://cacm.acm.org/opinion/does-using-in-copyright-works-as-training-data-infr...美国法院已受理40多起针对生成式AI开发商的版权侵权诉讼,涉及训练数据使用问题。合理使用原则是AI开发商的主要抗辩理由,在巴茨诉Anthropic案和卡德雷诉Meta案中胜败不一。法官们就使用'盗版'书籍的影响及可能损害人类作者的'市场稀释'新理论展开辩论。版权法保护原创作品,但受限于需考虑四个要素的合理使用原则。转换性目的是合理使用案件关键,如坎贝尔诉阿卡夫-罗斯音乐案所示。巴茨案和卡德雷案是针对Anthropic和Meta使用书籍训练AI模型的集体诉讼。法官认为部分训练用途具有转换性,但强调需综合考虑其他因素。商业目的可能不利于合理使用认定,但若具转换性则影响较小。使用盗版书籍作为训练数据遭批评,但未明确判定违反合理使用。巴茨和卡德雷等高度表达性作品更接近版权保护的'核心'范畴。为转换性目的复制整部作品进行训练被视为合理。法官基本驳回了关于许可收入损失和销售损失的论点。认为AI输出充斥市场损害人类作者的'市场稀释'理论被视为新颖但推测性。查布里亚法官指出特定体裁和作者可能更易受AI生成内容竞争影响。市场稀释理论缺乏先例,上诉阶段可能面临挑战。法院或判令金钱赔偿而非颁布禁止AI训练的禁令。巴茨案和卡德雷案裁决表明部分训练用途可能属合理使用,问题尚未完全解决。