Why Today's Humanoids Won't Learn Dexterity8 months agohttps://rodneybrooks.com/why-todays-humanoids-wont-learn-dexterity/尽管投入了大量资金,人形机器人目前仍无法实现人类般的灵巧操作能力。机器人的灵巧性需要丰富的触觉和力觉感应,而现有系统尚不具备这些功能。端到端学习在语音识别、图像标注和语言模型领域已取得成功,但这种方法依赖于特定领域的预处理。当前人形机器人采用刚性高能量行走机制,对人类存在安全隐患。未来人形机器人可能会出现多种形态(如轮式底座、多手臂设计),但仍将被归类为'人形机器人'。
Am I Slop? Am I Agentic? Am I Earth?8 months agohttps://longnow.org/ideas/identity-neural-media-ai/人工智能既挑战又增强人类能力,引发关于智能计算、劳动自动化、所有权和社会影响的深刻问题神经媒体(包含AI与脑机接口的新范畴)通过反馈循环影响着人类身份认同与主观意识媒体类型以30年为周期演进,神经媒体目前处于成熟周期中期,仍保持可塑性特征AI通过统计分布感知并映射人类用户,将身份塑造为潜在空间中的嵌入向量日常生活维度由个体在AI潜在空间中的坐标决定,这种定位影响着自我认知与物质现实文化实践呈现统计化自我认同特征,如交友软件百分位排名和社交媒体指标体系钟形曲线作为正态分布象征,既应用于多学科领域,也曾被扭曲服务于种族主义意识形态'平庸'(mid)概念源自大麻分级体系,现被转用于描述AI生成的同质化'糟粕'内容AI糟粕是统计分布均值产生的默认内容,缺乏独特性与情感共鸣的泛化产物生成式图像系统经历从混沌到照片写实的进化,低成本模型中仍存在被垃圾账号利用的缺陷糟粕机器人针对大众市场,将情感与意识形态蒸馏成具有操纵性的潜意识内容人类在神经媒体中的能动性体现为对抗或重构嵌入身份,AI代理可能实现能动性自动化地球导向的AI模型实现行星尺度感知,为嵌入式身份提供非人类的潜在空间多物种潜在空间提供更宏观视角,揭示生态互依性与协调治理的复杂性
Code Mode: the better way to use MCP8 months agohttps://blog.cloudflare.com/code-mode/MCP(模型上下文协议)是AI智能体访问外部工具的标准协议传统MCP使用方式直接将工具暴露给大语言模型,而将工具转换为TypeScript接口可提升性能并降低复杂度处理难度由于存在大量真实世界的TypeScript训练数据,大语言模型更擅长编写调用MCP工具的代码而非直接调用工具MCP为AI智能体提供统一的连接规范、文档标准和授权机制,可灵活适配各类API接口Cloudflare智能体开发套件现已支持将MCP工具转换为TypeScript接口,实现工具调用的代码生成功能Cloudflare Workers的动态加载机制可在安全沙箱中执行AI生成的代码,无需容器化部署Workers的隔离实例具有轻量化、高性能和安全特性,特别适合运行智能体生成的代码片段Workers的绑定机制提供对MCP服务器的受控访问,通过隐藏API密钥和限制网络权限来增强安全性该新方案通过允许大语言模型跳过中间神经网络处理环节,有效减少token浪费并提升执行效率
People don't want auth, they want Sign in with Google8 months agohttps://www.ivan.codes/thoughts/people-dont-want-auth软件开发中想法与实现之间的差距已显著缩小,使更多人无需传统编码技能即可构建应用程序潜在开发者群体正从2500万程序员扩展到5亿人,因为工具允许非技术人员通过日常英语描述需求来创建软件新型开发者更关注结果和用户可见功能,而非认证或支付处理等技术细节,他们偏好'用谷歌登录'和'月订阅'等解决方案当前的开发工具和文档仍面向传统开发者,忽视了这波以功能为导向(而非架构思维)的新兴开发者群体的需求我们需要建立更符合新型开发者思维模式的抽象层和基础设施,以填补空白,直到AI能完美将他们的需求转化为代码
Show HN: Reddit browser for MCP clients – works with any AI assistant8 months agohttps://github.com/karanb192/reddit-mcp-buddyReddit MCP Buddy 是一个专为Claude Desktop等AI助手设计的模型上下文协议(MCP)服务器无需API密钥即可实现Reddit浏览、帖子搜索和用户活动分析功能特点包括零配置、认证后请求量提升10倍、数据纯净度及LLM优化响应支持三种认证级别:匿名(10次/分钟)、仅应用(60次/分钟)和完全认证(100次/分钟)集成子论坛浏览、全站搜索、帖子详情获取、用户分析和Reddit术语解释等工具提供npm安装、Docker部署及GitHub直接克隆三种安装方式内置速率限制测试工具可验证各认证层级通过智能缓存和低系统资源占用实现性能优化采用MIT开源协议,鼓励社区贡献为开发者和用户提供清晰的文档和技术支持
Larry Ellison – 'citizens will be on their best behavior' amid nonstop recording8 months agohttps://fortune.com/2025/09/28/larry-ellison-ai-surveillance-oracle-tiktok-deal-...拉里·埃里森预言未来将处于AI持续监控之下,包括执法部门对日常活动的监测。甲骨文是AI领域的重要参与者,并参与了TikTok美国业务收购交易。甲骨文获得OpenAI价值3000亿美元的云服务合同,并参与'星际之门'项目。甲骨文营收预测显示合同金额将增长359%,达到4550亿美元。甲骨文预计将收购TikTok美国业务并监管其算法与安全。特朗普总统签署行政令推动TikTok转由美国控股,甲骨文在其中扮演关键角色。副总统JD·万斯确认算法将由美方控制,以确保数据安全。
Write the Damn Code8 months agohttps://antonz.org/write-code/将问题拆解为更小的模块,并明确具体需求避免与AI陷入无止境的提示词反复调整亲自动手编写代码,将AI作为辅助工具而非替代品深入参与编码过程,而非完全依赖AI若AI未能快速响应,停止优化提示词直接编写代码将AI作为工具使用,避免用'英语编程'以提升效率
Claude Sonnet 4.58 months agohttps://www.anthropic.com/news/claude-sonnet-4-5Claude Sonnet 4.5被宣称为全球最佳编程模型,在复杂智能体、计算机操作、逻辑推理和数学方面表现卓越新增功能包括Claude Code检查点、终端界面更新、原生VS Code扩展、上下文编辑和Claude API的记忆工具代码执行和文件创建(电子表格、幻灯片、文档)现已直接集成到Claude应用中发布Claude智能体开发套件(SDK),为开发者提供构建自定义智能体的基础设施Claude Sonnet 4.5在SWE-bench Verified(77.2%)和OSWorld(61.4%)等基准测试中展现最先进性能在金融、法律、医学和STEM等领域的专业知识与推理能力获得显著提升早期客户反馈显示编码性能、漏洞处理效率和诉讼任务处理均有大幅改进Claude Sonnet 4.5是目前对齐度最高的前沿模型,安全性提升且问题行为减少在AI安全等级3(ASL-3)防护下发布,具备防范生化放射性核威胁的保障措施临时研究预览功能「Imagine with Claude」展示实时软件生成能力定价维持与Claude Sonnet 4相同,每百万token 3/15美元
Marissa Mayer will close her old AI startup, sell assets to her new AI startup8 months agohttps://techcrunch.com/2025/09/29/marissa-mayer-will-close-her-old-startup-sell-...玛丽莎·梅耶尔宣布关闭其消费者软件初创公司Sunshine,并将其资产出售给她的新AI初创公司Dazzle。Dazzle致力于开发AI个人助手,所有Sunshine员工将转入新公司。包括Norwest Venture Partners、Felicis Partners和SV Angel在内的大多数Sunshine投资者已批准该交易。Sunshine成立于2018年,最初推出了一款名为'Sunshine Contacts'的联系人管理应用,但因隐私问题遇冷。2024年Sunshine增加了事件管理和AI照片共享功能,但收效甚微,Google Play下载量仅1000+次。该公司2020年融资2000万美元,据梅耶尔透露主要依靠自筹资金运营。
iRobot Founder: Don't Believe the (AI and Robotics) Hype8 months agohttps://crazystupidtech.com/2025/09/29/irobot-founder-dont-believe-the-ai-roboti...机器人学专家罗德尼·布鲁克斯探讨了AI与机器人技术的现状及未来,主张保持务实乐观的态度。布鲁克斯批评了人形机器人的过度炒作,指出仓库自动化机器人等实用但不起眼的解决方案更具实际影响力。他强调通过智能推车等技术减轻仓储物流人员体力负荷的重要性。以自动驾驶汽车为例,布鲁克斯阐释了技术发展缓慢迭代的特性。他反思了为缺乏噱头但极具实用价值的机器人方案筹集资金的困境。布鲁克斯剖析人们对机器人的误解,指出并非所有有效机器人都需具备人形外观。他将当前AI炒作周期与历次技术浪潮对比,警示过度乐观的风险。探讨3D打印与新型材料如何颠覆制造业,降低对传统供应链的依赖。预言尼日利亚可能凭借人口增长和问题解决需求,在本世纪末成为科技中心。布鲁克斯主张AI与机器人发展应立足现实,聚焦具体问题解决而非复制人类能力。
Diffusion Cam: img2text2img social media8 months agohttps://www.diffusion.cam/diffusion.cam是首个由人类分享合成媒体的人工社交网络用户可将照片转化为文字描述,再通过AI将文字转回图像(img2text2img)仅存储并公开分享生成的图像和文字描述,原始照片不予保存,确保匿名性平台使用Florence-2生成图像描述,FLUX生成图像,两者均存在固有偏见(如种族、性别、审美)每张图像处理需10-30秒,由Nvidia A100 GPU通过fal.ai驱动
AI tools I wish existed8 months agohttps://sharif.io/28-ideas-2025用纳米香蕉提升iPhone照片至徕卡品质的相机应用为前端项目添加明暗模式与自定义主题的AI助手用于反编译和调试压缩代码的AI代理结合Strong与ChatGPT的混合型健身教练(带详细情境分析)基于浏览历史的个性化晨间阅读摘要推荐引擎基于营养数据库的卡路里追踪聊天应用极简写作应用(含AI反馈及多评审角色)能创建特定任务专用代理的AI母体配备AI解析与作者人格模拟的极简电子书阅读器支持多日推理的复杂查询深度研究代理分镜式「数字填色」短片创作应用带语义摘要的本地屏幕录制工具(记录日常电脑使用)Twitter/X/YouTube的语义过滤器(屏蔽煽动性内容)从入门到精通的细分领域课程生成代理结合个性化测试与情景模拟的书籍推荐系统TikTok/Instagram Reels的语义搜索引擎整合多设备数据的睡眠健康建议应用专为聊天界面设计的高阶组件库Apple Watch极简语音助手(应答简洁)根据写作主题推荐阅读清单的创作应用依据实时数据调整的个性化跑步训练计划应用含数百模板的纳米香蕉照片编辑工具Same.energy同款「氛围匹配」YouTube视频搜索儿童版索尼Walkman风格LLM问答设备基于当前人生难题的名人传记搜索引擎每日内容消费审计的屏幕录制代理超细分领域AI代理的交易市场可模拟海明威等著名作家点评的写作应用
GLM-4.6: Advanced Agentic, Reasoning and Coding Capabilies8 months agohttps://z.ai/blog/glm-4.6GLM-4.6是该系列旗舰模型的最新版本,相比GLM-4.5实现了关键性能提升。在八项基准测试中,GLM-4.6在智能体、推理和编程能力方面均有进步,可与DeepSeek-V3.2-Exp和Claude Sonnet 4等模型竞争,但编程能力仍稍逊于Claude Sonnet 4.5。CC-Bench实际测试显示,GLM-4.6与Claude Sonnet 4表现接近(胜率48.6%),优于其他开源模型,且比GLM-4.5节省15%的token消耗。GLM-4.6已通过Z.ai API平台和OpenRouter开放使用,并提供完整技术文档支持。Claude Code、Kilo Code等编程智能体现已支持GLM-4.6模型。GLM编程计划订阅用户将自动升级至GLM-4.6;新用户能以1/7的成本获得Claude级别性能,并享受3倍配额。GLM-4.6的模型权重即将登陆HuggingFace和ModelScope平台,支持通过vLLM和SGLang进行本地部署。
People Can't Distinguish AI Voice Clones from Actual Humans Anymore8 months agohttps://singularityhub.com/2025/09/29/people-cant-distinguish-ai-voice-clones-fr...AI语音克隆技术现已达到与真人声音无法区分的程度研究人员仅用四分钟录音就能制作出逼真的语音克隆研究参与者无法区分AI语音克隆和真实人类声音AI生成的声音被认为比人类声音更具支配力和可信度潜在积极应用包括改善无障碍服务、教育和通讯领域担忧包括因无法检测的AI声音导致的版权侵权、错误信息和欺诈该研究凸显了AI语音技术快速发展和普及的现状
Not only am I losing my livelihood to AI – now it's stealing my em dashes too8 months agohttps://www.theguardian.com/lifeandstyle/2025/oct/01/artificial-intelligence-em-...编辑要求删除文章中的破折号,因其被视为AI生成内容的特征符号。作者对此表示沮丧,因为破折号是其最爱的标点符号,能体现其思维过程。AI频繁使用破折号源于对人类写作的学习,使其成为生成文本的默认选择。作者幽默地考虑用逗号或分号替代破折号,但认为这些替代方案难以令人满意。文章感叹AI的影响可能导致破折号在写作中的消亡。
Cerebras Systems Raises $1.1B Series G at $8.1B Valuation8 months agohttps://www.cerebras.ai/press-release/series-gCerebras Systems在G轮融资中以81亿美元估值筹集11亿美元本轮投资由富达管理与研究公司和Atreides Management领投,老虎环球基金、Valor Equity Partners等机构跟投资金将用于扩大AI处理器设计、制造及数据中心容量建设Cerebras保持AI推理性能领先地位,速度较英伟达GPU快20倍主要客户涵盖AWS、Meta、IBM及美国国防部等政府机构Cerebras是Hugging Face平台排名第一的推理服务商,月请求量超500万次花旗集团与巴克莱资本担任本轮融资联席配售代理
DeepSeek releases 'sparse attention' model that cuts API costs in half8 months agohttps://techcrunch.com/2025/09/29/deepseek-releases-sparse-attention-model-that-...DeepSeek发布了一款名为V3.2-exp的实验性新模型,可降低长文本推理成本该模型采用DeepSeek稀疏注意力技术,通过'闪电索引器'和'细粒度token选择系统'优化服务器负载初步测试表明在长文本场景下API调用成本最高可降低50%该模型为开源权重模型,已登陆Hugging Face平台供第三方验证DeepSeek致力于改进Transformer架构效率以降低推理成本这家中国公司曾因R1模型引发关注,后逐渐淡出公众视野新型稀疏注意力技术或有助于美国供应商降低推理成本
Making sure AI serves people and knowledge stays human8 months agohttps://diff.wikimedia.org/2025/09/30/making-sure-ai-serves-people-and-knowledge...维基媒体基金会认为获取知识是一项基本人权,并致力于确保所有人能自由开放地获取可靠信息。2024年开展的人工智能与机器学习人权影响评估(HRIA),旨在研究这些技术对维基生态系统中人权的影响。生成式AI和大语言模型(LLMs)为信息创作、获取与传播带来机遇的同时也带来挑战。维基媒体自2010年起便使用AI/ML工具进行破坏检测和引用标注,但生成式AI引发了新的议题。核心问题包括AI在知识共享中的定位、如何保障信息准确性,以及确保AI工具辅助而非取代人类贡献。HRIA报告识别了潜在风险与机遇,但指出目前尚未发生实际损害案例。风险包括AI工具偏见、有害内容生成,以及维基内容被用于LLM训练引发的连锁影响。报告建议通过风险监控和现有数据质量计划来缓解潜在危害。基金会与志愿者社区已开始实施应对这些风险的策略。社区反馈与协作对有效落实HRIA建议至关重要。即将开展的讨论与多语言协作计划,将推动全球维基社区共同应对AI/ML挑战。
Effective context engineering for AI agents8 months agohttps://www.anthropic.com/engineering/effective-context-engineering-for-ai-agent...上下文工程正成为人工智能领域的新焦点,从提示词工程转向优化上下文配置以获得理想的模型行为。上下文指大语言模型采样时包含的token序列,上下文工程就是针对模型限制优化这些token的配置过程。提示词工程专注于撰写有效指令,而上下文工程需要管理系统指令、工具链和对话历史等完整上下文状态。大语言模型存在'上下文衰减'现象——随着上下文窗口扩展,模型的信息提取能力会下降,这要求对token进行精细管理。高效的上下文工程在于找到最小化的高价值token组合,在系统提示的精确性与灵活性之间取得平衡。智能体工具应当保持高效、模块化和界面清晰,避免工具集过度臃肿导致功能模糊。示例样本(小样本提示)需要具备多样性和典型性,在明确示范预期行为的同时避免引入过多边缘案例。上下文检索策略正从'预推理检索'转向'即时加载'模式,智能体可在运行时动态获取所需数据。长周期任务需要采用上下文压缩(摘要)、结构化备忘、子智能体架构等技术来突破上下文限制。上下文工程的核心原则是:通过精选高信息密度的token,最大化模型有限注意力资源的利用率。
LLMs are the ultimate demoware8 months agohttps://blog.charliemeyer.co/llms-are-the-ultimate-demoware/大语言模型(LLMs)被称为终极'演示软件'——演示效果惊艳,实际应用却常掉链子演示软件指那些展示时光鲜亮丽,日常使用中却缺乏稳定性和实用价值的程序,这与多数场景下的LLMs如出一辙当前LLM软件的推广主要依靠人工智能热潮,但其在演示场景之外的实际效用值得怀疑与传统演示软件不同,LLMs只需极简操作就能在不同领域产出令人印象深刻的演示效果关于"LLMs会持续进化最终超越演示软件"的论调正随着模型发展速度放缓而失去说服力当企业意识到现有AI软件的实际价值有限而停止续费时,科技行业可能面临严峻挑战区分演示软件与实用工具的关键标准是:该工具是否成为日常工作不可替代的部分——而当前多数AI工具都未通过这项测试