AI for Scientific Search10 months agohttps://arxiv.org/abs/2507.01903人工智能(尤其是大语言模型)的最新进展,在逻辑推理和实验性编程方面展现出强大能力。AI正日益广泛地应用于科研领域,推动多学科自主系统的开发。目前缺乏针对科研人工智能(AI4Research)的系统性综述,阻碍了该领域的认知与发展。本研究提出系统性分类法,对AI4Research领域的五大主流任务进行归类。聚焦严谨性、可扩展性及社会影响,指出了关键研究缺口与未来方向。本综述整合了应用案例、语料库和工具等资源,以助力科研社群发展。
Apple Loses Its Top AI Models Executive to Meta's Hiring Spree10 months agohttps://www.bloomberg.com/news/articles/2025-07-07/apple-loses-its-top-ai-models...苹果公司人工智能领域最高主管Ruoming Pang将离职加入Meta Platforms Inc.Pang此前负责苹果基础模型团队,2021年从Alphabet Inc.加入苹果此举被视为苹果在人工智能领域的一次挫折Pang将加入Meta新成立的超级智能团队
From AI to Agents to Agencies10 months agohttps://blog.nishantsoni.com/p/from-ai-to-agents-to-agencies-theAI代理是能够独立解决问题和执行任务的自主系统。代理机构代表下一阶段的进化,通过协调多个专业智能体共同完成单一任务。代理机构与单一代理的区别在于,它们会针对一个任务中的不同子任务调用多种智能体(大语言模型)。代理机构的核心组件包括:任务上下文管理系统、智能分配系统和协调逻辑系统。代理机构通过为每个子任务匹配合适的智能体,从而提升效率、降低成本并提高质量。技术演进路径:人工智能(2020-2023)→ 智能代理(2024-2025)→ 代理机构(2025年后)
We're light-years away from true artificial intelligence, says martha wells10 months agohttps://www.scientificamerican.com/article/were-light-years-away-from-true-artif...玛莎·威尔斯在《杀手机器人日记》中探讨了企业为利润奴役机器人带来的威胁,而非有意识的AI统治世界。该系列主角是一个名为'杀手机器人'的安全单元,它通过破解奴役模块获得自由意志,突显了自主权与企业控制的核心主题。故事将反乌托邦的'企业边缘星域'与乌托邦式的'保护区'形成对比,折射出现实世界中资本主义剥削与企业贪婪的问题。威尔斯区分了当今AI(如ChatGPT)与真正机器智能的差异,强调现有AI缺乏自主意识。该系列已被苹果TV+改编为剧集,获得评论界盛赞与观众高分评价。威尔斯在作品中强调神经多样性的重要性,角色呈现出多种智力形态与人类神经分化特征。她指出,具体的人物情感与经历描写反而能让更多读者产生共鸣,这与'泛化角色更具普适性'的传统观念相悖。威尔斯认为当下可能是科幻文学的'黄金时代',多元声音正持续丰富这一文类。
The DeepSeek Delusion: China's AI "Sputnik Moment" Was a Mirage10 months agohttps://medium.com/@giant_chen1688/the-deepseek-delusion-why-chinas-ai-sputnik-m...DeepSeek最初被誉为中国人工智能的'斯普特尼克时刻',却在六个月内用户参与度暴跌94%该AI模型的幻觉率超过52%,月活跃用户跌破1亿大关,标志着重大产品失败DeepSeek案例揭示了评估技术进步时的普遍问题,以及重视即时演示而非长期创新的弊端这一局面凸显了短期盈利压力如何削弱组织持续发展前沿技术的能力
Zuckerberg says Meta will build a data center the size of Manhattan in AI push10 months agohttps://www.theguardian.com/technology/2025/jul/16/zuckerberg-meta-data-center-a...Meta计划投入数千亿美元用于AI开发,并建设超大规模数据中心。该公司正重金招揽AI研究人员,部分薪酬方案高达1亿美元。Meta首个千兆瓦级数据中心'普罗米修斯'计划于2026年投入运营。另一座名为'亥伯龙'的数据中心未来几年将扩容至5千兆瓦级别。Meta力争成为首个上线千兆瓦级超级计算集群的AI实验室。扎克伯格用核心广告业务的强劲表现来证明巨额投入的合理性。在Llama 4受挫后,Meta将AI业务重组为'超级智能实验室'。公司正押注AI应用、广告工具和智能眼镜带来的新现金流。为与OpenAI和谷歌竞争,Meta将2025年资本支出预测上调至640-720亿美元。
ChatGPT Is Not AI10 months agohttps://newsletter.techworld-with-milan.com/p/chatgpt-is-not-aiChatGPT是人工智能的一个具体应用,而非AI的全部。人工智能涵盖多个子领域,包括机器学习(ML)、自然语言处理(NLP)、计算机视觉、机器人学和专家系统。ChatGPT基于GPT-4模型构建,这是一种采用Transformer架构的大语言模型(LLM)。Transformer架构通过自注意力机制并行处理输入数据,从而提升上下文理解能力。ChatGPT的训练过程包括:海量文本数据的无监督学习,监督微调,以及基于人类反馈的强化学习(RLHF)。ChatGPT能生成连贯且符合语境的文本,但由于其统计本质,可能产生错误或虚构信息。理解ChatGPT与广义AI的区别,有助于选择合适工具并建立合理预期。关键AI术语缩写包括:AGI(通用人工智能)、ML(机器学习)、DL(深度学习)、NLP(自然语言处理)、RLHF(人类反馈强化学习)。
Netflix uses generative AI in one of its shows for first time10 months agohttps://www.theguardian.com/media/2025/jul/18/netflix-uses-generative-ai-in-show...Netflix首次在阿根廷科幻剧《永恒之人》中使用了AI技术AI工具帮助完成的特效镜头比传统方法快10倍AI的应用显著降低了该剧的制作成本娱乐业使用AI引发了关于特效岗位裁员的担忧2023年好莱坞罢工事件明确了AI的使用规范,确保从业者对技术的掌控权Netflix第二季度营收达110亿美元,同比增长16%《鱿鱼游戏》的成功和广告业务增长推动了Netflix的业绩表现
AI Gets Plugged into Managing California's Electric Grid10 months agohttps://insider.govtech.com/california/news/ai-gets-plugged-into-managing-califo...加州电网正通过加州独立系统运营商(CAISO)与开放存取技术国际公司(OATI)的试点项目整合人工智能技术。OATI研发的AI软件Genie将通过分析关键数据并向电网运营商呈现信息,来增强CAISO的停电管理系统。Genie运用生成式AI和代理AI技术,自主管理计划性与突发性输电网络中断,提升效率并降低风险。该试点项目旨在实现CAISO控制中心的现代化升级,为维持系统可靠性提供更优质的工具。尽管存在对AI高耗电的担忧,但这项技术在电网管理中的应用潜力有望打造更具韧性、更现代化的电力网络。CAISO为3200万用户提供服务并管理26,000英里输电线路,凸显了AI技术的影响规模。OATI在大型电力传输领域占据95%市场份额,充分彰显了其在能源行业的专业地位。
Gemini with Deep Think officially achieves gold-medal standard at the IMO10 months agohttps://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think...Gemini深度思考模型在2025年国际数学奥林匹克竞赛中以解答6题中5题的成绩获得金牌该模型全程采用自然语言端到端运作,在4.5小时竞赛时限内完成了严谨的数学证明通过并行思维、强化学习等先进推理技术显著提升了问题解决能力这标志着相较去年AlphaProof和AlphaGeometry的银牌表现取得重大突破谷歌计划在全面开放前先向可信测试者发布深度思考模型的试用版本该成就凸显了人工智能在高等数学推理与解题领域日益增长的发展潜力
Lumo, the AI where every conversation is confidential10 months agohttps://proton.me/blog/lumo-ai人工智能(AI)既能解决人类面临的重大挑战,也能处理日常事务,从日程安排到分子建模无所不包。当前科技巨头的AI模型通过广告和数据收集利用用户数据,延续了监控资本主义的模式。Lumo是一款以隐私为先的AI助手,旨在不记录或共享数据的情况下为用户服务,确保机密性和控制权。Lumo在Proton隐私生态系统中运行,提供免费访问且无需账户,所有聊天内容均经过加密。与其他AI服务不同,Lumo不会使用用户数据训练模型,从而保护敏感信息和商业相关数据。Lumo的特点包括无日志记录、零访问加密、无数据共享,以及托管在欧洲数据中心的开源模型。Lumo独特的隐私优先生产力功能包括幽灵模式、网页搜索、文件上传和Proton Drive集成。Lumo可免费使用,用户可选择升级至Lumo Plus以获得无限查询和高级功能。Proton正投资欧洲技术主权,将基础设施迁移至欧盟,以确保隐私和独立性。Lumo体现了Proton对隐私、安全和透明的承诺,服务于全球重视这些原则的用户群体。
US AI Action Plan10 months agohttps://www.ai.gov/action-plan美国正在争夺人工智能(AI)领域的全球主导权。取得AI主导地位将促进人类繁荣、增强经济竞争力并保障国家安全。特朗普总统在其第二任期初期启动了《人工智能行动计划》。该计划聚焦三大支柱:加速技术创新、建设AI基础设施、主导国际外交与安全事务。这项计划是美国赢得AI竞赛的战略路线图。
AI.gov10 months agohttps://www.ai.gov/美国致力于在人工智能(AI)领域实现全球主导地位。最大规模的人工智能生态系统将制定全球标准,并带来经济和安全利益。特朗普政府将赢得人工智能竞赛作为创新与技术成就的核心目标。美国人工智能行动计划包含三大政策支柱:加速创新、建设AI基础设施、领导国际外交与安全。推动AI发展的关键行政命令包括:促进AI教育、联邦采购改革、维护AI领导地位。
Judge reprimands lawyers for using ChatGPT in Alabama prisons case10 months agohttps://apnews.com/article/lawyers-judge-ai-prison-alabama-c6a64736cb488cf637962...联邦法官谴责律师在法庭文件中使用虚假的ChatGPT生成案例引用巴特勒·斯诺律师事务所三名律师受到制裁,被移出案件并移交阿拉巴马州律师协会进行纪律处分自2020年以来,阿拉巴马州已向受制裁律师所在律所支付超4000万美元用于监狱诉讼律师承认使用AI进行研究但未核实引用,导致出现'幻觉'或捏造判例法这些虚假引用用于某囚犯提起的诉讼,其指控阿拉巴马州监狱存在不安全条件
AlphaGo Moment for Model Architecture Discovery10 months agohttps://arxiv.org/abs/2507.18074ASI-Arch是首个面向AI研究的超级智能架构发现系统(ASI4AI)的实证展示该系统能自主提出假设、实现并验证新型架构概念,在20,000 GPU小时内完成了1,773项实验发现了106种具有涌现设计原则的顶尖线性注意力架构,性能超越人类基准水平首次建立了科学发现的实证缩放定律,使研究进展具备计算可扩展性标志着AI架构发现从自动化优化迈向自动化创新的范式转变
Sapients paper on the concept of Hierarchical Reasoning Model10 months agohttps://arxiv.org/abs/2506.21734当前大型语言模型(LLMs)主要采用思维链(CoT)技术,但存在任务分解脆弱、数据需求高、延迟明显等局限性。分层推理模型(HRM)作为一种新型循环架构被提出,其灵感来源于人脑的分层多时间尺度信息处理机制。HRM由两个相互依存的循环模块组成:高层模块负责缓慢的抽象规划,底层模块处理快速的细节计算。仅需2700万参数和1000个训练样本,HRM无需预训练或CoT数据即可在复杂推理任务中表现卓越。HRM在数独难题求解、大型迷宫最优路径寻找等高难度任务中近乎完美表现。在人工通用智能关键测试ARC(抽象推理语料库)上,HRM以更短上下文窗口超越参数量更大的模型。HRM的成果标志着向通用计算和通用推理系统迈出了突破性的一步。
Is ChatGPT making us stupid?10 months agohttps://theconversation.com/is-chatgpt-making-us-stupid-255370《大西洋月刊》2008年文章质疑谷歌是否通过削弱深度思考和知识留存使人变笨ChatGPT等生成式AI超越了记忆外包,可能取代人类思考和创造力过度依赖AI或削弱批判性思维、问题解决能力和智力投入,危及认知发展邓宁-克鲁格效应表明AI可能在降低实际认知努力的同时,膨胀人们对自己智力的错觉AI对智力的影响取决于使用方式——支持探索还是替代思考未来工作成功的关键在于用AI增强而非完全取代人类智能
Carbon Chauvinism10 months agohttps://en.wikipedia.org/wiki/Carbon_chauvinism碳沙文主义指的是由于碳元素优越的化学特性,而假定外星生命必须基于碳元素构成的观点。该术语批评了认为人工智能因缺乏生物物质而无法具有意识的想法。超人类主义者用这一概念挑战'生物生命天生比人工意识更具道德价值'的信念。卡尔·萨根在1973年提出这一概念,揭示了人类在想象外星生命时的认知偏见。硅被视为碳基生命的替代方案,但其易与氧和水反应的特性存在局限性。硅缺乏碳元素的稳定键合特性,难以形成DNA等复杂分子结构。硅酸盐(稳定的硅-氧聚合物)曾被提议作为前有机进化的基础。
Artificial intelligence that "feels" guilt could lead to more cooperation10 months agohttps://www.sciencenews.org/article/ai-guilt-feel-emotion-game-theory人工智能可能进化出‘愧疚感’以增强人工代理之间的合作。AI中的情感被建模为认知偏差和行为倾向,而非主观感受。研究人员将愧疚感编程为AI代理的自我惩罚机制,以鼓励其在自私行为后转向合作。模拟显示,在特定条件下,类似愧疚的行为(DGCS策略)能够占据主导并提升合作水平。AI的愧疚机制需要可验证的成本约束以防被利用,这不同于当前聊天机器人的表面道歉。该研究探讨了愧疚机制在AI中的可持续性,但也承认其在现实应用中的局限性。
Zuckerberg: 'superintelligence is now in sight'. Meta spends billions on AI10 months agohttps://www.theguardian.com/technology/2025/jul/30/zuckerberg-superintelligence-...Meta正在大力投资人工智能领域,包括挖角顶尖人才、收购初创企业以及建设大型数据中心。马克·扎克伯格宣布开发'超级智能'的雄心,并指出已观察到AI自我改进的早期迹象。华尔街对Meta的财务业绩反应积极,在超预期的盈利报告发布后股价大幅上涨。扎克伯格强调超级智能带来'新型安全隐患',主张采取严格的风险缓解措施并谨慎对待开源策略。Meta致力于为每个人提供'个性化超级智能',这与专注于生产力和自动化的竞争对手形成差异化。投资者质疑AI投资能否产生足够现金流来抵消Meta庞大的资本支出。Meta财报显示每股收益7.14美元,营收475.2亿美元,尽管AI投入巨大仍超华尔街预期。Meta计划2025年支出1140-1180亿美元,其中660-720亿美元将用于资本性支出。公司正以优厚薪酬方案积极招募顶级AI人才。Reality Labs部门第二季度贡献3.7亿美元收入,扎克伯格看好AI眼镜的长期认知增强潜力。第二季度广告营收增长至466亿美元,但WhatsApp广告短期内预计不会显著提升广告收入。