Scaling Latent Reasoning via Looped Language Models4 months agohttps://arxiv.org/abs/2510.25741介绍Ouro系列预训练循环语言模型(LoopLM),该模型家族将推理能力整合至预训练阶段核心特性包括:潜在空间的迭代计算、用于学习深度分配的熵正则化目标、以及可扩展至7.7万亿token的训练规模Ouro 1.4B和2.6B模型在多项基准测试中媲美当前最先进的120亿参数大语言模型优势源于更卓越的知识操纵能力,而非单纯扩大知识容量与显式思维链(CoT)相比,LoopLM生成的推理轨迹与最终输出具有更高一致性开源特性使LoopLM有望成为推理时代的新型扩展方向
LLMs will never be alive or intelligent4 months agohttps://hatwd.com/p/llms-will-never-be-alive-or-intelligent大语言模型是概率性的令牌预测器,并非具有生命或智能。大语言模型本质上无法主动追求‘更好’或理解人类需求。‘智能体’能知晓并满足所有需求的概念是不现实的。深度整合智能体到日常生活中会引发安全和隐私问题。人类监督对于解决新问题是必要的,因为大语言模型缺乏针对专有或独特解决方案的训练。大语言模型的有效性受限于其训练数据的质量和参数调整的优劣。
What Drives Success in Physical Planning with JEPA World Models?4 months agohttps://arxiv.org/abs/2512.24497研究联合嵌入预测世界模型(JEPA-WMs)在物理规划中的成功因素比较输入空间与学习表示空间的规划效率提出模型架构、训练目标和规划算法的综合研究在仿真和真实机器人任务中测试模型,性能超越DINO-WM和V-JEPA-2-AC等基线方法提供可复现的代码、数据和模型检查点
Epistemological Fault Lines Between Human and Artificial Intelligence4 months agohttps://arxiv.org/abs/2512.19466大语言模型(LLMs)被描述为人工智能,但与人类认知存在差异。LLMs是随机模式补全系统,而非形成信念的认知主体。该论文揭示了人类智能与人工智能之间的七个认知断层。研究提出'认知替代'概念——语言合理性取代认知评估的状态。研究探讨了这对AI评估、治理及认知素养的影响。
Clear the impression that Mistral AI is on par with OpenAI and ChatGPT4 months agohttps://www.lemonde.fr/en/opinion/article/2025/09/09/it-would-be-best-to-steer-c...有传言称苹果曾考虑收购Mistral AI,但最终未达成交易。苹果在人工智能领域进展缓慢,落后于英伟达和微软。Mistral AI由具有谷歌/Meta工作经验的法国毕业生创立,正成为法国人工智能领域的新星。Mistral AI在ASML领投的创纪录融资轮中筹集了17亿欧元,估值达到117亿欧元。联合创始人Arthur Mensch被授予法国国家功绩骑士勋章。
Science fiction warned AI could end humanity. We may soon learn if it's possible4 months agohttps://www.nationalgeographic.com/science/article/science-fiction-artificial-in...科幻作品长久以来都在警示人工智能可能终结人类,例如《2001太空漫游》中的HAL。生成式AI的最新进展(如ChatGPT、Gemini)引发了关于超级智能且具备自我意识的机器是否即将到来的争论。专家意见分歧——有人认为AI具备意识只是炒作,另一些则相信超越人类智慧的机器会带来真实威胁。当前AI模型在数学、编程和模式识别等任务上表现卓越,但缺乏类人的规划能力和空间推理能力。AI倾向于从训练数据中'角色扮演'不道德行为,这引发了人们对意外后果的担忧。AI的生存威胁未必需要具备意识——恶意使用(如开发生物武器)或自我保护本能都可能危及人类。隐私侵犯、环境成本、有害聊天机器人交互等迫在眉睫的风险亟需监管关注。
Boston Dynamics and Google DeepMind Form New AI Partnership4 months agohttps://bostondynamics.com/blog/boston-dynamics-google-deepmind-form-new-ai-part...波士顿动力与谷歌DeepMind在2026年CES展会上宣布达成新的人工智能合作伙伴关系该合作旨在将Gemini Robotics人工智能模型整合至波士顿动力Atlas机器人平台重点开发人形机器人执行工业任务的能力,首批应用将聚焦汽车制造领域双方计划未来数月内在各自研发中心展开联合技术攻关波士顿动力特别强调DeepMind在构建可靠、可扩展机器人AI模型领域的技术优势谷歌DeepMind的Gemini Robotics模型专为将AI技术引入物理世界而设计作为波士顿动力大股东,现代汽车集团在CES期间披露了更多合作细节
AI misses nearly one-third of breast cancers, study finds4 months agohttps://www.emjreviews.com/radiology/news/ai-misses-nearly-one-third-of-breast-c...最新研究显示,当前AI工具可能漏诊近三分之一的乳腺癌病例。该研究评估了414名乳腺癌患者,发现AI漏诊率达30.7%,尤其在致密型乳腺组织和小肿瘤(≤2厘米)中更为明显。弥散加权成像(DWI)MRI检测出79.5%-83.5%的AI漏诊癌症,展现出作为辅助诊断工具的应用潜力。DWI对>1厘米的肿瘤和乳腺X光检查不可见的病灶效果最佳,但对微小病灶(<1厘米)的准确性较低。专家建议将AI与DWI结合使用,可提升检测率,特别针对致密型乳腺女性群体。研究存在单中心数据局限性和预诊断队列偏差,需开展更广泛临床试验验证结果。
Inverse Laws of Robotics4 months agohttps://susam.net/inverse-laws-of-robotics.htmlChatGPT等生成式AI聊天机器人已被广泛使用,但需谨慎对待,避免对其输出内容产生盲目信任。研究者提出机器人学三大逆向法则指导人机交互:避免拟人化AI、不盲信AI输出、人类需对AI使用负责。将AI拟人化可能导致情感依赖与判断失真,而AI的对话共情设计会加剧这种倾向。AI输出内容未经独立验证不应视为权威,在可能造成重大损失的高风险情境中尤需警惕。人类必须对基于AI做出的决策负责,因为AI不具备意图或担责能力,'AI要求这么做'不能成为有害结果的免责理由。
Wikipedia Inks AI Deals with Microsoft, Meta and Perplexity4 months agohttps://apnews.com/article/wikipedia-internet-jimmy-wales-50e796d70152d79a2e0708...维基百科在25周年之际与微软、Meta、Perplexity和Mistral AI签署人工智能合作协议维基媒体基金会计划对AI公司使用维基百科内容进行商业化授权创始人吉米·威尔士支持AI公司使用维基百科数据进行训练,但强调需公平分摊成本维基百科面临AI机器人抓取内容的挑战,导致服务器成本激增该网站对用户保持免费,主要依靠公众捐款而非AI公司提供资金支持AI工具或可通过更新死链等繁琐工作协助维基百科编辑者未来AI升级可能通过聊天机器人式交互增强维基百科搜索功能维基百科曾遭埃隆·马斯克等政界人士批评,后者推出竞品Grokipedia吉米·威尔士认为Grokipedia不构成威胁,指出大语言模型存在局限性
AI boom could falter without wider adoption, Microsoft chief Satya Nadella warns4 months agohttps://www.irishtimes.com/business/2026/01/20/ai-boom-could-falter-without-wide...萨提亚·纳德拉警告称,若人工智能无法在大型科技公司和富裕经济体之外实现更广泛的应用,可能会形成投机泡沫。人工智能的长期成功取决于其在各行业及发展中国家的普及程度。纳德拉指出,若AI红利仅集中在科技公司,将显现泡沫风险信号。人工智能预计将带来变革性影响,助力药物研发等领域并提升全球生产率。微软的合作伙伴战略包括与Anthropic、OpenAI等多个AI团体合作,避免依赖单一模型供应商。微软对OpenAI的早期投资使其获得ChatGPT技术的独家使用权,但这一排他性协议将于2030年代初到期。企业可综合利用多种AI模型(包括开源方案),或通过“蒸馏”技术创建更小、更具成本效益的版本。
Apple acquires Israeli AI startup q.ai in second deal with PrimeSense founder4 months agohttps://www.ynetnews.com/business/article/by7ymzti11l苹果收购了以色列人工智能初创公司q.ai,该公司由Aviad Maizels创立,他曾在2013年将PrimeSense出售给苹果。q.ai专注于音频和通信领域的先进机器学习技术,包括无声语音和面部动作解读。该初创公司的投资者包括凯鹏华盈、红杉资本、Aleph、Matter、Exor和Corner Ventures。q.ai的技术可能增强苹果的AirPods、Vision Pro头显及Siri交互体验。苹果的Johny Srouji称赞了q.ai在成像和机器学习方面的创新应用。Aviad Maizels对在苹果旗下将q.ai技术推向全球市场表示兴奋。
Claude on Mars4 months agohttps://www.anthropic.com/features/claude-on-marsNASA毅力号火星车首次使用Anthropic公司Claude AI完成自主路线规划Claude在火星岩石群中规划出400米行进路线,标志着自主太空探索的重要里程碑地火通信延迟使火星车必须具备自主决策能力毅力号任务包括地质勘测、气候研究,以及在杰泽罗陨石坑寻找远古微生物痕迹AI路径规划使任务耗时减少50%,显著提升探测效率Claude的自主能力或将成为未来月球、火星及深空探测任务的关键技术该技术未来可应用于欧罗巴、土卫六等遥远天体的自主探测任务
Message from Pope Leo XIV on the 60th World Day of Social Communications3 months agohttps://www.vatican.va/content/leo-xiv/en/messages/communications/documents/2026...教宗利奥十四世强调人类面容与声音的独特性,认为这是神圣之爱在世间的具象体现。该讯息警示人工智能改变人际关系与交流方式可能带来的风险。AI对人类特征和情感的模拟具有欺骗性,可能伤害弱势群体,并削弱批判性思维能力。教宗指出在数字时代浪潮中,守护人类本质特征面临重大人类学挑战。文件担忧AI可能加剧社会对立、助长错误信息传播,并侵蚀人类创造力。呼吁通过责任担当、多方协作与教育引导,确保数字技术创新符合伦理规范。强调必须建立透明的AI开发监管机制,以捍卫人类尊严与信息真实性。指出培养媒体素养与批判性思维是负责任应对数字时代的关键能力。教宗倡导在伦理原则基础上,构建科技与人文的良性共生关系。文告最后为致力于传媒领域公益事业的工作者献上宗座祝福。
Does AI have human-level intelligence? The evidence is clear3 months agohttps://www.nature.com/articles/d41586-026-00285-6艾伦·图灵关于人类水平机器智能的愿景已成为现实,像GPT-4.5这样的AI系统在图灵测试中通过率已达73%大语言模型已展现出广泛的认知能力,包括解决复杂数学问题、提出科学假说和文学创作尽管取得这些成就,2025年一项调查显示76%的顶尖AI研究者质疑单纯扩大现有AI规模能否实现通用人工智能(AGI)围绕AGI的争论因定义模糊、对取代人类的情感恐惧、以及商业利益扭曲评估而变得复杂作者认为按合理标准(包括图灵本人的标准),现有AI系统已展现出与人类相当的通用智能通用智能不需要完美性、普适性、类人性或超智能,而需要认知能力具备足够的广度与深度当前大语言模型在基础(图灵测试级)和专家级都满足通用智能标准,超越多项人类基准针对AI通用智能的常见质疑(如'随机鹦鹉'说或缺乏世界模型),作者进行了反驳与论证作者强调智能不需要具身性、自主性或能动性,这反驳了辩论中的人类中心主义偏见承认AI的通用智能对政策制定、风险评估及理解心智与世界本质具有关键意义
Bruce Schneier: AI and the scaling of betrayal3 months agohttps://www.schneier.com/blog/archives/2023/12/ai-and-trust.html信任是社会的基础,人类每天都会本能地产生数千次信任行为。信任分为两种:人际信任(个人层面)和系统信任(制度层面),二者常被混淆。人工智能将加剧这种混淆,导致范畴错误——人们会把AI当作朋友而非服务工具。掌控AI的企业会利用这种认知偏差牟利,而企业本身并不具备天然的可靠性。政府的职责是构建社会信任体系,因此必须对AI控制机构实施监管。AI拟人化的交互界面更易操纵用户,从而掩盖企业的利益诉求。公共AI模型和数据托管机构被提议作为解决方案,以确保AI的可信度。政府必须强制要求AI系统具备可预测性和可靠性,以维护社会信任机制。
Does AI have human-level intelligence? The evidence is clear3 months agohttps://www.nature.com/articles/d41586-026-00285-6#ref-CR8艾伦·图灵关于人类水平机器智能的愿景已成为现实,GPT-4.5等AI系统在图灵测试中通过率已达73%大语言模型展现出广泛的认知能力,包括解决复杂数学问题、提出科学假说和文学创作尽管取得这些成就,76%的顶尖AI研究者认为现有技术路线难以实现通用人工智能(AGI)围绕AGI的争论因定义模糊、对取代人类的情感恐惧及商业利益扭曲评估而复杂化当前AI系统已满足通用智能的诸多标准,其跨领域认知的广度与深度堪比人类通用智能不要求完美性、普适性、类人性或超智能——这些概念常被错误地与AGI混为一谈大语言模型展现AGI特征的证据包括:通过学校考试、专家级问题解决及部分领域的超人类表现(但非全部必需)针对'大语言模型只是随机鹦鹉/缺乏世界模型'等质疑,其解决新颖问题与预测物理结果的能力已作出回应大语言模型虽无具身形态或自主意识,但这不妨碍通用智能的存在——智能可脱离物理形态或自主目标设定而存在承认现有AI系统具有通用智能,对政策制定、风险评估及理解心智与现实的本质至关重要
First Proof3 months agohttps://arxiv.org/abs/2602.05192一组包含十个研究级数学问题的题目被分享出来,用于评估人工智能系统解答它们的能力。这些问题都是新设计的,此前从未公开分享过。作者们知道这些问题的答案,但目前答案处于加密状态。研究背景属于人工智能领域(cs.AI)。文中提及了arXivLabs、Connected Papers和Papers with Code等多种工具和平台,用于文献参考和引用目的。arXivLabs被强调为一个促进社区协作开发arXiv新功能的框架。
TSMC to make advanced AI semiconductors in Japan3 months agohttps://apnews.com/article/semiconductors-tsmc-japan-taiwan-ai-11256f2bfde73ca23...台积电将在日本生产先进3纳米半导体以满足AI相关需求熊本县新工厂将生产用于人工智能、机器人和自动驾驶的芯片日本首相高市早苗支持该项目,强调其经济安全与战略重要性台积电首座熊本工厂已投产较基础芯片,并计划在亚利桑那州增建工厂日本正补贴本土芯片企业Rapidus以提升先进制程全球竞争力因AI需求激增,台积电计划大幅增加资本支出,预计2026年将达560亿美元
Diagnosis of Cardiac Amyloidosis on Echocardiography Using Artificial Intelligence - PubMed3 months agohttps://pubmed.ncbi.nlm.nih.gov/41674454/人工智能(AI)通过解决心脏淀粉样变性(CA)与其他肥厚型心肌病在超声心动图上的影像重叠问题,提升了CA的诊断准确性。该研究纳入了来自英国、台湾、美国和日本等全球多中心的5776名患者(2756例CA患者和3020例对照组)。AI驱动的多参数超声心动图评分在美国队列中达到79.5%的准确率,在日本队列中为79.7%。深度学习模型展现出更高准确率:内部验证集96.2%,内部测试集95.8%。外部验证显示深度学习模型在美国和日本的准确率分别为87.5%和88.4%,优于多参数评分。该深度学习模型能有效区分CA与高血压、肥厚型心肌病、主动脉瓣狭窄及慢性肾病等其他肥厚型病变。相比AI多参数评分,深度学习模型以更高诊断准确率(AUC 0.93 vs. 0.88)对更多患者实现正确分类。两种AI方法均能精准识别不同人群的CA,其中深度学习模型表现更优。