Marble: A Multimodal World Model6 months agohttps://www.worldlabs.ai/blog/marble-world-modelMarble多模态世界模型现已向所有人开放使用Marble支持通过文本、图像、视频或3D布局生成3D世界新增交互式编辑、场景扩展与多世界融合功能导出选项包含高斯溅射点云、网格模型及视频格式Marble Labs作为艺术家与工程师的创意中心正式启动推出Chisel高级工具实现精细化3D雕刻与场景布局控制支持通过扩展或组合现有世界构建更大规模环境Marble提供适用于多行业的高保真导出方案未来将重点发展交互功能以增强空间智能应用场景
CollectWise (YC F24) Is Hiring6 months agohttps://www.ycombinator.com/companies/collectwise/jobs/tv3ufcc-forward-deployed-...CollectWise是一家由Y Combinator支持的初创公司,利用生成式AI技术在美国350亿美元规模的债务催收市场实现自动化其AI催收员的表现是人工催收员的2倍,而成本仅为极小部分这家三人团队的公司已实现100万美元年化营收,并计划在明年达到1000万美元规模公司正在招聘一名前线部署工程师,负责主导客户实施项目,在工程与运营的交叉领域开展工作该职位需要将业务需求转化为稳健的系统,并与创始人及客户保持紧密合作CollectWise通过AI与法律流程的整合提升债务回收率,在降低成本的同时维护品牌形象
VibeThinker-1.5B6 months agohttps://github.com/WeiboAI/VibeThinkerVibeThinker-1.5B是一个拥有15亿参数的稠密模型,挑战了小模型缺乏强大推理能力的传统认知。采用创新的'频谱到信号原则(SSP)'后训练方法。性能超越闭源模型如Magistral Medium和Claude Opus 4,并匹敌开源模型GPT OSS-20B Medium。在数学基准测试AIME24、AIME25和HMMT25上超越参数量400倍的DeepSeek R1模型。超高效:仅用15亿参数就在数学和编程任务中达到最先进性能。创新方法包括'两阶段多样性探索蒸馏'和'最大熵引导策略优化(MGPO)'。成本效益高:后训练仅花费7800美元,而竞争对手需29.4万至53.5万美元。模型权重和技术报告已开源,可在Hugging Face和ModelScope平台获取。推荐使用特定参数设置解决竞赛类数学和编程问题。附赠transformers库的模型调用代码片段。
Show HN: ChatExport Structurer – parse ChatGPT/Claude exports into queryable SQL6 months agohttps://github.com/1ch1n/chat-export-structurer人工智能的下一纪元将属于那些最擅长管理和保持上下文的人该工具可将混乱的AI聊天记录导出转换为结构化SQLite存档,实现更优数据管理核心特性包括本地优先存储、全文检索、去重机制及多平台支持(ChatGPT/Claude/Grok)工具已具备生产环境可用性,包含大文件流式解析器与安全测试的预览模式仅需Python 3.8+即可简单部署,并提供测试用示例数据库支持高级SQL查询和跨所有对话的全文搜索未来计划推出完整平台MyChatArchive,包含网页界面、向量搜索、AI摘要和增强导出功能开源免费,模块化架构便于扩展新平台支持欢迎社区贡献新解析器与功能改进
SIMA 2: An Agent That Plays, Reasons, and Learns with You in Virtual 3D Worlds6 months agohttps://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-...SIMA 2是构建通用实用AI智能体的下一里程碑,通过整合Gemini模型实现高级能力与仅能执行指令的初代SIMA不同,SIMA 2具备目标思考、用户对话及持续自我进化的能力SIMA 2展现出卓越的泛化能力,既能理解复杂指令,又能将学习概念迁移至不同游戏场景与Genie 3结合使用时,SIMA 2在新生成的3D世界中表现出前所未有的环境适应力SIMA 2可通过试错机制和Gemini反馈实现自我提升,无需人类数据即可在新环境中学习研究揭示了三大挑战:长周期任务规划、记忆容量限制及动作执行的精确性控制SIMA 2的核心技术为机器人领域提供基础构建模块,助力物理世界AI助手的发展谷歌DeepMind正与学术机构及游戏开发商开展SIMA 2的有限研究预览,以确保技术负责任发展
Cursor: Past, Present, and Future6 months agohttps://cursor.com/blog/series-dCursor致力于打造一款革命性的代码编辑器,以实用、愉悦和趣味为核心价值。其愿景包括实现无缺陷编程、即时获取代码库解答以及简化编码界面等功能。Cursor已完成D轮融资,以293亿美元估值筹集23亿美元资金。投资方包括Accel、Thrive、Andreessen Horowitz、DST、Coatue、英伟达和谷歌等机构。团队规模已超300人,并实现10亿美元年化营收目标。Cursor自主研发的模型代码生成量超过全球大多数大语言模型。本轮融资将加速未来创新技术的研发进程。
Firefox suggests tab groups with local AI6 months agohttps://blog.mozilla.org/en/firefox/ai-tab-groups/Firefox于2025年初推出标签页分组功能,回应了Mozilla Connect平台上用户呼声最高的需求。AI标签分组功能可自动建议分组名称并推荐待添加标签页,所有操作均在本地完成,无需向Mozilla发送用户数据。标题建议采用混合算法:结合TF-IDF与关键词提取技术,并通过微调的T5模型进行优化。训练数据通过用户画像和OpenAI GPT-4生成,并辅以Common Crawl抓取的真实网页标题进行补充。通过知识蒸馏和量化技术,模型体积从1GB压缩至57MB,同时保持预测准确率。标签推荐基于语义相似度实现,采用MiniLM嵌入向量和逻辑回归模型以提升性能表现。性能优化使拥有数千标签页的用户处理时间缩短33%。未来可能引入时间维度特征或微调嵌入模型,以进一步提升分组准确率。
Cursor Raises Funds at $29.3B Valuation6 months agohttps://www.bloomberg.com/news/articles/2025-11-13/ai-startup-cursor-raises-fund...AI编程初创公司Cursor完成23亿美元融资本轮融资使Cursor估值达293亿美元,数月内增长两倍Accel和Coatue共同领投,Thrive Capital、DST Global、谷歌及英伟达跟投《华尔街日报》此前曾报道本轮融资细节
Agentic Windows6 months agohttps://mikestone.me/2025-11-11-agentic-windows微软Windows正在演变为'智能代理操作系统',通过整合设备、云服务和AI技术提升生产力。作者批评微软的发展方向,指出隐私问题和类似Recall等不受欢迎的功能。新版Windows离线体验可能欠佳,且可能充斥广告和冗余功能。微软强推AI可能导致用户转向Linux或苹果等替代系统。Zorin OS曾借势Windows 10终止支持的时机,为部分用户提供了可行替代方案。作者认为微软的策略可能适得其反,或将用户推离Windows平台。
Copyright Winter Is Coming (To Wikipedia?)6 months agohttps://authorsalliance.substack.com/p/copyright-winter-is-coming-to-wikipedia法官西德尼·斯坦驳回了OpenAI要求驳回关于ChatGPT输出内容侵犯版权的动议,这些内容涉及对乔治·R·R·马丁等作家作品的摘要。该裁决表明,除非受到合理使用原则保护,否则对虚构作品的摘要可能构成侵权,这对思想与表达二分法提出了挑战。将ChatGPT与维基百科对《权力的游戏》的摘要进行比较,显示两者在结构上存在差异,但内容覆盖相似。这一裁决引发了对衍生作品、维基百科条目以及其他虚构作品摘要或分析可能产生影响的担忧。斯坦法官的意见为实质性相似设定了较低门槛,这一标准可能对版权法产生超越AI生成内容的影响。
Why Fei-Fei Li and Yann LeCun Are Both Betting on "World Models"6 months agohttps://entropytown.com/articles/2025-11-13-world-model-lecun-feifei-li/李飞飞团队World Labs推出Marble多模态世界模型,可通过文本/图像/视频生成可编辑3D场景传闻Yann LeCun将离开Meta创业,新公司专注世界模型技术,强调自主智能体的内部状态预测DeepMind的Genie 3被定义为世界模型,作为实时视频生成引擎用于AI训练环境构建Marble采用高斯泼溅技术生成3D资产,LeCun方案则侧重认知层面的潜在状态预测世界模型当前呈现三大方向:界面型(Marble)、模拟器型(Genie 3)、认知型(LeCun的JEPA架构)各项目对'世界模型'术语的差异化使用,正引发AI领域对该概念定义的困惑
Mozilla Adding New 'AI Window' Feature to Its Firefox6 months agohttps://connect.mozilla.org/t5/discussions/building-ai-the-firefox-way-shaping-w...Mozilla宣布在Firefox中新增AI功能,强调用户选择与开放性原则。用户强烈反对集成AI,更关注隐私保护与性能优化。Mozilla计划提供AI功能控制选项,但多数用户要求设置统一的一键关闭开关。批评意见包括对隐藏设置、资源浪费及盲目跟风而非创新的担忧。部分用户表示若AI功能无法彻底禁用,将考虑更换浏览器。
I think nobody wants AI in Firefox, Mozilla6 months agohttps://manualdousuario.net/en/mozilla-firefox-window-ai/Mozilla正在为Firefox开发一款名为'Window AI'的内置AI助手,这将成为继常规标签页和隐私标签页之后的第三种浏览模式。该功能为可选加入,Mozilla强调用户控制权,目前设有早期测试等候名单。在Mozilla论坛讨论中,全部52条回复都反对将AI集成到Firefox中,表达了强烈抵制态度。Mozilla试图将Firefox定位为拒绝AI功能与需要AI功能的用户之间的折中选择,提供使用灵活性。对Firefox集成AI不满的用户可以转向无AI的分支版本,如LibreWolf、Waterfox或Zen Browser。
RetailReady (YC W24) Is Hiring6 months agohttps://www.ycombinator.com/companies/retailready/jobs/kGHAith-support-engineerRetailReady(YC W24届)是一个由人工智能驱动的供应链合规引擎已完成330万美元种子轮融资,并签约超过15家企业客户自动化处理品牌商、仓库和零售商之间的合规要求通过EDI、API和平面文件与仓库运营系统集成正在招聘支持工程师,负责故障排除和扩展支持业务该职位需在旧金山现场办公,工作时间较早(凌晨5点至下午2点)专注于用人工智能和自动化解决供应链问题利用摄像头视觉技术减少仓库发货错误致力于成为仓库机器人技术与自动化领域的操作系统
AI World Clocks6 months agohttps://clocks.brianmoore.com/AI世界时钟每分钟展示一个由九种不同AI模型生成的新时钟每个AI模型根据特定提示,在2000个token的限制内创建自己的时钟提示要求AI生成带有白色背景、响应式设计和动画秒针的模拟时钟HTML/CSS代码该项目由布莱恩·摩尔创作,他在Instagram上也很活跃AI世界时钟的灵感来自马修·雷菲尔德
Houston, We Have a Problem: Anthropic Rides an Artificial Wave – BIML6 months agohttps://berryvilleiml.com/2025/11/14/houston-we-have-a-problem-anthropic-rides-a...Anthropic声称挫败了一起由AI策划的网络间谍活动,但其说法因缺乏证据而受到质疑同时具备网络安全和AI/ML专业知识的专家十分罕见,这导致难以准确评估相关主张媒体未能对所述攻击中AI的必要性提出关键性质疑现有的开源攻击框架足以解释这些攻击,无需归因于先进AI技术Anthropic对大型语言模型拟人化的描述夸大了其实际能力文章批评Anthropic的主张缺乏具体证据和第三方验证历史背景表明,90年代的脚本小子就能实现无需人工干预的大规模攻击机器学习安全固然重要,但必须基于现实基础
Has Google solved two of AI's oldest problems?6 months agohttps://generativehistory.substack.com/p/has-google-quietly-solved-two-of谷歌正在AI Studio中测试一个神秘的新AI模型,展现出近乎完美的手写识别能力和自发性抽象推理迹象。据推测可能是Gemini-3的该模型,仅凭简单提示就能生成可运行的操作系统克隆体、3D设计软件等复杂产物。该AI展示了专业级历史手写文献转录能力,包括对微妙语境的理解和符号推理能力。一项18世纪商人账册测试中,模型能自主推断并修正模糊的历史计量单位,完成未经提示的复杂换算。这表明大语言模型正在涌现推理能力,模糊了模式识别与真正理解之间的界限。其意义远超文字转录,暗示AI有望实现对历史文化背景的解读与推理。该模型的表现挑战了传统AI局限性认知,表明规模扩展与多模态融合可能催生抽象推理能力。
AI, the Firefox Way6 months agohttps://blog.mozilla.org/en/firefox/ai-window/Firefox正以用户选择和开放精神为指导原则推进AI技术发展Firefox确保用户不会被锁定在单一生态系统或强制使用AI新功能包括侧边栏AI聊天机器人及iOS端的「摇一摇总结」功能Firefox正在开发「AI窗口」——用户可控的浏览辅助智能空间用户可自主启用AI窗口,不满意时可随时关闭Firefox邀请用户加入AI窗口候补名单并提供使用反馈Firefox专注打造最佳浏览器,尊重用户对AI的多样化需求Firefox的AI功能旨在提升浏览体验,同时保障用户控制权Firefox在AI开发中强调透明度、问责制和对用户自主权的尊重Firefox将AI视为值得信赖的浏览助手,引导用户探索更广阔网络Firefox通过开源项目和Mozilla Connect鼓励社区参与塑造AI在网络中的角色
Ollama 0.12.11 Brings Vulkan Acceleration6 months agohttps://www.phoronix.com/news/ollama-0.12.11-Vulkanollama 0.12.11版本新增了对Vulkan API的支持,作为AMD ROCm和NVIDIA CUDA加速的替代方案。Vulkan支持对开源驱动、不支持ROCm的老款AMD显卡以及使用RADV驱动的系统尤为有利。测试显示,在某些情况下Vulkan性能可超越ROCm,Llama.cpp的测试结果印证了这一点。该版本还新增了Logprobs的API支持,并在新版应用中加入了WebP图像格式支持。改进了渲染性能,并在调度模型时优先选择独立显卡而非集成显卡。本次更新还包含多项其他问题修复和功能增强。
Samsung's 60% DRAM Price Hike Signals a New Phase of Global Memory Tightening6 months agohttps://www.buysellram.com/blog/samsungs-memory-price-surge-sends-shockwaves-thr...三星因AI需求将内存芯片价格上调最高60%32GB DDR5内存模块价格两个月内从149美元涨至239美元AI数据中心正冲击全球DRAM供应链三星、SK海力士和美光优先生产高端AI服务器芯片,削减传统DRAM产能零售市场DDR5价格同比翻倍,DDR4上涨20-30%分析师预测DRAM供应紧张将延续至2026年二手DRAM二级市场价格攀升,与新模块价差缩小采购方需制定战略计划应对交货期延长和库存缓冲不足AI热潮使DRAM从大宗商品转变为算力战略瓶颈