This is how Apple’s big Siri shake-up happened, per reporta year agohttps://9to5mac.com/2025/04/10/this-is-how-apples-big-siri-shake-up-happened-per...苹果因Siri升级延迟经历重大内部动荡。苹果AI/ML团队(绰号'AIMLess')领导不力、文化松散,加剧了Siri的发展困境。苹果在WWDC上演示的Siri升级功能甚至没有可运行原型,连Siri团队都感到意外。历史上苹果只展示已具备发布条件的功能,此次Siri演示标志着这一传统的改变。苹果内部对Federighi领导的'智能系统'团队重振Siri持乐观态度。据报道,Federighi已允许Siri使用开源第三方模型,打破了此前仅用内部技术的政策。
DolphinGemma: How Google AI is helping decode dolphin communicationa year agohttps://blog.google/technology/ai/dolphingemma/谷歌与乔治亚理工学院及野生海豚项目(WDP)合作开发DolphinGemma人工智能模型,旨在破译海豚的交流方式。自1985年以来,WDP持续研究巴哈马海域的野生大西洋斑点海豚,积累了海豚声音与行为配对的丰富数据集。DolphinGemma运用谷歌音频技术分析并生成类海豚声音序列,帮助识别海豚交流中的模式规律。与乔治亚理工学院共同开发的CHAT系统,试图通过合成哨音和实时互动建立与海豚的共享词汇体系。谷歌Pixel手机被用于实地分析海豚声音,减少对定制硬件的依赖并提升研究效率。DolphinGemma将作为开放模型共享,助力研究其他鲸类物种的科研人员,推动海洋生物交流研究的国际合作。
I Tested the AI That Calls Your Elderly Parents If You Can't Be Bothereda year agohttps://www.404media.co/i-tested-the-ai-that-calls-your-elderly-parents-if-you-c...一家人工智能初创公司提供了一项名为inTouch的服务,可以代表子女给年迈的父母打电话。该服务使用AI生成的语音与父母交谈,了解他们的日常生活、爱好和感受。通话结束后,AI会生成一份摘要发送给子女,其中包括父母的情绪状态(例如“情绪低落”或“情绪平稳”)。这一概念被批评为反乌托邦且缺乏人情味,但创始人辩称它有助于保持联系并确保安全。
GPT-4.1 now available in GitHub Copilot and GitHub Modelsa year agohttps://github.blog/changelog/2025-04-14-openai-gpt-4-1-now-available-in-public-...OpenAI的GPT-4.1现已登陆GitHub Copilot和GitHub Models平台,在代码编写、指令遵循和长上下文理解方面提供更优性能GPT-4.1具备更大的上下文窗口,知识截取更新至2024年6月,专为开发者实际应用场景优化该模型面向所有Copilot用户开放(包括免费版),可通过Visual Studio Code的模型选择器或GitHub.com聊天界面调用企业版管理员需在Copilot设置中启用新策略方可访问GPT-4.1功能GitHub Models用户可在playground中体验GPT-4.1,同时还能测试Cohere、DeepSeek、Meta和微软等公司的其他模型Meta最新AI模型Llama-4-Scout-17B和Llama-4-Maverick-17B已上线GitHub Models,擅长摘要生成、逻辑推理、对话交互及图像分析等任务GitHub Codespaces推出Agentic AI功能,用户可直接从issue一键开启带Copilot代理模式的VSCode开发环境,实现高效代码实施
Understanding Aggregate Trends for Apple Intelligence Using Differential Privacya year agohttps://machinelearning.apple.com/research/differential-privacy-aggregate-trends苹果将隐私视为基本人权,采用差分隐私等技术保护用户数据差分隐私技术让苹果能分析产品使用趋势,而无需获取个体用户数据Apple Intelligence不会使用个人数据或用户交互来训练基础模型Genmoji的改进运用差分隐私识别热门提示词,同时保护与个人关联的独特/罕见提示词通过合成数据优化文本生成功能(如摘要),无需收集真实用户邮件或消息苹果仅使用聚合洞察数据,绝不访问单个设备数据或IP地址,确保隐私安全即将发布的版本会将差分隐私扩展到Image Playground、Image Wand、回忆创建和写作工具等功能合成数据生成能模拟真实用户数据趋势,但不包含实际内容,助力模型优化苹果持续致力于发展人工智能和机器学习领域的隐私保护技术
Apple's plan to train AI on your emailsa year agohttps://www.neowin.net/news/apple-wants-to-train-ai-on-your-emails-in-a-way-that...苹果正调整其AI战略,转为直接在设备端分析用户数据,延续其隐私优先的一贯主张公司将采用真实数据片段(如邮件)结合合成数据来优化AI模型由于过度依赖效果较差的合成数据,苹果AI平台Apple Intelligence已落后于竞争对手内部测试暴露出Siri、写作工具和摘要功能存在问题,促使管理层调整并推迟发布计划iOS 18.5、iPadOS 18.5和macOS 15.5系统更新将通过校准合成数据与真实用户交互来提升AI表现Image Playground图像创作、Memories回忆相册和Genmoji拟我表情等功能都将受益于改进后的数据策略Genmoji采用差分隐私技术识别趋势,同时保护用户个体行为数据不被暴露功能增强需要用户主动启用设备分析及产品改进设置选项
Firefox starts testing "Link Previews"a year agohttps://connect.mozilla.org:443/t5/discussions/try-out-link-previews-in-firefox-...Firefox实验室推出了一项名为'链接预览'的全新实验性功能。链接预览可在打开链接前显示内容快照,包括图片、网页标题和AI生成的关键信息摘要。AI在设备本地运行,通过不分享或存储浏览数据来优先保障用户隐私。目前已在Firefox Beta 138、Nightly 138和Nightly 139版本中提供。欢迎用户就用户体验、内容质量和工作流程改进等方面提供反馈意见。
The Industrialization of ITa year agohttps://benn.substack.com/p/the-industrialization-of-it旧金山初级软件工程师年薪约19万美元,包含福利在内的综合用人成本约为25万美元编程能力最强的AI模型Gemini 2.5 Pro定价为:每百万输入token 1.25美元,每百万输出token 10美元,在大规模任务中比雇佣工程师成本低得多目前单个工程师的生产力仍可能超过AI模型,但AI技术正在快速进步,未来将更具成本效益和能力优势AI模型能快速生成海量代码,但可能存在错误、缺乏战略方向性,并面临安全隐患未来AI技术可实现每秒处理数百万次指令,若代码库针对机器并行优化,其生产力将远超人类软件开发可能进入工业化时代,AI代理将取代人类工程师完成多数任务,实现更廉价快速的生产大规模运行AI模型的环境成本日益凸显,应纳入AI应用的综合考量
Nvidia's Mar-a-Lago Dinner Looks Like a Raw Deal for US AIa year agohttps://www.bloomberg.com/opinion/articles/2025-04-14/could-nvidia-ceo-s-mar-a-l...英伟达CEO黄仁勋在Mar-a-Lago庄园与特朗普共进晚餐晚宴后白宫暂停了对英伟达H20芯片在华销售的限制计划H20是英伟达目前能合法向中国出售的最先进AI芯片中国科技企业2025年初豪掷160亿美元囤积H20芯片以应对预期中的更严出口管制此举可能削弱美欧限制中国AI技术发展的努力
Cohere Launches Embed 4a year agohttps://cohere.com/blog/embed-4Embed 4:面向企业的多模态搜索解决方案Embed 4 提供业界领先的数据检索精度与效率赋能企业安全获取多模态数据以开发AI应用致力于构建具有自主能力的AI应用系统
OpenAI is building a social networka year agohttps://www.theverge.com/openai/648130/openai-social-network-x-competitorOpenAI正在开发一款类似X的社交网络,目前处于早期阶段,已有内部原型。该原型聚焦ChatGPT的图像生成功能,并包含社交信息流。CEO萨姆·奥尔特曼已就该项目寻求私人反馈,但尚不清楚会开发独立应用还是整合进ChatGPT。推出社交网络可能加剧OpenAI与埃隆·马斯克及Meta的竞争。社交应用将为OpenAI提供训练AI模型所需的实时数据,类似X和Meta的做法。该原型背后的理念之一是借助AI帮助用户分享更优质的内容。OpenAI的社交媒体项目反映了公司在高增长预期下的扩张计划。
Silicon Valley crosswalk buttons hacked to imitate Musk, Zuckerberg's voicesa year agohttps://techcrunch.com/2025/04/14/silicon-valley-crosswalk-buttons-hacked-to-imi...硅谷的语音提示交通信号灯按钮遭黑客入侵,开始播放人工智能生成的马克·扎克伯格和埃隆·马斯克语音被黑的过街按钮播放着模仿这两位亿万富翁讲话风格的幽默而怪异的语音信息门洛帕克、帕洛阿尔托和红木城等多个城市受到影响,相关部门已展开调查怀疑可能是黑客行动主义行为,但作案者及动机尚不明确语音提示过街按钮本为视障人士设计,但因默认密码问题存在被篡改风险安全研究员Deviant Ollam曾多次演示此类设备的入侵方法设备制造商Polara公司未就此事予以置评
How to Build an Agenta year agohttps://ampcode.com/how-to-build-an-agent构建一个代码编辑代理比想象中更简单,只需要一个大语言模型(LLM)、一个循环和令牌即可文章演示了如何使用Anthropic API在不到400行Go代码中创建一个代理关键组件包括设置Go项目、初始化代理、以及实现与Claude的聊天循环通过`read_file`、`list_files`和`edit_file`等工具,代理能够与文件系统进行交互该代理可以根据用户提示读取、列出和编辑文件,展示其自主完成任务的能力该实现突显了当前大语言模型仅需少量代码就能理解并执行复杂指令的强大能力
TeapotLLM- an open-source <1B model for hallucination-resistant Q&A on a CPUa year agohttps://huggingface.co/teapotai/teapotllmTeapot是一个开源的小型语言模型(约8亿参数),专为智能手机和CPU等资源受限设备优化。该模型基于合成数据进行微调以减少幻觉生成,并专注于提供基于上下文的回答。Teapot支持问答系统(QnA)、检索增强生成(RAG)和JSON提取等任务。模型经过训练可提供对话式回答,并通过在缺乏足够上下文时拒绝回答来避免幻觉。Teapot能跨多文档执行RAG,并以JSON等格式提取结构化信息。内置teapotai库便于生产环境集成。该模型基于flan-t5-large微调,训练数据集为约10MB的合成数据。采用MIT开源协议,社区驱动开发,可通过Discord获取支持。
OpenAI is reportedly in talks to buy Codeium for $3Ba year agohttps://techcrunch.com/2025/04/16/openai-is-reportedly-in-talks-to-buy-codeium-f...Codeium公司(AI编程助手Windsurf的开发商)正与OpenAI洽谈以30亿美元价格被收购该收购可能使OpenAI与Cursor等AI编程助手提供商形成竞争,而Cursor此前曾获OpenAI投资这笔交易可能危及OpenAI创业基金(Cursor的主要投资方)的公信力Windsurf用户近期在公告前被提供了10美元/月的订阅锁定优惠OpenAI首席产品官在近期视频中称赞了Windsurf的产品能力Codeium此前寻求融资时的估值为28.5亿美元,年经常性收入4000万美元,低于Cursor的2亿美元据传Cursor正在融资谈判中寻求100亿美元估值Codeium由Varun Mohan和Douglas Chen于2021年创立,目前已融资2.43亿美元
Microsoft researchers developed a hyper-efficient AI model that can run on CPUsa year agohttps://techcrunch.com/2025/04/16/microsoft-researchers-say-theyve-developed-a-h...微软研究人员开发了BitNet b1.58 2B4T,这是迄今为止规模最大的1位AI模型。BitNet b1.58 2B4T采用MIT开源协议,可在包括苹果M2在内的CPU上运行。BitNet将权重量化为三值(-1、0、1),显著提升内存和计算效率。该模型具有20亿参数,训练数据达4万亿token(约合3300万本书籍)。在基准测试中,其性能超越同规模模型(如Meta的Llama 3.2 1B、谷歌的Gemma 3 1B和阿里的Qwen 2.5 1.5B)。相比同类模型,BitNet b1.58 2B4T运行速度更快且内存占用更低。需配合微软定制框架bitnet.cpp使用,当前版本暂不支持GPU加速。BitNet在资源受限设备中潜力显著,但存在生态兼容性挑战。
Modular Community Edition, MAX and Mojo are free forever for commercial usea year agohttps://www.modular.com/pricingModular为开发者提供免费的社区版,包含MAX和Mojo用于AI模型部署MAX是面向大语言模型及其他AI模型的高性能推理框架Mojo是一种类Python语言,可在无需CUDA的情况下实现CPU/GPU高速执行社区版允许无限非商业用途及特定条件下的商业用途企业版提供可扩展的生产级AI推理服务及专属技术支持社区版对NVIDIA GPU支持无限制,其他厂商GPU最多支持8块Modular承诺即使公司停止运营仍保障永久许可权利企业版功能包括多云支持、高级优化及按GPU数量计费BYOC企业版为大规模部署提供全托管推理平台
Microsoft Copilot can now 'see' what's on your screen in Edgea year agohttps://www.theverge.com/news/650259/microsoft-copilot-can-now-see-whats-on-your...Copilot Vision是微软的AI助手功能,现已在Edge浏览器中免费开放使用。该功能允许用户通过语音与Copilot交互并接收回复。Copilot Vision能‘看到’屏幕内容,可辅助完成如跟做菜谱或准备面试等任务。该功能会高亮显示屏幕局部区域,但不会点击链接或执行操作。更全面的系统级Copilot Vision功能仍仅限于Copilot Pro订阅用户。使用Copilot Vision需通过Edge浏览器访问微软官网手动启用。部分用户在激活功能时可能会遇到延迟或问题。微软会记录Copilot的回复内容,但不会收集用户输入、图像或会话期间的页面内容。
I got rid of SMS loan spammers. (or "how I accidentally wrote sci-fi copypasta"a year agohttps://medium.com/@scott.vr/silisalification-22d095e2346a作者分享了对短信贷款垃圾信息的一种幽默且富有创意的回应,将其改编成了网络流行梗。回应内容虚构了一个仿真情趣娃娃制造企业,融入了人工智能与尖端科技元素。叙述中包含将人脑复制到硅基载体上的突破性设想,以幽默方式探讨伦理与法律挑战。作者认为通过这种方式与垃圾信息发送者互动,可能会让这个市场难以维系从而减少骚扰。故事最终以向垃圾信息发送者提出虚构商业合作提案收尾,完美融合了幽默与讽刺手法。
Russian Propaganda Campaign Targets France with AI-Fabricated Scandalsa year agohttps://www.newsguardtech.com/special-reports/russian-propaganda-campaign-target...俄罗斯宣传行动'风暴-1516'用虚假叙事锁定法国为目标该行动由前佛罗里达州副警长、现克里姆林宫AI宣传员约翰·马克·杜根主导2024年12月至2025年3月期间散布五项虚假叙事,在38,877条帖文中获得5580万次浏览此前四个月仅出现一项针对法国的叙事,传播量显著较低(84.5万次浏览)生成式AI聊天机器人被发现重复这些虚假主张,构成新型虚假信息威胁