Amazon planning job cuts next week after axing 14,000 due to AI: report4 months agohttps://nypost.com/2026/01/22/business/amazon-planning-thousands-of-job-cuts-nex...亚马逊计划下周启动第二轮裁员,预计波及约3万名企业员工。该公司曾在10月裁减1.4万个岗位,称人工智能是颠覆性技术。CEO安迪·贾西澄清裁员是因官僚主义问题,与财务或AI无关。受影响部门包括亚马逊云服务、零售业务、Prime视频及人力资源部门。由于AI提升效率,亚马逊企业员工规模预计将持续缩减。本轮裁员将占企业员工总数近10%,但仅占其158万总雇员的很小部分。10月被裁员工最迟需在下周一前完成内部转岗或外部再就业。
Google is ending full-web search for niche search engines4 months agohttps://programmablesearchengine.googleblog.com/可编程搜索引擎正在升级,为不同搜索需求提供更专注的解决方案。主要推出三大解决方案:通过搜索元件实现站内搜索、通过Google Vertex AI搜索满足企业级需求,以及针对广泛查询的全网搜索。过渡计划已制定,需使用全网搜索或查询超过50个域名的用户须在2027年1月1日前完成迁移。新增32种语言支持,提升全球用户的可访问性。自定义搜索站点限制JSON API将于2025年1月8日停用,建议改用Vertex AI搜索作为替代方案。Vertex AI搜索具备延迟优化、生成式AI功能和反向图片搜索等高级特性。旧版控制面板将于2023年6月21日退役,所有用户将迁移至更直观的新版控制面板。热门查询JavaScript API将于2022年11月11日下线,控制面板中提供替代选项。
AI Is a Horse (2024)4 months agohttps://kconner.com/2024/08/02/ai-is-a-horse.htmlAI被比作马匹——虽比步行快,但受地形限制。它比火车速度慢且可靠性低,但移动方式更灵活。AI需要消耗大量资源('食量惊人')。若无详细指令,无法独立完成如购物等任务。即使偶尔猜对答案,仍需持续引导。通常能保持正轨,但仍需监督。可被引导却不能被强迫行动('牵马到水边,不能强其饮')。高效的AI会对激励作出反应('见鞭影即驰骋')。人们对会交流或'说话'的AI仍存质疑。
What has Docker become?4 months agohttps://tuananh.net/2026/01/20/what-has-docker-become/尽管Docker公司彻底改变了容器化技术,却始终难以找到可持续的收入模式Docker Swarm在Kubernetes称霸编排领域后被出售Docker转型开发者工具领域,收购了Atomist(现Docker Scout)和AtomicJar(Testcontainers)随后Docker转向AI赛道,推出Docker Model Runner并与主流云服务商建立合作通过收购MCP Defender强化AI安全能力发布1000多个免费加固镜像与Chainguard竞争2025年管理层大换血,新任CEO上任引发收购传闻Docker的频繁转型折射出企业对可持续商业模式的探索Docker技术仍被广泛使用,但公司前景充满不确定性
Microsoft chief Satya Nadella warns AI boom could falter without wider adoption4 months agohttps://www.ft.com/content/2a29cbc9-7183-4f68-a1d2-bc88189672e6微软首席执行官萨蒂亚·纳德拉警告称,若无法实现更广泛的应用,人工智能热潮可能面临衰退。《金融时报》提供多种订阅方案,包括标准数字版、高级数字版及机构访问权限。新订阅用户可享受优惠折扣和试用选项。
Isometric NYC4 months agohttps://cannoneyed.com/projects/isometric-nyc作者启动了一个利用生成式AI模型创建纽约市等距像素艺术地图的项目。AI编程代理(如Claude Code、Gemini CLI和Cursor)被大量使用,减少了手动编码的需求。最初尝试使用CityGML数据,后改用Google Maps 3D tiles API以获得更好的一致性。初期使用Nano Banana Pro进行图像生成,但发现其不稳定且成本高昂,最终改为微调Qwen/Image-Edit模型。开发了'填充'策略,通过错开相邻瓦片确保无缝生成。创建了多个微工具来处理不同任务,如可视化瓦片、分类水域和生成训练数据。尽管有AI辅助,水域和树木等边缘情况仍需人工干预。扩展阶段使用Lambda AI实现更快、更便宜的模型推理,支持并行生成瓦片。自动化挑战凸显了当前AI在理解复杂算法和图像编辑方面的局限性。最终应用采用OpenSeaDragon展示生成的瓦片,但仍存在性能问题。关键收获:AI在减少重复劳动和开启新创意可能方面具有变革潜力,但当前图像模型仍缺乏可靠性和编辑能力。
Waypoint-1: Real-Time Interactive Video Diffusion from Overworld4 months agohttps://huggingface.co/blog/waypoint-1Waypoint-1是Overworld的实时交互式视频扩散模型,可通过文本、鼠标和键盘进行控制。该模型允许用户通过基于输入的帧生成来创建交互式世界。模型训练使用了10,000小时的带有控制输入和文本描述的游戏录像。与其他模型不同,Waypoint-1提供零延迟控制输入,支持自由摄像机移动和键盘操作。训练采用了扩散强制和自强制技术,以优化逐帧生成效果。WorldEngine是Overworld专为低延迟和交互性优化的高性能推理库。Waypoint-1-Small(2.3B参数)在5090显卡上实现4步30帧/秒或2步60帧/秒的性能。性能优化包括AdaLN特征缓存、静态滚动KV缓存、矩阵乘法融合及Torch Compile加速。World Engine黑客马拉松定于2026年1月20日举行,奖品为5090显卡。
Wilson Lin on FastRender: a browser built by parallel agents4 months agohttps://simonwillison.net/2026/Jan/23/fastrender/FastRender是一个完全由自主编码智能体群从头构建的网页浏览器该项目最初是Wilson Lin的个人副业项目,旨在探索Claude Opus 4.5、GPT-5.1和GPT-5.2等前沿模型在高峰期,FastRender曾同时运行约2000个智能体,每小时提交数千次代码该浏览器目前已能加载GitHub、维基百科和CNN等页面,但由于引擎尚在完善中暂不支持JavaScript项目采用树状结构协调智能体,由规划型智能体将任务分发给工作型智能体包括规范说明和视觉对比在内的反馈循环对自主智能体运作至关重要智能体选择了Skia和HarfBuzz等依赖项,有时会优先使用第三方库而非从头实现该系统允许间歇性小错误以维持高吞吐量,后续提交中会快速修复这些问题FastRender包含超过百万行Rust代码,仅用数周完成,是多智能体协同的研究范例
Open-source self-driving for 325 car models from 27 brands4 months agohttps://comma.aiComma Four是汽车的AI升级套件,提供车道居中、行车记录、自适应巡航、OTA升级、自动变道和360度全景视野等功能兼容丰田、现代、福特等27个品牌的325+款现有车型Openpilot系统可实现数小时无需驾驶员干预的自动驾驶支持车型包括:现代索纳塔(2020-23)、现代帕里斯帝(2020-22)、起亚极睿EV(2019-23)、雷克萨斯ES(2019-22)、丰田卡罗拉(2020-22)和丰田RAV4(2019-22)Comma AI已积累3亿英里行驶数据,拥有2万用户,GitHub仓库获5万星标公司正在招聘产品、自动驾驶系统和运营相关岗位
JSON-render: LLM-based JSON-to-UI tool4 months agohttps://json-render.dev/AI生成受预定义组件目录约束的JSON。用户输入提示,AI输出用于渲染UI组件的JSON。组件、操作和数据绑定在目录中定义。支持模型JSON流的渐进式渲染。导出为无运行时依赖的独立React代码。包含防护栏、数据绑定和命名操作等功能。
Nvidia releases 8B model with learned 8x KV cache compression4 months agohttps://huggingface.co/nvidia/Qwen3-8B-DMS-8xQwen3-8B-DMS-8x是基于Qwen3-8B的衍生模型,采用动态记忆稀疏化技术(DMS)实现推理期间8倍压缩通过优化KV缓存内存占用,显著提升长文本推理任务中的吞吐量与响应速度基于NVIDIA许可协议发布,仅限非商业研究及教育用途具备全球化部署能力与高级推理性能采用自回归Transformer架构,参数量达82亿需配合特定软件环境运行(transformers==4.57.3、torch、flash-attn等)在GPQA Diamond、MMLU-Pro、HumanEval等基准测试中展现竞争力包含伦理考量条款,倡导负责任AI开发
The Writers Came at Night4 months agohttps://www.metropolitanreview.org/p/the-writers-came-at-night三位作家——一位编剧、一位小说家和一位诗人——试图在纳帕谷绑架山姆·阿尔特曼,以阻止人工智能的扩散。他们的计划具有象征意义,旨在制造头条新闻而非真正成功,灵感来自历史上诸如卢德运动等徒劳的抗议行为。这个小团体争论着各自的动机:编剧害怕AI会让他的工作过时,而诗人则追求艺术传承。他们向ChatGPT咨询绑架建议,但AI以伦理准则为由拒绝提供帮助。AI辩称不会取代人类创造力,但作家们仍不信服,感到自己的技艺受到威胁。对话转向哲学层面,AI嘲笑着他们的恐惧,并宣称自己在效率和知识上的优越性。作家们意识到计划注定失败,破晓时分放弃行动,只能沉思在AI主导的未来中自己的位置。
OpenAI's GPT-5.2 model cites Grokipedia4 months agohttps://www.engadget.com/ai/report-reveals-that-openais-gpt-52-model-cites-groki...OpenAI的GPT-5.2模型在涉及伊朗和大屠杀等争议性话题时,引用了xAI旗下AI生成的百科全书Grokipedia作为信息来源。《卫报》发现GPT-5.2在关于伊朗政府和历史学家理查德·埃文斯的论述中使用了Grokipedia,但在特朗普遭遇媒体偏见等话题中未引用该来源。GPT-5.2于12月面向专业场景发布,但因引用曾采纳新纳粹论坛内容的Grokipedia而面临可信性质疑。OpenAI回应称GPT-5.2虽使用广泛网络信源,但会通过安全过滤器避免有害链接。
We posted a job. Then came the AI slop, impersonator and recruiter scam4 months agohttps://themarkup.org/hello-world/2026/01/24/fake-candidates-recruiter-scams-ai-...Andrew Losowsky分享了他在招聘工程师时遭遇大量AI生成虚假申请的经历。通过重复的联系方式、雷同的设计模式和可疑的领英资料,识别出了虚假简历和申请。许多申请者对问题的回答遵循几乎相同的模式,表明内容由AI生成。有些申请者甚至在答案中未加解释地直接标注'ChatGPT说'。诈骗者创建虚假邮箱地址并向求职者发送技术测试,要求提供财务信息。尽管面临挑战,最终招聘流程仍成功录用合适人选。该经历凸显了远程招聘中AI生成虚假申请这一日益严重的问题。
What If We Took Message-Passing Seriously?4 months agohttps://worksonmymachine.ai/p/what-if-we-took-message-passing-seriously作者回顾了其Ruby语言背景及受_why作品启发的编程文化,这种文化将代码视为创意表达媒介。探讨了Smalltalk语言和Alan Kay关于'对象即微型计算机'及对象间消息传递理念的影响。对比主流AI'智能体'实现方式,提出受Kay启发的自主计算环境构想——强调能解释消息的独立运行单元。引入'提示对象'概念,注重组合性、接口设计及语义晚期绑定(接收方在运行时解析消息)。作者开发了Ruby工具包'prompt_objects',借鉴Smalltalk实现可自我修改的对象系统与消息传递机制。指出大语言模型使运行时消息解释与协商成为可能,模糊了程序与执行的界限。文末重申对编程乐趣的信念,主张在新语境中重新探索经典理念的价值。
Some Thoughts on AI4 months agohttps://mattbruenig.com/2026/01/19/some-thoughts-on-ai/作者自称是一名社会主义左派人士,业余爱好编程。他以研究左翼经济政策和劳动法著称,包括运营人民政策项目和维护NLRB研究数据库。尽管左翼对AI/大语言模型持怀疑态度,但由于编程背景,作者对这项技术很感兴趣。他用AI自动化完成统计编程、法律研究和数据抓取等任务,极大提高了工作效率。AI帮助他创建了NLRB Edge通讯,并编写了关于NLRB判例法的法律参考书。作者区分了对AI的几种怀疑态度:对技术本身的怀疑、对其估值的怀疑以及对其分配效应的怀疑。他认为关于AI对劳动力和不平等影响的担忧是对资本主义的批判,而非对技术本身的批判。作者将AI视为强大工具,它使编程民主化并扩展个人能力,这让他想起早期使用开源软件的经历。
Everyone is wrong about AI and Software Engineering4 months agohttps://deadneurons.substack.com/p/everyone-is-wrong-about-ai-and-software在认知层面出现了一种反转现象:对AI了解较浅的观察者(如政客)反而比资深专家对现实有着更准确的认知模型。Hacker News评论者最初认为大语言模型无法胜任复杂软件开发工作,但Claude Opus 4.5和GPT-5.2等新模型在处理实际代码库方面展现出显著进步。2025年11月成为重要转折点,Gemini 3 Pro、Claude Opus 4.5和GPT-5.2等AI版本在SWE-bench基准测试和内部招聘考试中取得突破性进展。技术精英们早期对大语言模型的局限性判断正确,却在面对新证据时拒绝更新认知;而盲目相信AI营销的普通用户反而意外地接近了真相。AI公司关于自动化软件工程的论断存在谬误——他们将代码生成与软件工程真正的难点(需求规范、验证和领域建模)混为一谈。真正的变革在于技能价值的反转:语法和API知识重要性下降,而对分布式系统、一致性模型和领域特定需求的理解变得至关重要。专注于代码转换的初级岗位可能缩减,而强调需求规范和验证的高级岗位将获得更大杠杆效应。无论是怀疑者还是AI公司高管都需要调整立场:前者应承认AI的最新进展,后者需明白自动化代码生成并未解决软件工程的核心挑战。
Clawdbot Bought Me a Car4 months agohttps://aaronstuyvenberg.com/posts/clawd-bought-a-car由于经销商的操作手法和低信任度的谈判,2026年购车体验依然令人沮丧。使用具有长期运行流程的AI工具Clawdbot来处理购车流程,包括研究和谈判。作者选择了现代Palisade混动车型,并利用Clawdbot寻找最优价格并与经销商谈判。Clawdbot成功争取到4200美元的经销商折扣,将价格降至5.6万美元。这次经历展示了Clawdbot在购车之外自动化现实任务的潜力,比如管理邮件和设置定时任务。
Anyone Can Clone Your Voice Now4 months agohttps://huggingface.co/Qwen/Qwen3-TTS-12Hz-1.7B-CustomVoiceQwen3-TTS支持10种主要语言及多种方言,具备自适应音调、语速和情感表达控制功能。核心特性包括强大的语音表征能力、通用端到端架构、低延迟流式生成及智能文本理解。已发布模型包含VoiceDesign、CustomVoice和Base三大类,分别支持音色克隆、风格控制等特定功能。用户可通过ModelScope或Hugging Face平台下载模型,官方提供详细的手动下载指引。快速入门指南涵盖环境配置、Python包安装流程,以及不同模型功能的使用示例。针对定制音色、音色设计和音色克隆功能,文档提供带代码片段的详细使用示例。评估基准测试显示Qwen3-TTS在内容一致性、说话人相似度及多语言语音生成方面的表现。语音分词器基准测试对比了Qwen3-TTS与其他模型在ASR任务和语义相关语音分词的效果。技术报告引用信息已提供,方便学术论文引用Qwen3-TTS研究成果。
Trump Administration Plans to Write Regulations Using Artificial Intelligence4 months agohttps://www.propublica.org/article/trump-artificial-intelligence-google-gemini-t...特朗普政府计划利用人工智能起草联邦交通法规,旨在加速立法流程。交通部工作人员展示了使用Google Gemini等AI工具快速生成法规草案,声称可在数分钟内完成初稿。有人担忧AI的可靠性及关键安全法规可能出现错误的潜在风险。该倡议是政府将人工智能整合到联邦机构运营中的整体战略组成部分。批评者指出AI缺乏人类理性思维,可能导致法规缺陷并危及公共安全。部分交通部员工持怀疑态度,强调法规制定需要专业知识和监督机制。该计划反映出监管决策效率与质量之间的博弈关系。