GitHub - MoonshotAI/kimi-cli: Kimi Code CLI is your next CLI agent.4 months agohttps://github.com/MoonshotAI/kimi-cliKimi Code CLI 是一个用于终端操作和软件开发任务的AI助手。功能包括代码读取/编辑、执行Shell命令以及网页抓取。支持代理客户端协议(ACP),可与兼容的编辑器/IDE集成。可通过zsh-kimi-cli插件与Zsh配合使用,获得增强的Shell体验。支持模型上下文协议(MCP)工具,用于管理MCP服务器。开发设置涉及克隆代码库并使用make命令执行任务。欢迎贡献代码,相关指南详见CONTRIBUTING.md文件。
The Five Levels: From Spicy Autocomplete to the Software Factory4 months agohttps://www.danshapiro.com/blog/2026/01/the-five-levels-from-spicy-autocomplete-...技术性通缩正在降低编程成本,促使技术债务偿还策略发生转变AI辅助编程的五个自动化层级与美国NHTSA驾驶自动化分级标准遥相呼应第0级:人工编程为主,仅接受最低限度AI辅助,类似传统人工驾驶第1级:AI处理离散任务,如编写单元测试或添加文档字符串第2级:AI与开发者结对编程,处理常规任务,显著提升生产力第3级:开发者转型为管理者角色,主要审核AI生成的代码第4级:开发者成为项目经理,专注需求与排期,编程工作完全交由AI第5级:完全自主的软件创造,仅需极少量人工干预小型团队正在探索第5级自动化,预示着编程的未来形态
Trinity large: An open 400B sparse MoE model4 months agohttps://www.arcee.ai/blog/trinity-largeArcee推出Trinity Mini,这是一款在美国端到端训练的紧凑型MoE模型,提供开放权重、强大推理能力,并为开发者提供完全控制权。Trinity Large是一个4000亿参数的稀疏MoE模型,每个token激活130亿参数,采用256个专家网络,每个token激活4个专家。Trinity-Large发布三个版本:Preview(轻量后训练即支持对话)、Base(最佳预训练检查点)、TrueBase(未包含指令数据的早期检查点)。Trinity-Large-Base在数学、编程、科学推理和知识吸收等基准测试中表现优于同类型开源基础模型。该模型在2048块NVIDIA B300 GPU上完成预训练仅耗时33天,创下同规模模型训练速度纪录。训练数据集包含DatologyAI精选的17万亿token,其中合成数据超8万亿token,覆盖网页、代码、数学、推理和多语言领域。Trinity-Large-Preview在创意写作、故事叙述、角色扮演、聊天场景和实时语音辅助方面表现优异,预览期间可通过OpenRouter免费使用。Trinity-Large-TrueBase提供纯净预训练检查点(不含指令数据),是研究高质量预训练的理想选择。整个项目耗资2000万美元,仅为前沿实验室典型成本的零头。Trinity Large原生支持512k上下文长度,预览版API运行于128k上下文并采用8位量化技术。
The new era of browsing: Putting Gemini to work in Chrome4 months agohttps://blog.google/products-and-platforms/products/chrome/gemini-3-auto-browse/Gemini in Chrome通过侧边栏体验为多任务处理引入新AI功能Nano Banana支持在Chrome内直接转换图像,无需下载或重新上传Connected Apps与Gmail、日历、YouTube等集成,实现高效工作流即将推出的Chrome个人智能功能可提供情境感知的个性化辅助Auto browse 2帮助完成复杂任务(如旅行规划、表单填写和购物)谷歌通用商务协议(UCP)支持Chrome内无缝智能体商务为自动浏览操作增强安全措施和用户控制权
AI Is Not Inevitable4 months agohttps://dustin.boston/ai-is-not-inevitable/雅克·埃吕尔提出的'技术'概念,是指将人类活动简化为实现既定目标的高效手段,这一现象在现代社会占据主导地位。埃吕尔认为技术具有不可避免的吞噬性,这与强调工艺精神的工艺美术运动形成鲜明对比。安德鲁·芬伯格持乐观态度,认为通过注入人文价值可以实现技术民主化,这与埃吕尔的技术决定论截然不同。历史案例:19世纪工厂效率至上的模式,最终通过工会运动和童工法、安全标准等立法得到制衡。芬伯格提出三种对抗'技术异化'的路径:重新定义效率、颠覆性合理化、以及整合初级与次级工具化。重新定义效率:唐纳德·克努特提出的文学化编程将人类理解置于速度之上,芬伯格认为这种模式可应用于人工智能领域。颠覆性合理化案例:法国用户将行政效率工具Minitel改造为社交平台,展现了创造性误用技术的可能性。初级与次级工具化:芬伯格主张将社会、美学和伦理维度融入技术设计,以此突破'技术逻辑'的桎梏。单纯怀旧或倡导'软件工艺运动'并不够,将人文价值嵌入技术内核才是塑造未来的关键所在。
How to turn 'sfo-jfk' into a suitable photo4 months agohttps://www.approachwithalacrity.com/how-to-turn-sfo-jfk-into-a-beautiful-photo/文章探讨了如何将类似'sfo-jfk'这样的自由格式查询转化为AI旅行规划应用中的精美图片。解决方案结合了LLM理解查询、传统软件工程以及人工照片筛选。问题被分解为三个部分:将查询转化为'地点'、构建地点到图片的数据库、创建获取正确图片的系统。'地点'被定义为包含名称和类型(城市/地区/国家),LLM负责将查询映射到这些地点。照片素材来自Unsplash,通过人工筛选确保质量。对于数据库中不存在的地点,使用地理位置服务寻找最近的已映射位置。系统存在一些缺陷,例如小众目的地覆盖不足和照片选择的主观性。该项目凸显了结合AI、软件工程和人工筛选对获得雅致结果的重要性。
Tesla profit tanked 46% in 20254 months agohttps://techcrunch.com/2026/01/28/tesla-earnings-profit-q4-2025/特斯拉2025年利润同比下滑46%首席执行官埃隆·马斯克加入特朗普政府任职,联邦电动汽车补贴被国会取消,影响了销量特斯拉2025年净利润报38亿美元,创近年新低,汽车销售收入同比下降11%公司2025年全球交付量163万辆,连续第二年出现销量下滑特斯拉业绩超华尔街预期,盘后股价应声上涨公司战略重心正从硬件转向人工智能,向马斯克的xAI初创企业投资20亿美元太阳能和储能业务收入增长25%,服务收入(含FSD软件)增长18%特斯拉Semi电动卡车和Cybercab预计将于今年上半年投产特斯拉正在得州试点锂精炼厂生产,并自主研发用于自动驾驶和机器人的推理芯片第三代Optimus人形机器人将于今年第一季度亮相
Please Don't Say Mean Things about the AI I Just Invested a Billion Dollars In4 months agohttps://www.mcsweeneys.net/articles/please-dont-say-mean-things-about-the-ai-tha...英伟达CEO黄仁勋为AI技术辩护,回应外界批评批评意见包括AI可能助长诈骗、导致失业及造成生态破坏AI被指控危害教育体系、侵犯隐私及催生自主武器黄仁勋强调AI对推动创新和解决社会问题至关重要他呼吁减少负面情绪,以更开放态度接纳AI技术
World Models4 months agohttps://ankitmaloo.com/world-models/各大AI实验室正聚焦于世界模型的研发,Yann LeCun和Ilya Sutskever等关键人物都强调了其重要性。世界模型能预测下一状态或观察结果,理解游戏、代码库或市场等环境中的因果规律,这与当前仅关注token预测的模型有本质区别。现有世界模型的实例包括推荐引擎、算法交易系统和气象模型——它们预测的是状态转换而不仅是模式匹配。商业和金融等对抗性领域需要世界模型来适应反应性环境,静态模型在此类场景中必然失效。语言理解能力增强了世界模型处理文本数据(如财报电话会议记录或内部备忘录)并预测结果的能力。价值函数是世界模型的核心组件,通过预估未来收益并提前剪枝不良轨迹,实现高效的多步规划。世界模型的反馈循环能形成竞争优势:来自现实结果的持续更新会随时间推移不断提升模型精度。当前大语言模型因训练基于模仿而非因果关系,缺乏预测现实结果的能力,在动态环境中的效用有限。世界模型的发展源于三个驱动力:token预测的边际效益递减、视频模型作为物理模拟器的进步,以及可解释性研究的突破。首个在高价值领域构建可靠世界模型的企业将获得巨大优势,因为这些模型会通过实际部署和现实反馈持续进化。
AI on Australian travel company website sent tourists to nonexistent hot springs4 months agohttps://www.cnn.com/2026/01/28/travel/ai-tourism-nonexistent-hotsprings-intl-scl...某旅游公司网站上AI生成的博客虚假推荐了塔斯马尼亚并不存在的'韦尔德伯勒温泉'。大量游客开始涌入该地区,导致当地居民感到困惑和不满。旅游公司承认错误,归因于AI失误和监管缺失。专家警告旅行推荐中的AI'幻觉'问题,指出90%的AI生成行程存在不准确信息。建议旅行者通过指南书和旅行社等可靠渠道交叉核验AI推荐信息。
US cybersecurity chief leaked sensitive government files to ChatGPT: Report4 months agohttps://www.dexerto.com/entertainment/us-cybersecurity-chief-leaked-sensitive-go...美国网络安全代理主管将敏感文件上传至公开版ChatGPT被上传的文件包含标记为'仅限官方使用'的机密文档戈图穆卡拉拥有其他国土安全部员工被禁止使用的ChatGPT特殊访问权限网络安全监控系统发现异常上传行为后启动损害评估公开版ChatGPT会将用户输入内容共享给OpenAI引发数据安全担忧网络安全局声明戈图穆卡拉的使用'短暂且有限'并受部门管控戈图穆卡拉此前未通过反间谍测谎测试该事件发生时正值特朗普政府推动联邦机构采用人工智能技术特朗普签署行政命令限制州级政府对AI技术的监管权限五角大楼宣布'AI优先'战略推进人工智能军事化应用
Run Clawdbot/Moltbot on Cloudflare with Moltworker4 months agohttps://blog.cloudflare.com/moltworker-self-hosted-ai-agent/Mac mini正被批量采购用于运行开源AI个人助手MoltbotMoltbot可在用户本地硬件运行,支持多应用集成并实现远程控制Moltworker作为中间件推出,支持在Cloudflare沙盒SDK和开发者平台API上运行MoltbotCloudflare Workers现已提升Node.js兼容性,显著减少外部依赖需求实验显示98.5%的热门NPM包(前1000)可在Cloudflare Workers正常运行Moltworker架构包含API路由器和代理模块,采用R2实现持久化存储Cloudflare AI网关支持集中管理AI供应商密钥并实现统一计费沙盒SDK通过简易API为不可信代码提供安全隔离的运行环境浏览器渲染功能支持以编程方式控制无头浏览器完成网页自动化任务零信任访问方案简化API和管理界面的身份验证流程,强化安全防护演示环节展示Moltbot的多项能力:路线规划、食品订购、视频生成等Moltworker已在GitHub开源,需Cloudflare账户及Workers付费计划Cloudflare提供AI开发全栈工具包,涵盖推理、存储及数据库等组件
Project Genie: Experimenting with infinite, interactive worlds4 months agohttps://blog.google/innovation-and-ai/models-and-research/google-deepmind/projec...Project Genie(精灵计划)是谷歌基于Genie 3、Nano Banana Pro和Gemini技术开发的实验性研究原型Genie 3作为通用世界模型,能实时生成多样化的交互式环境用户可通过三大核心功能创造、探索和重构互动世界:世界草图、世界探索与世界混搭「世界草图」功能支持通过文字和图像提示创建环境,并通过Nano Banana Pro实现精准控制「世界探索」功能实现实时导航与路径生成,用户可与虚拟世界动态交互「世界混搭」允许用户修改现有世界,或从精选图库获取创作灵感目前该项目仅限美国境内18岁以上的Google AI Ultra订阅用户使用,未来将逐步开放访问已知局限包括:画面真实感不足、偶发角色控制问题及60秒生成时长限制谷歌致力于负责任地开发AGI,Genie 3可支持多样化现实世界模拟
Apple acquires secretive Q․AI startup for $2B4 months agohttps://9to5mac.com/2026/01/29/apple-acquires-secretive-q%E2%80%A4ai-startup-for...苹果公司以近20亿美元收购以色列人工智能初创企业Q.ai,这是苹果史上规模最大的收购案之一。Q.ai专注于面部表情分析和无声语音输入技术,应用于人机交互领域。包括首席执行官阿维德·迈泽尔斯在内的Q.ai创始团队将加入苹果;迈泽尔斯曾在2013年将其创立的PrimeSense公司出售给苹果。该初创公司开发的机器学习技术可应用于音频和无声语音输入,在嘈杂环境中具有潜在应用价值。此次收购是苹果公司历史上第二大收购案,仅次于2014年30亿美元收购Beats的交易。Q.ai的技术或将增强苹果AirPods、Apple Watch和Vision Pro等可穿戴设备的功能。苹果公司鲜少公开确认收购行为,此次因交易规模巨大而发布声明实属罕见。
One-Click Clawdbot/Moltbot on Security-Hardened DigitalOcean Droplets4 months agohttps://www.digitalocean.com/blog/moltbot-on-digitaloceanDigitalOcean宣布为Droplet®服务器推出Moltbot一键部署功能,可在安全云环境中快速部署持续运行的智能体AI由Peter Steinberger和开源社区开发的Moltbot,展现了开发者主导的智能体AI领域的快速创新该方案解决了包括保障智能体访问安全、隔离执行环境、保护凭证信息同时简化部署流程等挑战DigitalOcean的一键部署Moltbot提供生产级安全默认配置,通过TLS加密反向代理确保通信安全该解决方案支持从本地实验环境无缝过渡到生产环境,无需重构工作流程核心功能包括安全访问、隔离执行、凭证保护和垂直扩展能力DigitalOcean的智能体推理云专为高推理负载设计,提供可靠的生产环境性能即将推出的功能包括水平扩展、按使用量计费以及增强型监控可用资源包括快速入门指南、社区论坛和技术文档安全提示:为获得最佳安全性,Moltbot应仅在提供的Droplet环境中运行
Apple buys Israeli startup Q.ai as the AI race heats up4 months agohttps://techcrunch.com/2026/01/29/apple-buys-israeli-startup-q-ai-as-the-ai-race...苹果收购AI初创公司Q.ai以增强音频和影像技术Q.ai专注于低语语音解析与降噪技术交易估值近20亿美元,系苹果史上第二大收购案Q.ai技术或将提升AirPods和Vision Pro头显功能CEO阿维德·梅泽尔斯曾于2013年将PrimeSense出售给苹果Q.ai创始团队将随收购加入苹果公司苹果季度财报预计将显示iPhone销售强劲增长
Mozilla Slopaganda4 months agohttps://dbushell.com/2026/01/28/mozilla-slopaganda/Mozilla的《Mozilla现状报告》因混乱花哨的呈现方式受到批评尽管Mozilla收入严重依赖谷歌,报告仍强调其'双重底线'经济模式Mozilla对比了两种未来:一种由微软主导,另一种由Mozilla塑造——尽管其缺乏具体AI产品报告包含对迷幻蘑菇的怪异引用,以及针对年轻群体的激进品牌重塑尝试Mozilla强调其14亿美元储备金(主要来自谷歌资助),却将自己定位为对抗科技巨头的角色报告提及Firefox和Thunderbird,但缺乏重要AI产品,仅聚焦模糊承诺报告以一系列空洞的AI承诺收尾,包括Firefox中将设置AI'紧急停止开关'Mozilla领导层因Firefox市场份额持续下滑及缺乏创新而遭受批评
Agentic Vision in Gemini 3 Flash4 months agohttps://blog.google/innovation-and-ai/technology/developers-tools/agentic-vision...Gemini 3 Flash中的代理视觉将图像理解转变为主动的、代理驱动的过程它结合视觉推理与代码执行,逐步放大、检查并操作图像代理视觉为图像任务引入'思考-行动-观察'循环机制思考阶段:模型根据查询和初始图像制定多步骤计划行动阶段:生成并执行Python代码来操作或分析图像观察阶段:将转换后的图像附加到上下文窗口以便更好检查Gemini 3 Flash的代码执行使视觉基准测试提升5-10%应用场景包括缩放检查、图像标注及可视化数学/绘图PlanCheckSolver.com使用代理视觉进行建筑平面验证,准确率提升5%Gemini 3 Flash能通过绘制边界框和标签实现精准图像标注通过解析表格并生成Python绘图代码执行可视化数学运算未来更新将使更多操作隐式化,并扩展工具集与模型规模代理视觉功能已通过Gemini API在Google AI Studio和Vertex AI平台开放
Code is cheap. Show me the talk4 months agohttps://nadh.in/blog/code-is-cheap/随着LLM编程工具的出现,软件开发发生了根本性变革,传统方法已然过时。Linus Torvalds的格言'空谈无益,给我看代码'在AI生成代码普及的当下已不合时宜。LLM能快速生成高质量、文档完善的代码,使人难以区分人类与AI的产出。编写优质代码所需的精力大幅减少,开发者得以更专注于架构设计与问题解决。随着AI能规模化生产功能性代码,代码作为产物的价值正在弱化,引发关于责任归属与来源溯源的质疑。FOSS(自由开源软件)的生态正在改变——代码变得廉价且易定制,可能削弱协作动力。'氛围编程'的兴起让非技术人员也能开发软件,但同时也可能导致生态圈充斥低质量的AI生成垃圾。资深开发者通过LLM降低认知与生理负荷获益,但初级开发者可能面临基础技能培养的困境。批判性思维与表达能力的价值现已超越语法知识,因为编码工作可由AI代劳。软件开发领域正经历颠覆性变革,传统角色与方法论逐渐退出历史舞台。
Mamdani to kill the NYC AI chatbot caught telling businesses to break the law4 months agohttps://themarkup.org/artificial-intelligence/2026/01/30/mamdani-to-kill-the-nyc...纽约市的人工智能聊天机器人本意是帮助企业了解城市法规,却给出了诸如克扣员工小费等违法建议。佐兰·曼达尼市长计划关停该聊天机器人,指出其成本高昂且效果不佳。作为MyCity项目的一部分,该聊天机器人因提供错误和有害信息而受到批评。尽管进行了改进并添加了免责声明,该聊天机器人仍不可靠且功能有限。亚当斯政府曾为该机器人辩护,承诺未来改进,但新政府认为其是财政负担。