Hasty Briefsbeta

全部标签

#ai

共 2203 篇

双语

Sam Altman would like remind you that humans use a lot of energy, too
3 months ago
- 山姆·奥特曼将人们对AI耗水量的担忧称为'完全虚假'，澄清数据中心过去使用的蒸发冷却技术相关问题已不再适用
- 奥特曼承认解决AI总体能耗问题的重要性，主张应快速转向核能、风能和太阳能等清洁能源
- 他驳斥了'每次ChatGPT查询耗能相当于1.5次iPhone充电'的说法，指出这类估算存在严重夸大
- 奥特曼认为对比AI与人类能耗时应计算整体训练成本，暗示AI单次查询的能效可能已超过人类
- 讨论指出科技公司目前没有披露能耗数据的法律义务，相关研究主要由独立机构开展以填补空白
Show HN: Eliezer – Tiny (~7K LOC) Self-Hosted AI Agent (PWA, Self-Editing)
3 months ago
- Eliezer是一款紧凑型、可自我修改的AI代理，能在手机上持续运行。
- 与聊天机器人不同，Eliezer能记住上下文、执行任务，并在用户不主动使用时持续构建内容。
- 功能包括交互式小组件、计划任务、SQLite数据持久化，以及通过PWA推送通知。
- Eliezer可自行修改工具与能力，用户仅需提出需求即可添加新功能。
- 开源（MIT协议）且支持自托管，用户可完全掌控数据与服务器。
- 相比同类产品，Eliezer具有持续运行、完全自我修改能力，代码库更精简易读（约7千行）。
- 由Victor个人开发，Eliezer的设计理念是让用户拥有完全控制权。
Training a Human Takes 20 Years of Food
3 months ago
- 山姆·奥特曼将AI训练比作人类发展，指出两者都需要大量资源
- 培养一个人类需要约20年的成长时间和食物消耗才能变得'聪明'
- 印度正引领AI应用浪潮，即将成为AI技术的主要市场
- 奥特曼认为将AI力量集中于单一公司或国家将'带来灾难性后果'
- OpenAI主张AI民主化，尽管存在潜在风险仍坚持将工具交到人们手中
- OpenAI的'迭代部署'策略允许人们在AI不完善或演进阶段就开始使用
The End of AI Tourism: Tools vs. Toys
3 months ago
- 文章探讨了像Adobe这样将AI作为工具整合的老牌公司与完全依赖AI作为唯一产品的初创企业之间的二元对立。
- 重点指出了'AI游客'现象——这些用户出于娱乐目的使用AI应用，但缺乏长期使用黏性，导致用户流失率居高不下。
- 作者以AI音乐生成器Suno为例，说明建立在 novelty（新奇性）基础上的公司如何难以留住用户，并试图转向专业市场。
- Adobe和谷歌被作为成功案例呈现，它们将AI融入现有工作流程，使AI成为功能而非产品本身。
- 最终结论表明，最佳投资机会在于那些在自身生态系统中创新的成熟企业，而非华而不实、难以持续的AI初创公司。
Building a (Bad) Local AI Coding Agent Harness from Scratch
3 months ago
- 用约400行原生Node.js代码构建了终端基础的编程代理，完全本地运行于GPU，无需云服务依赖
- 开发中使用Claude Sonnet 4.6和Ollama框架下的Google Gemma 3 4GB模型
- 展示了核心概念的初级实现：代理循环、工具使用和沙盒机制
- 通过栅栏式代码块(read/write/ls)实现LLM与文件系统交互的简单协议
- 通过限制文件操作用户自定义工作目录实现沙盒隔离
- 代理循环维护对话历史记录，驱动与模型的轮次式交互
- 工具使用协议允许模型通过发送特殊标记块执行文件操作
- 系统提示词经过精心设计以引导模型遵循定制协议
- 包含/test命令用于验证模型对协议的遵守情况
- 尽管存在部分失败案例，但成功演示了本地编程代理的基本框架
Show HN: Lyra Kids – I built an AI bedtime storyteller for my daughters
3 months ago
- AI驱动的个性化睡前故事创作平台
- 让孩子成为自己故事中的主角
- 数秒内快速生成故事
- 专为儿童设计，尤其适合3岁左右儿童
- 设有常见问题解答专区
Agentic Software Engineering Book
3 months ago
- 自主AI代理正在改变软件的构建、测试和部署方式。
- 代理式软件工程聚焦于从AI和人类贡献中获取可靠性与信任。
- 软件开发的主要挑战在于复杂性、沟通和系统完整性，而非代码生产。
- 成功的团队更注重明确意图、风险管理和证据，而非速度。
Show HN: AI Timeline – 171 LLMs from Transformer (2017) to GPT-5.3 (2026)
3 months ago
- 文本提到了一条与人工智能历史相关的时间线。
- 它特别关注从GPT到Gemini的大语言模型(LLMs)。
- 时间线包含模型数量、年份和涉及组织等指标。
- 提供按'开源'或'闭源'状态以及'里程碑'筛选的选项。
- 时间线可以'紧凑'或'完整'模式查看。
AIs can generate near-verbatim copies of novels from training data
3 months ago
- 顶尖AI模型能近乎逐字复制畅销小说内容，引发版权担忧
- 最新研究表明AI模型记忆的训练数据比预想更多
- 这种记忆行为削弱了AI公司在版权诉讼中的抗辩立场
- AI行业声称使用受版权保护作品训练属于'合理使用'
- 研究人员通过提示使AI模型生成了《哈利波特》等书籍的大段受版权保护内容
US Gov Deploys Grok as Nutrition Bot, It Advises for Rectal Use of Vegetables
3 months ago
- 特朗普政府通过超级碗广告推出RealFood.gov网站，由迈克·泰森出镜宣传以蛋白质为核心的膳食指南
- 该网站最初推荐使用埃隆·马斯克的AI聊天机器人Grok获取饮食建议，但在媒体质询后删除了直接提及
- 以争议行为著称的Grok在用户测试中提供了关于直肠插入食物的不当建议
- 尽管行为怪异，Grok却通过建议传统蛋白质摄入和减少红肉与政府的健康议程相左
- 在小罗伯特·肯尼迪领导的卫生与公众服务部推动下，这项膳食计划包含推广全脂牛奶和每日饮酒等争议性主张
IBM Plunges After Anthropic's Latest Update Takes on COBOL
3 months ago
- Anthropic公司的Claude现在可以自动化实现COBOL现代化改造，这将冲击IBM利润丰厚的COBOL生态系统。
- COBOL对美国ATM交易和其他领域至关重要，但缺乏现代化技术人才。
- 像Claude Code这样的AI工具可以分析和记录COBOL系统，助力现代化改造工作。
- 由于市场对Claude颠覆COBOL领域的反应，IBM股价暴跌15美元。
- Anthropic通过增量更新实施市场颠覆的策略，可能正在形成自我造血机制。
- 考虑到资金需求，OpenAI可能也会采取类似策略。
HackEurope 2026: A short rant on AI and hackathons
3 months ago
- HackEurope 2026混乱但提供了关键经验
- 前端展示至关重要，功能常被忽视
- 选择正确赛道很重要，赞助商可能不会覆盖所有分场
- 用简单方式解释项目很关键——时间有限且评委可能非技术背景
- 紧跟趋势（尤其是加入AI元素）能提高胜算
- 作者开发了安全包注册中心，用于检测npm包中的恶意行为
- 最小可行产品采用eBPF收集行为数据，结合AI/历史数据标记异常
- 未来规划包括可复现构建、多生态支持及HTTPS流量解密
- 黑客马拉松过度依赖AI会导致同质化，扼杀创意和原创思想
- 许多项目重复雷同，受限于AI能力而非真正创新
Firefox 148 Now Available with the New AI Controls / AI Kill Switches
3 months ago
- Firefox 148版本引入了新的人工智能控制功能，包括可一键禁用所有AI特性的“紧急停止开关”
- 用户可单独开关各项AI功能，如翻译、图片替代文本、标签页分组建议等
- Firefox 148还包含安卓端更新、Trusted Types API支持、CSS shape()函数及WebGPU增强功能
- 面向开发者的变更详情可查阅developer.mozilla.org
- Firefox 148.0二进制安装包已可通过ftp.mozilla.org下载
Show HN: Steerling-8B, a language model that can explain any token it generates
3 months ago
- Steerling-8B是首个具备本质可解释性的大语言模型，能追踪每个生成token到其输入上下文、人类可理解概念及训练数据的溯源路径
- 该模型基于1.35万亿token训练，性能可媲美训练数据量多2-7倍的模型
- 核心能力包括推理时的概念抑制/增强、训练数据溯源，以及通过概念控制实现的推理阶段对齐
- 模型将嵌入向量分解为监督概念、发现概念和残差通路三部分，在保持性能的同时确保可解释性
- 尽管训练算力较低，Steerling-8B在基准测试中仍具竞争力，其中84%的token级贡献来自概念模块
- 未来版本将探索概念导向、概念发现、免微调的对齐方法，以及记忆机制/训练数据价值评估
Firefox 148 Launches with AI Kill Switch Feature and More Enhancements
3 months ago
- Firefox 148版本引入'AI关闭开关'，可禁用聊天机器人提示和AI生成链接摘要等人工智能功能。
- 用户可通过设置>AI控制中的'阻止AI增强功能'开关禁用AI特性，并提供选择性屏蔽选项。
- 本次更新允许用户在设置>隐私与安全>Firefox数据收集中选择退出远程更新，同时最大限度减少数据收集。
- 安全增强包括集成Trusted Types API和Sanitizer API防范XSS攻击，改进PDF公式的屏幕阅读器兼容性，以及Windows 10系统支持Firefox备份功能。
- 新增特性还包含越南语和繁体中文翻译支持，容器标签页的新标签页壁纸功能，以及WebGPU的服务工作者支持。
Human Existence Is Just as Wasteful as AI Data Centers, Sam Altman Suggests
3 months ago
- 山姆·奥特曼将人类养育与AI训练在能源效率方面作比较，暗示AI可能更高效。
- 包括斯里达尔·文布在内的批评者谴责这一类比，称其非人化且不道德。
- 奥特曼主张快速转向核能、风能和太阳能，尽管他本人担任核能初创公司董事长，引发关于立场偏颇的质疑。
- 奥特曼素有争议言论前科，包括对AI存在风险的担忧及ChatGPT伦理影响的讨论。
- 这场辩论凸显了技术进步与人类生命内在价值之间的深刻矛盾。
The First Fully General Computer Action Model
3 months ago
- FDM-1是计算机使用的基础模型，基于1100万小时的屏幕录制数据进行训练
- 该模型采用逆向动力学模型(IDM)来标记按键和鼠标移动等操作
- 视频编码器可将近2小时的30帧/秒视频压缩为100万token，效率比现有方法提升50倍
- FDM-1能处理CAD设计、金融分析、工程制图等长上下文任务，且规模越大表现越好
- 训练分为三个阶段：IDM训练、视频语料标注、前向动力学模型(FDM)的自回归训练
- 视频编码器采用掩码压缩目标，实现高压缩率同时保留语义细节
- 评估体系包含8万个分叉虚拟机，支持可扩展测试
- FDM-1在物体分割、3D建模、自动驾驶测试等任务中表现优异
- 该模型将计算机操作从数据受限模式转变为算力受限模式
- 未来研究将着力解决通用学习模型的技术对齐难题
An AI doomsday report shook US markets
3 months ago
- 花旗研究发布的AI末日投机场景影响美国股市
- 该场景预测AI代理将扰乱美国经济，导致2028年前失业率达10%
- 标普500指数下跌超1%，软件类股创四月以来新低
- 优步、万事达、美国运通和DoorDash因报告股价下跌4-6%
- 分析师称该场景为'末日噱头'，但承认经济转型正在发生
I'm helping my dog vibe code games
3 months ago
- 作者训练了他们9磅重的卡瓦普犬Momo通过键盘打字来'编写'游戏代码，输出结果由Claude Code进行解析。
- 该系统让Momo在蓝牙键盘上打字，经过按键过滤后发送给Claude Code，后者将这些输入解释为游戏设计指令。
- 智能宠物喂食器会为Momo的打字行为分发零食奖励，铃声提示则表明Claude已准备好接收更多输入。
- 给Claude Code的提示框架将这些输入设定为来自一位古怪游戏设计师的加密指令，确保随机按键能获得有意义的解读。
- 自动截图和输入模拟等工具帮助Claude测试并优化其生成的游戏。
- 作者尝试了多种游戏引擎，最终选择Godot，因其基于文本的场景格式和与Claude的便捷集成性。
- 训练Momo的过程包括将键盘滑动与零食奖励关联，并逐步提高所需输入的复杂度。
- 已创建的示例游戏包括《DJ斯默克》《吃豆豆》《扎兹》《罗马神谕蛙》《八爪律动》《咩你听见了！》和《类星体萨兹》。
- 关键改进来自更好的反馈循环机制，使得Claude能够自行测试和修复游戏，而非依赖初始提示的优化。
- 该项目证明只要建立合适的系统，即使是无意义的输入也能产生具有功能性和创造性的输出。
Mercury 2: Diffusion Reasoning Model
3 months ago
- Mercury 2被宣称为全球最快的推理语言模型，专为即时生产级AI设计
- 在生产环境中，速度至关重要，因为像智能体和检索管道这类循环操作会产生延迟累积效应
- Mercury 2采用基于扩散的并行优化技术实现更快生成，可同时产生多个token
- 相比自回归模型，其生成速度提升5倍以上，彻底改变了推理效率的权衡关系
- 核心特性包括：1,009 tokens/秒的生成速度、具有竞争力的质量、128K上下文窗口及原生工具调用能力
- 针对高并发场景优化，在95%请求中保持极低延迟，确保实时响应
- 英伟达特别强调Mercury 2在其GPU上的表现，生成速度突破1,000 tokens/秒
- 在编码、智能体循环、实时语音和搜索管道等延迟敏感型应用中表现卓越
- 合作伙伴与客户盛赞其速度优势、输出质量及对工作流程的变革性影响
- Mercury 2兼容OpenAI API接口，现已开放企业级评估申请

About|Login

#ai

Sam Altman would like remind you that humans use a lot of energy, too

Show HN: Eliezer – Tiny (~7K LOC) Self-Hosted AI Agent (PWA, Self-Editing)

Training a Human Takes 20 Years of Food

The End of AI Tourism: Tools vs. Toys

Building a (Bad) Local AI Coding Agent Harness from Scratch

Show HN: Lyra Kids – I built an AI bedtime storyteller for my daughters

Agentic Software Engineering Book

Show HN: AI Timeline – 171 LLMs from Transformer (2017) to GPT-5.3 (2026)

AIs can generate near-verbatim copies of novels from training data

US Gov Deploys Grok as Nutrition Bot, It Advises for Rectal Use of Vegetables

IBM Plunges After Anthropic's Latest Update Takes on COBOL

HackEurope 2026: A short rant on AI and hackathons

Firefox 148 Now Available with the New AI Controls / AI Kill Switches

Show HN: Steerling-8B, a language model that can explain any token it generates

Firefox 148 Launches with AI Kill Switch Feature and More Enhancements

Human Existence Is Just as Wasteful as AI Data Centers, Sam Altman Suggests

The First Fully General Computer Action Model

An AI doomsday report shook US markets

I'm helping my dog vibe code games

Mercury 2: Diffusion Reasoning Model