ChatGPT models are surprisingly good at Geoguessinga year agohttps://techcrunch.com/2025/04/17/the-latest-viral-chatgpt-trend-is-doing-revers...OpenAI的新AI模型o3和o4-mini能够通过分析图像推断地理位置用户正利用o3的图像推理和网络搜索功能玩'GeoGuessr'式的地理猜谜游戏该模型无需依赖EXIF数据,仅凭细微视觉线索就能识别城市、地标、餐厅和酒吧这引发了隐私担忧,恶意行为者可能利用该工具通过社交媒体照片对人进行人肉搜索测试显示o3在地理猜谜中有时胜过GPT-4o,但也存在不准确或陷入循环的情况OpenAI在新模型的安全报告中未提及针对反向地理位置查询的防护措施
Gemini 2.5 Flasha year agohttps://developers.googleblog.com/en/start-building-with-gemini-25-flash/Gemini 2.5 Flash 现已通过 Google AI Studio 和 Vertex AI 的 Gemini API 开放预览这是一个混合推理模型,开发者可自由开启/关闭推理功能开发者可通过设置「思考预算」来平衡质量、成本与延迟模型会根据任务复杂度自动调整推理强度即使关闭推理功能,Gemini 2.5 Flash 性能仍优于 2.0 Flash 版本思考预算支持 0 至 24576 个token的可调范围该模型特别擅长需要多步推理的复杂任务典型应用场景包括数学解题、行程安排与电子表格计算定价信息来源于Artificial Analysis及官方技术文档
AI hype is drowning in slopagandaa year agohttps://www.ft.com/content/24218775-57b1-4e9f-ba64-266a3239cf27AI炒作被批评充斥着低质量内容('垃圾内容议程')。《金融时报》数字订阅每月75美元起,试用期间可随时取消。订阅者预付一年费用可享八折优惠,获得优质新闻的完整数字访问权限。订阅内容包含行业领袖的专家分析,支持全设备访问。机构数字订阅包含独家功能与专属内容。超百万付费读者印证《金融时报》的卓越价值。
Wikipedia offers AI developers its article data on Kaggle to stop scrapinga year agohttps://siliconangle.com/2025/04/17/wikipedia-offers-ai-developers-article-data-...维基媒体基金会在Kaggle平台发布AI就绪版维基百科数据集以避免网络爬取数据集包含结构化JSON格式的摘要、描述、信息框数据及图片链接内容遵循知识共享许可协议和GNU自由文档许可证Kaggle平台现托管超46.1万份数据集,新增英文版和法文版维基百科该数据集旨在减轻服务器负载,为AI训练提供清洁的预解析数据早期测试版发布诚邀社区反馈与讨论
To Make Language Models Work Better, Researchers Sidestep Languagea year agohttps://www.quantamagazine.org/to-make-language-models-work-better-researchers-s...语言并非思维的必需品,部分神经科学家认为将想法转化为语言反而会拖慢思考速度人工智能系统(尤其是大语言模型)可能通过数学空间(潜在空间)处理信息,从而受益于'脱离语言的思考'大语言模型先将文本转换为标记,再转化为数值嵌入,通过转换器层处理生成隐藏状态,最终输出标记现有大语言模型通过生成'思维链'标记来模拟推理步骤,但嵌入与标记间的反复转换会导致效率低下和信息损失研究人员已开发出'椰子'模型和循环转换器模型等潜在空间推理模型,避免标记转换,在部分任务中实现了效率与准确率双提升潜在空间推理使模型能在确信答案前保持思维过程的不确定性,提供了本质不同的推理范式尽管效果显著,潜在推理模型仍面临传统架构投资惯性及与人类思维模式错位的应用挑战潜在空间推理为大语言模型开创了全新'思考'模式,或将引领AI推理能力的重大突破
Arc GPUs Paired with Open-Source AI Playground Offer Flexible Local AI Setupa year agohttps://www.hardware-corner.net/ai-playground-oss-arc-gpu-inference-20250418/英特尔开源AI Playground,该工具此前仅限英特尔硬件使用,现可增强本地大语言模型推理能力英特尔Arc显卡(特别是B580和A770型号)为量化大语言模型提供极具竞争力的性价比A770显卡以接近RTX 3060的价格提供16GB显存,并具有更高内存带宽(512GB/s对比360GB/s)AI Playground支持多种模型格式,包括Safetensor PyTorch大模型、GGUF大模型和OpenVINO格式用户可选择IPEX-LLM(针对英特尔硬件优化)或GGUF(更广泛兼容性)两种实现方案此次开源强调为本地AI部署提供价值、灵活性和可持续性解决方案
Four charts sum up the state of AI and energya year agohttps://www.technologyreview.com/2025/04/17/1115320/four-charts-ai-energy/人工智能正大幅推高电力需求,预计到2026年数据中心用电量将接近1万亿千瓦时,超过日本当前总用电量。短期内煤炭和天然气等化石燃料仍将为数据中心供电,但2030年后可再生能源和核能预计将发挥更大作用。数据中心仅占本十年预期电力需求增长的8%稍多,电动汽车、空调和家用电器带来的电力需求增长更为显著。数据中心集中分布在城市周边,给当地电网带来独特挑战,并可能导致这些地区化石燃料使用量增加。
Kagi Assistant is now available to all usersa year agohttps://blog.kagi.com/assistant-for-allKagi助手现已向所有套餐用户开放,此前仅限Ultimate订阅用户使用。功能将分阶段推出,首站美国地区,预计UTC时间周日23:59前完成全球部署。Kagi助手深度集成Kagi搜索,遵循个性化域名排名设置,并支持文件上传以补充上下文。用户可创建定制助手(如编程辅助/语法检查),并通过自定义bang命令快速调用。支持实时编辑提问、切换AI模型、调整对话设置,持续优化回答质量。隐私保护为首要原则:对话默认加密,支持自动过期设置,交互数据绝不用于AI训练。为保障服务可持续性,实施公平使用政策,用量限额与套餐货币价值挂钩。提供多款大语言模型,Ultimate套餐可使用更先进的模型。用量统计页面可查看token消耗情况,未来将优化该数据的展示方式。
Athena – An open source production-ready general AI agenta year agohttps://github.com/Athena-AI-Lab/athena-core雅典娜是一款可直接投入生产的通用AI智能体,专为实际执行而设计,不仅限于思考。雅典娜的核心能力包括:GitHub代码库总结、Hacker News资讯检索、航班价格查询、文档翻译等。该智能体可操控计算机设备、访问文件系统、执行Python代码、自动化网页浏览及执行网络搜索。安装步骤包含:克隆代码仓库、安装依赖项、在YAML配置文件中设置API密钥。雅典娜的发展路线图包含:自主编写代码、强健的浏览器自动化、基于RAG的长期记忆功能。欢迎贡献代码,包括功能建议、错误报告及插件开发。本项目采用社区驱动模式,基于BSD 3-Clause许可证开源。
Microsoft’s “1‑bit” AI model runs on a CPU only, while matching larger systemsa year agohttps://arstechnica.com/ai/2025/04/microsoft-researchers-create-super%e2%80%91ef...现代AI模型通常使用16位或32位浮点数存储权重,这需要大量内存和计算资源。微软通用人工智能小组开发了一种新型三元神经网络模型,仅使用-1、0或1作为权重值。这种三元架构降低了复杂度并提高了计算效率,使其能在桌面CPU上高效运行。尽管权重精度降低,该模型宣称性能可与同规模全精度模型相媲美。先前的量化技术主要聚焦于降低内存占用,极端案例如BitNet使用单比特权重。新型BitNet b1.58b模型采用三元系统(称为'1.58比特'),是首个开源、原生训练的规模化1比特大语言模型。与可能导致性能下降的训练后量化不同,BitNet b1.58b采用原生训练,避免了显著性能损失。该模型基于4万亿token的训练数据集,可扩展至20亿token规模,性能对标更大的全精度模型。
AI has grown beyond human knowledge, says Google's DeepMind unita year agohttps://www.zdnet.com/article/ai-has-grown-beyond-human-knowledge-says-googles-d...谷歌DeepMind研究人员提出,AI需要通过体验式学习突破当前局限现有AI模型过度依赖静态人工生成数据,这限制了其发展新能力提出的'数据流'方法基于强化学习,使AI能与环境交互并从持续经验中学习数据流中的AI代理将具备长期目标、记忆和适应能力,不同于当前专注短期交互的模型这一转变可能使AI超越人类智能,在各领域释放前所未有的能力潜在风险包括就业岗位替代和人类对自主AI代理监管的弱化预计体验式数据将在规模和质量上超越人工生成数据,推动AI发展
The Web Is Broken – Botnet Part 2a year agohttps://jan.wildeboer.net/2025/04/Web-is-Broken-Botnet-Part-2/AI公司激进地收集数据,导致网络爬虫数量激增。部分企业通过招募应用开发者,在APP中植入‘网络共享’SDK来构建僵尸网络。这些僵尸网络利用用户带宽进行网页抓取、邮件服务器暴力破解等行为。Infatica等公司通过安装其SDK的设备出售网络访问权限。这种商业模式助长了类似DDoS的攻击,应当被科技巨头制止。趋势科技研究证实了外界对这些公司行为的质疑。应用集成此类SDK会使开发者成为传播恶意软件的共犯。用户和管理员难以检测这些SDK及其产生的流量。由于这些行为,网络爬取正日益被视为滥用行为。‘住宅代理’市场蓬勃发展的部分驱动力来自AI网络爬取需求。
Show HN: I built an AI that turns GitHub codebases into easy tutorialsa year agohttps://github.com/The-Pocket/Tutorial-Codebase-Knowledge关于构建AI代理来分析GitHub仓库并生成新手友好教程的指南使用Pocket Flow(一个100行代码的LLM框架)来爬取和分析代码库识别代码中的核心抽象概念和交互逻辑将复杂代码转化为带有可视化说明的清晰教程支持分析GitHub仓库和本地目录可生成多种语言的教程(包括英文和中文)包含指定包含/排除文件及设置最大文件大小的选项采用Agentic Coding模式开发(人类设计+AI代理编码)由Pocket Flow驱动,使AI代理能够构建应用程序提供YouTube分步开发教程
Show HN: LettuceDetect – Lightweight hallucination detector for RAG pipelinesa year agohttps://github.com/KRLabsOrg/LettuceDetectLettuceDetect是一款通过比较答案与给定上下文来检测RAG系统幻觉的工具解决了上下文窗口限制和计算效率低下等局限性在RAGTruth数据集上表现优于其他基于编码器和提示的模型部分指标甚至超过LLAMA-2-13B等微调大语言模型以MIT协议开源,提供代码、模型和工具具有词元级精度、优化推理、4K上下文窗口和易集成等特性支持pip安装或仓库克隆,提供简洁API接口F1分数超越GPT-4等模型,展现卓越性能内置Streamlit演示和Web API,便于部署测试基于ModernBERT架构在RAGTruth数据集训练,擅长长文本处理
Researchers develop picosecond-level flash memory devicea year agohttps://www.fudan.edu.cn/en/2025/0417/c344a145016/page.htm复旦大学研究人员研制出编程速度为400皮秒的皮秒级闪存器件该器件每秒可运行250亿次,成为目前已知最快的半导体电荷存储器件这一突破对大型AI模型的超高速运算具有重要意义其速度相当于眨眼间完成10亿次操作,远超此前记录相关研究以《PoX》为题发表于《自然》期刊该突破解决了信息存储的速度瓶颈,对AI和集成电路发展至关重要非易失性存储技术是实现AI计算超低功耗的关键研究团队创新性运用二维狄拉克能带结构与弹道输运特性相结合的物理机制超注入机制将非易失性存储器速度推至理论极限这项技术有望重塑全球存储格局,支撑我国在相关领域保持领先地位
The AI skeptic's guide to AI collaborationa year agohttps://hils.substack.com/p/the-ai-skeptics-guide-to-ai-collaboration对AI持怀疑态度的人往往对质量有高标准,认为AI生成的作品缺乏灵魂。AI被误解了;它近似于人类的特质,但缺乏更深层次的能动性、意图和责任感。AI应被视为协作伙伴,而非人类洞察力和判断力的替代品。有效使用AI需要学习曲线,并需数周或数月的有意探索。AI在需要情商、语境或可靠性的任务中经常失败,例如绩效评估或会议记录。最佳方式是与AI进行迭代协作,通过持续对话完善想法。掌握AI协作可以提升质量和速度,拓展工作中的可能性边界。未来内容将引导怀疑者掌握AI协作技巧,应用于写作和问题解决中。
Why on Earth is OpenAI buying Windsurf?a year agohttps://theahura.substack.com/p/tech-things-openai-buys-windsurfOpenAI以30亿美元收购Windsurf引发质疑,鉴于Windsurf用户基数有限且品牌认知度低,市场对高额收购价存疑。AI编程助手市场同质化严重,GitHub Copilot、Cursor与Windsurf等功能趋同且用户转换成本低,竞争白热化。OpenAI获软银400亿美元融资的财务策略受关注,其与谷歌在AI领域的主导地位展开正面竞争。谷歌凭借更优模型、激进的人才保留策略及战略算力资源领跑AI领域,使OpenAI等公司近期发布相形见绌。苹果因GPU投入不足及隐私优先政策限制训练数据获取,在AI竞赛中明显落后,缺席感显著。
The skill of the future is not 'AI', but 'Focus'a year agohttps://www.carette.xyz/posts/focus_will_be_the_skill_of_the_future/大语言模型是工程师的强大工具,能自动化任务并辅助调试大语言模型存在幻觉、偏见和结果不一致等局限,需要严格审查过度依赖大语言模型可能削弱工程师解决新问题的能力理解模型解决方案背后的逻辑比直接接受结果更重要与搜索引擎不同,大语言模型倾向即时利用而非探索过程探索与利用相辅相成,缺乏探索会导致解决方案不稳定计算机科学追求高效解决问题,但工程师必须掌握核心算法追求快速解决方案的压力可能导致专注力和问题解决能力退化未来隐忧:复杂问题解决会否更依赖AI而非人类智慧?
Recursive LLM promptsa year agohttps://github.com/andyk/recursive_llm使用英语和LLM(如GPT-3.5)作为运行时环境实现递归递归提示包含状态并通过更新状态逼近终止目标(基准条件)无限递归斐波那契提示示例(无基准条件)通过Python函数调用OpenAI API实现自动化递归两种递归类型:递归提示与递归Python函数灵感源自目标条件强化学习与通用问题求解器(GPS)LLM运用记忆规则(代数规则与原子规则)解决问题,类似人类认知机制LLM生成错误事实的挑战及解决方案(如事实核查、维基百科查询)与ACT-R及ReAct(推理+行动)范式的关联提示中的非尾递归与堆栈管理探索计算factorial(11)的非尾递归提示示例使用OpenAI Playground或Python脚本运行递归提示的指导说明
Show HN: Hyprnote – VSCode for Meeting Notes (Open-Source and Local-First)a year agohttps://github.com/fastrepl/hyprnoteHyprnote是一款用于会议的AI记事本,能够记录并转录会议内容。它能从原始会议笔记生成强大的摘要,并使用Whisper和Llama等开源模型实现离线工作。Hyprnote采用本地优先设计,意味着无需互联网连接即可运行。该工具高度可扩展,采用类似VSCode的插件架构驱动。用户可根据需求添加或创建扩展,例如通过监听插件实现的转录扩展功能。可通过Homebrew安装,命令为:`brew tap fastrepl/hyprnote && brew install hyprnote --cask`。