Hasty Briefsbeta

全部标签

#ai

共 2203 篇

双语

AI for Senior Software Engineers
7 months ago
- 资深软件工程师从第一性原理深入理解AI的全面指南
- 涵盖基础数学、神经网络、深度学习、Transformer架构与大语言模型
- 包含训练技巧、工程化落地与伦理道德等实践内容
- 要求读者具备扎实编程能力、基础数学知识及软件部署经验
- 全书分为11章，从神经网络基础延伸到未来AI发展趋势
- 重点强调理解AI底层机制，而非仅学习API或框架调用
AI-powered nimbyism could grind UK planning system to a halt, experts warn
6 months ago
- 一款名为Objector的新型AI服务可帮助居民生成针对住宅附近规划申请的政策性反对意见
- Objector通过扫描规划申请、按影响力排序反对理由，并自动生成AI反对信、演讲视频等内容
- 该服务由肯特郡居民创建，他们曾花费数百小时反对当地开发项目
- Objector每次收费45英镑，旨在让无力承担法律咨询费的人也能公平参与规划流程
- 类似服务如Planningobjection.com提供99英镑的AI生成反对信函
- 社区活动人士推荐用ChatGPT撰写反对信，称其效果堪比聘请规划律师
- 规划律师警告AI反对信可能'助长邻避主义'，导致系统被海量提交淹没
- AI生成的反对意见有时会虚假引用不存在的案例和法规
- Objector联合创始人否认平台助长邻避主义，称其目标是使规划体系更公平
- 该服务目前处理小型规划申请，正在开发应对大型项目的能力
- 工党政府推广Extract等AI工具以加速审批流程，计划新建150万套住房
- 专家警告可能出现AI'军备竞赛'，即AI同时被用于加速和阻挠开发项目
- 政府AI工具Consult可分析公众咨询反馈，预计将面临更多AI生成的反对意见
- 批评者认为AI反对信削弱了公众咨询价值，让居民无需真正了解当地情况就能反对开发
Show HN: Serve 100 Large AI models on a single GPU with low impact to TTFT
6 months ago
- Flashtensors是一个超高速推理引擎，其将模型从SSD加载到GPU显存的速度比传统加载器快10倍以上。
- 大型模型热切换时间不到2秒，极大缩短冷启动耗时。
- 传统模型加载器因冗长的启动时间拖慢工作流，而flashtensors能消除瓶颈并实现性能最大化。
- 在单台设备上托管数百个模型，并可按需热切换，对用户体验影响极小。
- 可在机器人、可穿戴设备等资源受限设备上运行智能体工作流。
- 适用场景包括：经济型个性化AI、无服务器AI推理、本地化部署、机器人技术及本地推理。
- 通过pip安装后，使用'flash start'、'flash pull'和'flash run'等命令管理执行模型。
- Python API支持配置、模型注册、加载、推理及资源清理全流程操作。
- 基准测试显示flashtensors比safetensors快4-6倍，即使是320亿参数模型的冷启动也能控制在5秒内。
- 未来规划包含Docker集成、推理服务器、SGLang集成、LlamaCPP集成、Dynamo集成及Ollama集成等功能。
My Git history was a mess of 'update' and 'fix' – so I made AI clean it up
6 months ago
- 使用GPT重写git提交信息的AI工具
- 自动按照约定式提交标准改进提交信息
- 在重写历史前创建备份分支以确保安全
- 支持自定义模板、语言和AI提示词
- 包含git钩子实现自动信息优化
- 提供试运行模式预览修改效果
- 评估提交质量并默认跳过格式良好的信息
- 兼容GPT-3.5和GPT-4模型
- 提供多种安装方式包括npx和npm
- 包含针对不同使用场景的广泛定制选项
- 未经团队协调不建议在共享仓库中使用
LLMs are steroids for your Dunning-Kruger
6 months ago
- 罗素的名言'愚蠢者自信满满，而智者心怀疑虑'完美诠释了ChatGPT用户——他们常带着错误信息离开却坚信不疑。
- ChatGPT会制造确定性的幻觉，即使用户获得错误信息时仍感觉学识渊博。
- 大语言模型如同思维放大器：既能优化好想法，也会用权威腔调的谬论强化自我欺骗。
- 与大语言模型的交互具有成瘾性，逐渐成为人们解决问题时近乎本能的反应。
- 大语言模型的技术并无突破性创新，但其规模化和普及性带来了深远社会影响。
- 真正的创新或许在于对模型训练的海量投入，而非技术本身的突破。
- 大语言模型正在重塑人类与语言的互动方式，深刻影响着教育、工作和整个社会。
- 我们应当将大语言模型视为'信心引擎'而非'知识引擎'——它们擅长塑造确信感而非事实准确性。
Launch HN: Hypercubic (YC F25) – AI for COBOL and Mainframes
6 months ago
- Hypercubic利用AI技术理解和保护传统大型机系统及人类专业知识
- HyperTwin为中小企业创建数字孪生，捕捉并保存关键工作流程
- HyperDocs自动从大型机操作生成结构化文档，实现即时访问
- 该解决方案通过捕获即将流失的专家知识来预防系统故障，显著降低平均修复时间
- 兼容COBOL、JCL等传统专有系统及遗留语言
- 捕获隐性知识（操作逻辑与原理）以构建永久性企业知识资产
- 被誉为最全面的AI驱动大型机现代化解决方案
- 助力金融、制造、政府等行业保存关键知识资产
- 现已开放早期体验，可将组织知识转化为可检索的数字资产
ClickHouse acquires LibreChat, open-source AI chat platform
6 months ago
- ClickHouse收购开源AI聊天平台LibreChat，将其融入面向代理的分析愿景。
- LibreChat增强ClickHouse分析能力，使大规模数据集分析代理的创建更便捷。
- Shopify采用LibreChat构建内部AI工具，称赞其全面普及与生产力提升效益。
- cBioPortal利用ClickHouse和LibreChat实现癌症基因组数据交互，提升科研可及性。
- Fetch运用ClickHouse进行AI驱动的商业智能，强调代理分析是数据交互的未来。
- SecurityHQ与戴姆勒卡车采用LibreChat实现安全内部AI访问，强化合规与创新。
- ClickHouse内部使用LibreChat处理约70%数据仓库查询，显著提高生产效率。
- 代理分析将传统工作流从数天压缩至秒级，极大加速洞察获取速度。
- ClickHouse内部代理Dwaine每日处理数百万LLM token，彻底改变数据访问方式。
- LibreChat保持100%开源，计划增强企业级分析功能及ClickHouse集成。
- 未来更新包括ClickHouse Cloud无缝集成、可视化改进及安全方案升级。
- LibreChat的代码解释器API将于6个月后停用，已为用户制定迁移计划。
European Commission plans “digital omnibus” package to simplify its tech laws
6 months ago
- 欧盟官员愿意放宽隐私规则以促进人工智能发展。
- 一项'数字综合'方案将简化科技法规，包括对《通用数据保护条例》的修订。
- 这些变革旨在提升欧洲在人工智能领域的经济竞争力。
Meta Omnilingual ASR: Advancing Automatic Speech Recognition for 1600 Languages
6 months ago
- Meta旗下FAIR团队推出Omnilingual ASR系统，支持超过1,600种语言，包含500种低资源语言
- 开源Omnilingual wav2vec 2.0——70亿参数的多语言语音表征模型
- 发布Omnilingual ASR语料库，涵盖350种弱势语言的转录语音数据
- 推出两种架构变体：增强版wav2vec 2.0编码器与面向字符标记的双解码器方案
- LLM-ASR实现突破性表现，78%语言字符错误率低于10%
- 情境学习技术仅需少量音频-文本样本即可转录未支持语言
- 发布全系列模型（轻量级3亿参数版至旗舰70亿参数版），均采用Apache 2.0许可
- 与全球合作伙伴及本土社区协作，收集并转录弱势语言数据
- Omnilingual ASR语料库成为现有最大规模的超低资源自发语音识别数据集
Ultra-flat optic pushes beyond what was previously thought possible
6 months ago
- 摄像头已成为现代生活中不可或缺的设备，广泛应用于智能手机、安防系统和卫星领域。
- 超薄光学元件（如超透镜）为传统笨重的相机镜头提供了更小巧轻便的替代方案。
- 色差问题一直是限制大孔径超薄光学元件生成高质量彩色图像的主要瓶颈。
- 华盛顿大学ECE与普林斯顿大学的研究团队成功研制出大孔径超透镜，其成像质量可与传统镜头媲美。
- 该超透镜厚度仅1微米，体积比标准镜头小数百倍，能显著节省空间、重量及设备能耗。
- 潜在应用场景涵盖智能手机摄像头、无人机、医疗器械及卫星系统。
- 研究采用人工智能计算优化光学系统，有效降低图像光晕，提升色彩还原度。
- 未来研究将聚焦图像质量精进，并探索可见光谱外光线捕捉等新模态。
- 该技术已引发医疗和科技行业的商业化兴趣。
- 此项研究突破了光学领域的认知局限，为未来发展开辟了新路径。
Hazel (YC W24) Is Hiring Full Stack Engineers
6 months ago
- Hazel运用人工智能改造美国政府采购体系，在每年2.7万亿美元的市场中追求速度、效率和成本效益
- 政府采购因流程复杂、监管问题及人员超负荷导致效率低下，造成数十亿美元浪费及安全隐患等严重后果
- Hazel的使命是通过尖端AI技术解决采购难题，应对气候可持续性和国家安全等关键议题
- 公司与州/地方政府及教育机构(SLED)和联邦机构合作，覆盖从需求识别到授标管理的全采购生命周期
- Hazel工程师构建安全可扩展的AI系统，端到端负责功能开发，并与政府合作伙伴紧密协作以确保解决方案实效
- 团队崇尚使命驱动文化，注重问题解决、持续学习与协作精神，致力于为政府伙伴提供世界级创新方案
- Hazel的命名源自二战时期华裔女飞行员李月英，象征突破壁垒与开拓创新的精神
- 公司提供具有竞争力的薪资(12-20万美元)及股权激励(0.5%-1%)，诚邀全栈工程师加入这支充满活力的使命型团队
Show HN: Linnix – eBPF observability that predicts failures before they happen
6 months ago
- Linnix提供基于eBPF技术的Linux可观测性方案，并可选配AI事件检测功能。
- 核心功能包括轻量级CPU/内存遥测、进程生命周期追踪和实时事件流处理。
- linnix-3b模型现已发布，可提供AI驱动的智能分析（量化模型仅2.1GB）。
- 相比传统监控工具，Linnix实现零开销（CPU占用<1%）。
- 具备成本效益，采用Apache-2.0开源协议，支持多节点集群生产环境部署。
- 内置规则引擎可检测fork风暴、CPU突增等异常事件。
- 5分钟快速安装，提供可视化仪表板实时展示数据。
- 支持Prometheus集成，开放REST API接口供定制开发。
- 兼容所有OpenAI接口规范的LLM模型（包括本地模型）进行智能分析。
- 提供完整文档体系与社区技术支持服务。
Yann LeCun reportedly leaving Meta to launch new AI startup
6 months ago
- Meta首席AI科学家Yann LeCun据传将离职创办自己的AI初创公司
- LeCun正与投资者进行初期洽谈，但新公司的具体方向尚未公布
- 其离职源于对Meta内部论文发表规则及FAIR研究组重组的不满
- LeCun已与Meta的Llama模型保持距离，并公开批评公司的政治立场
- 他计划用联合嵌入预测架构(JEPA)挑战大语言模型(LLM)霸权，重点突破推理与规划能力
Adk-go: code-first Go toolkit for building, evaluating, and deploying AI agents
6 months ago
- 一个开源、代码优先的Go工具包，用于构建、评估和部署AI智能体
- Agent Development Kit (ADK) 是用于创建AI智能体的灵活模块化框架
- 专为Gemini优化，但兼容任意模型与部署环境
- 完美适配云原生应用，充分发挥Go语言的并发与性能优势
- 特性包括：符合Go语言习惯、丰富工具生态、代码优先开发、模块化多智能体系统、随处可部署能力
- 添加ADK Go到项目的方法：`go get google.golang.org/adk`
- 基于Apache 2.0许可证，部分例外情况已标注
I can build enterprise software but I can't charge for it
6 months ago
- 一名伊朗开发者耗时18个月打造了名为NeoClerks的AI数字人平台，与Soul Machines等资金雄厚的公司直接竞争
- 该平台具备3D超写实虚拟形象、47种语言实时对话功能和企业级基础设施，但因伊朗经济政治环境限制至今零客户
- 国际制裁导致开发者无法使用Stripe等支付系统或AWS云服务，在伊朗境内难以实现商业化
- 当地市场因经济崩溃、货币贬值及波斯语AI质量不如ChatGPT等免费产品而不具备可行性
- 开发者正寻求海外合伙人或联合创始人负责销售、支付处理和运营，提供股权合作或收益分成方案
- 该平台已完成生产级开发，拥有详尽技术文档和AI验证代码，但缺乏品牌建设、营销素材和客户案例
- 潜在合作伙伴包括数字代理商、SaaS创业者或拥有B2B客户资源的企业IT服务商
- 合作模式涵盖股权合作、整体收购或收益分成，并附有详细的业务扩展路线图
- 尽管面临技术与市场双重挑战，开发者仍坚持产品开发，正寻找能助力商业化的市场合作伙伴
Learning to Model the World with Language
6 months ago
- Dynalang是一种通过学习理解和利用多样化语言来预测未来观察、世界行为和奖励的智能体。
- 它采用多模态世界模型来预测未来的文本和图像表征，通过模拟模型推演提升任务表现。
- Dynalang可在无需动作或奖励的文本/视频数据集上进行预训练，从而受益于大规模离线数据。
- 该智能体在网格世界和逼真家庭导航等任务中超越了最先进的强化学习算法和专用架构。
- Dynalang将语言理解与未来预测相统一，能有效处理环境描述、游戏规则和操作指令。
- 它将视频和文本建模为统一序列（类似人类感知方式），同时提升了预训练和强化学习性能。
- 该智能体还能生成基于环境实景的语言，展现了具身问答方面的能力。
- 在通用文本数据上预训练的Dynalang表现出下游任务性能提升，印证了其架构的通用性。
Yann LeCun reportedly plans to leave Meta to build his own startup
6 months ago
- Meta首席AI科学家杨立昆（Yann LeCun）据传计划离职创业，将成立一家专注人工智能的初创公司
- 该初创公司将聚焦'世界模型'领域——通过模拟环境预测结果的AI系统，谷歌DeepMind等机构也在探索这一方向
- Meta正经历AI战略重大调整：从竞争对手处挖角50多名工程师，并向Scale AI投资143亿美元
- Meta内部重组导致AI部门混乱，新员工受困于官僚主义，原有团队则面临业务范围收缩
- 杨立昆对当前AI（尤其是大语言模型）的炒作热潮持怀疑态度，认为其尚无法解决复杂的人类问题
Germany Fines OpenAI for Illegally Using Song Lyrics to Train ChatGPT
6 months ago
- 慕尼黑法院裁定OpenAI在训练数据中使用歌词的行为侵犯了德国版权法，并判令向创作者支付赔偿
- 法院认定OpenAI内部存储歌词及ChatGPT输出歌词的行为均构成侵权
- 代表逾10万作曲家和出版商的德国音乐作品版权协会（GEMA）于2024年11月就九首未获授权的德文歌曲提起诉讼
- OpenAI辩称其系统根据模式调整设置而非复制具体作品，且用户应对输出内容负责——两项主张均被驳回
- OpenAI对判决表示异议，称其仅涉及有限歌词集，不影响德国日常用户使用
- GEMA称此案是欧洲首例关于AI训练使用版权材料的重大裁决，为创意作品保护开创先例
- 德国记者协会盛赞该判决是版权法里程碑，可能影响美国针对OpenAI的多起诉讼
ByteDance unveils China's most affordable AI coding agent at just US$1.30/month
6 months ago
- 字节跳动推出中国最实惠AI编程助手，月费仅1.3美元
- 豆包-种子代码模型月费40元，双十一期间推出促销折扣
- 字节跳动AI采用率增长巩固其全球AI领军企业地位
- 新模型性能对标Anthropic的Claude Sonnet等主流系统
- Anthropic限制中国子公司访问权限，反映全球AI领域两极分化
The PowerPC Has Still Got It (Llama on G4 Laptop)
6 months ago
- 2005年款PowerBook G4成功运行了现代大语言模型(LLM)，这台过时设备展现了惊人的潜力
- 苹果PowerPC处理器是二十年前M系列芯片的前身，作为定制芯片其性能优劣至今存在争议
- Andrew Rossignol改造开源LLM推理引擎llama2.c，使PowerBook G4能运行1.1亿参数的TinyStories模型
- PowerPC的大端序架构需要数据转换和手动内存对齐，这与现代小端序系统存在根本差异
- 运行速度仅0.77词元/秒，但启用AltiVec矢量指令集后微升至0.88词元/秒
- 尽管受限于硬件配置(1GB内存/32位CPU)，这项实验证明经过优化后PowerBook G4仍可运行现代AI

About|Login

#ai

AI for Senior Software Engineers

AI-powered nimbyism could grind UK planning system to a halt, experts warn

Show HN: Serve 100 Large AI models on a single GPU with low impact to TTFT

My Git history was a mess of 'update' and 'fix' – so I made AI clean it up

LLMs are steroids for your Dunning-Kruger

Launch HN: Hypercubic (YC F25) – AI for COBOL and Mainframes

ClickHouse acquires LibreChat, open-source AI chat platform

European Commission plans “digital omnibus” package to simplify its tech laws

Meta Omnilingual ASR: Advancing Automatic Speech Recognition for 1600 Languages

Ultra-flat optic pushes beyond what was previously thought possible

Hazel (YC W24) Is Hiring Full Stack Engineers

Show HN: Linnix – eBPF observability that predicts failures before they happen

Yann LeCun reportedly leaving Meta to launch new AI startup

Adk-go: code-first Go toolkit for building, evaluating, and deploying AI agents

I can build enterprise software but I can't charge for it

Learning to Model the World with Language

Yann LeCun reportedly plans to leave Meta to build his own startup

Germany Fines OpenAI for Illegally Using Song Lyrics to Train ChatGPT

ByteDance unveils China's most affordable AI coding agent at just US$1.30/month

The PowerPC Has Still Got It (Llama on G4 Laptop)