Visual Studio Code: Text Buffer Reimplementation (2018)a year agohttps://code.visualstudio.com/blogs/2018/03/23/text-buffer-reimplementationVS Code 1.21 引入了新的文本缓冲区实现以提升性能和内存效率旧版本采用行数组实现,在处理大文件时效率低下最终选用分块表数据结构来降低内存占用并提高性能通过添加行缓存加速查找,并采用平衡二叉树优化搜索效率新实现显著降低了内存占用,同时缩短了文件打开时间编辑性能在不同文件大小下保持稳定,但某些情况下的行查找速度有所下降团队评估过原生C++实现方案,最终因性能权衡决定不予采用未来优化方向包括减少不必要的getLineContent调用以及改进查找命令
Gemini 2.5 Flash Preview 05-20a year agohttps://ai.google.dev/gemini-api/docs/modelsGemini 2.5 Pro是最强大的模型,具有最高的响应准确性和最先进的性能,专为复杂编码、推理和多模态理解优化。Gemini 2.5 Flash提供最佳性价比,具备全面能力和自适应思维,适合低延迟、高吞吐量任务。Gemini 2.0 Flash具备下一代特性、增强功能及100万token上下文窗口,专为高速和实时流式传输设计。Gemini 2.0 Flash预览版图像生成支持对话式图像生成与编辑,在特定地区存在功能限制。Gemini 1.5 Pro针对复杂推理任务优化,可处理大型数据集(包括2小时视频或19小时音频)。Imagen 3是最高质量的文生图模型,能生成细节丰富、光线更自然且伪影更少的图像。Veo 2是高质量的文本/图像转视频模型,可生成具有艺术细节的精细视频。Gemini 2.0 Flash Live支持低延迟双向语音视频交互,能处理文本、音频和视频输入。Gemini Embedding Experimental在代码、多语言和检索任务中达到最先进性能。文本嵌入模型可测量文本字符串相关性,广泛应用于AI领域,具有不同维度尺寸和速率限制。
"ZLinq", a Zero-Allocation LINQ Library for .NETa year agohttps://neuecc.medium.com/zlinq-a-zero-allocation-linq-library-for-net-1bb0a3e5c...ZLinq 是一个零分配的 .NET LINQ 库,利用结构体和泛型消除内存分配。它包含 LINQ to Span、LINQ to SIMD 和 LINQ to Tree(文件系统、JSON、游戏对象等)等扩展功能。ZLinq 支持 .NET Standard 2.0、Unity 和 Godot 等多平台,GitHub 星标数已突破 2000。该库实现了 .NET 10 中所有方法和重载的 100% 覆盖,确保 99% 的行为兼容性。除减少分配外,ZLinq 还通过 SIMD 支持等优化手段,在多数场景下实现性能超越。其架构基于 ValueEnumerable<TEnumerator, T> 和 IValueEnumerator<T>,减少了方法调用和结构体大小。ZLinq 为树形结构提供 LINQ to Tree,内置对文件系统、JSON、Unity 的 GameObject 和 Godot 的 Node 的标准实现。该库避免商业化,尽管维护者承受精神压力,仍专注于维护与创新。ZLinq 的开发受到社区反馈和贡献的影响,持续完善兼容性与性能优化。
JavaScript Ecosystem Performancea year agohttps://e18e.dev/移除冗余依赖项并用现代替代方案替换。e18e(生态系统性能)计划连接致力于提升JS包性能的个人与项目。为开源开发者在依赖项的清理、升级和加速方面的工作提供可见性。邀请通过e18e Discord服务器加入项目并与志同道合的人建立联系。赞助支持社区工作,奖励贡献者或资助大型项目。可通过Open Collective赞助以提供帮助的机会。
Fast Allocations in Ruby 3.5a year agohttps://railsatscale.com/2025-05-21-fast-allocations-in-ruby-3-5/Ruby 3.5在对象分配方面实现了显著的速度提升,最高可达六倍性能提升基准测试对比了带/不带YJIT时的位置参数和关键字参数性能,均显示持续加速效果位置参数在不使用YJIT时获得1.8倍加速,使用YJIT时达2.3倍,且与参数数量无关关键字参数随着参数增多加速效果递增:无YJIT时最高3倍,启用YJIT时超过6.5倍该优化通过内联`Class#new`方法实现,消除了堆栈帧和参数拷贝操作内联机制提高了内联缓存命中率,并避免Ruby与C调用约定间的转换开销存在微小向后兼容问题:堆栈追踪中将缺失`Class#new`帧信息内存占用因调用点指令增加略有上升,但影响轻微(指令序列大小仅增长0.5%)
Making the rav1d Video Decoder 1% Fastera year agohttps://ohadravid.github.io/posts/2025-05-rav1d-faster/对rav1d(dav1d AV1解码器的Rust移植版)进行了性能优化探索确定了两项关键优化:避免缓冲区零初始化和优化小型数值结构体的相等比较第一项优化使用MaybeUninit避免不必要的缓冲区初始化,运行时间减少1.2秒(1.5%)第二项优化用字节比较替代字段逐一比较,运行时间减少0.5秒(0.7%)这些改动使rav1d与dav1d的性能差距缩小约30%,剩余差异为6%通过性能剖析对比Rust与C实现的差异,重点分析特定函数和汇编调用优化实施过程中未引入新的unsafe代码,在提升性能的同时保持了安全性
Show HN: Pi Co-pilot – Evaluation of AI apps made easya year agohttps://withpi.ai/Pi Scorer 精准度极高且速度惊人。在准确性上超越了Deepseek和GPT 4.1。以GPT Mini和Gemini Flash的模型大小与速度运行。能在100毫秒内完成20多个自定义维度的评分。
TypeScript Native Previewsa year agohttps://devblogs.microsoft.com/typescript/announcing-typescript-native-previews/TypeScript 原生预览版现已通过 npm 和 VS Code 市场提供下载。原生 TypeScript 编译器 'tsgo' 速度提升10倍,并支持 JSX 和 JavaScript+JSDoc 类型检查。VS Code 编辑器功能处于早期阶段,目前仅实现自动补全,其他功能尚待开发。API 进展包括新增基于 IPC 的通信层,以及用 Rust 编写的同步 Node.js 模块。已知差异包括已弃用 'node' 解析模式等特性,且对低版本语法转换支持有限。未来更新将重点完善编译器功能(如 '--build' 模式)并扩展编辑器支持范围。
Poireau: A Sampling Allocation Debuggera year agohttps://github.com/backtrace-labs/poireaulibpoireau库通过拦截少量malloc/calloc调用来生成堆内存使用概览计划实现类似Electric Fence的防护页机制以增强安全性采用采样方法将性能影响降至最低,适合生产环境使用将复杂性转移至内核或外部脚本,相比LeakSanitizer/Valgrind等工具侵入性更低通过报告旧分配而非扫描引用,可有效检测缓慢的堆增长问题目标平台为Linux 4.8+ 64位系统(4KB内存页)要求GCC兼容的C11实现并通过LD_PRELOAD进行插桩利用Linux perf子系统进行跟踪点注册和事件生成提供SIGHUP/SIGUSR1/SIGUSR2信号与poireau.py交互获取分配报告性能开销:中小型分配5-20%,大型分配约70%包含基于xoshiro 256+ 1.0(公有领域)和Systemtap sys/sdt.h的衍生代码
Faster Firewalls with Bpfiltera year agohttps://lwn.net/Articles/1017705/Bpfilter是一个通过使用BPF(伯克利数据包过滤器)来提升网络流量过滤性能的项目该项目于2018年提出,通过将过滤规则转换为BPF程序来增强iptables性能Bpfilter包含三个组件:bpfilter守护进程、libbpfilter库和bfcli命令行工具该项目支持iptables和nftables,不过当前nftables支持存在缺陷,计划在2025年进行重构Bpfilter将规则转换为BPF字节码,随后加载到内核中实现高效的数据包过滤性能测试表明,在性能下降前,bpfilter处理大型规则集比iptables和nftables更高效未来计划包括改进nftables支持、集成用户提供的BPF程序以及通用集合功能
Short alphanumeric pseudo random identifiers in Postgresa year agohttps://andyatkinson.com/generating-short-alphanumeric-public-id-postgres介绍在Postgres中生成短字母数字标识符作为UUID替代方案对外使用public_id,内部数据库引用使用id设计特性包括固定长度、混淆处理、可逆性及原生Postgres支持能力局限性包括不支持大小写不敏感和排除相似字符PL/PgSQL函数实现混淆处理、base62转换及反混淆功能表结构设计包含自动生成的public_id列及唯一性和长度约束性能影响:带public_id生成的插入操作慢3.4倍考虑过的替代方案:Base32 Crockford、ULID和NanoID
Starlite V Linux Tablet Updateda year agohttps://us.starlabs.systems/pages/starlite采用英特尔Alder Lake N350处理器和16GB内存,设计紧凑且性能强劲。无风扇0分贝设计,配备多样化连接选项:WiFi 5、蓝牙5.1、微型HDMI、USB-C、微型SD卡槽及耳机接口。安全启动流程、轻量级固件(POST时间仅0.76秒),并通过高级配置界面实现无限固件定制。2K分辨率显示屏(2160x1440),亮度达300尼特,178°广视角。微型65W氮化镓充电器,体积比传统充电器小30%。通过LVFS(Linux供应商固件服务)轻松实现固件更新。开放1年保修政策,允许硬件改装且不影响保修权益。高度可定制的硬件与固件,预装用户自选操作系统。
Show HN: Zasper – A High Performance IDE for Jupyter Notebooksa year agohttps://github.com/zasper-io/zasper-benchmarkZasper在所有测试指标上均优于Jupyter Server,包括CPU和内存占用。Zasper的CPU使用量比Jupyter Server低5倍,内存占用低40倍。Zasper在64个内核、每个内核10 RPS的负载下仍保持性能,而Jupyter Server在此负载下崩溃。Zasper能更优雅地从过载状态恢复,仅在极端高负载下才会失败。Zasper专为大规模并发设计,具有极低内存占用和卓越速度。基准测试聚焦CPU使用率、内存占用、吞吐量、延迟和恢复能力。Jupyter Server在较低请求吞吐量时就会因消息队列问题和Python的可扩展性限制而崩溃。Zasper基于Go的架构相比Jupyter基于Python的架构提供更优性能和可扩展性。Zasper在高负载下效率反而提升,适合大规模部署。Zasper具备更快的响应速度、轻量化运行、成本效益和更优的可扩展性。
Rust Coreutils 0.1.0 Releasea year agohttps://github.com/uutils/coreutils/releases/tag/0.1.0Rust Coreutils 0.1.0版本发布,带来显著性能提升和SELinux支持cp/ls/mkdir/stat等命令新增SELinux集成,现提供CI测试支持cat/ls/wc/tail等命令性能提升,达到或超越GNU工具水平Ubuntu计划将Rust Coreutils集成至基础系统本次发布包含843次提交,来自60多位贡献者(含40位新成员)GNU测试套件兼容性提升至84.46%(原82.17%)通过GitHub赞助计划呼吁资金支持项目发展多项工具命令更新与错误修复全项目依赖项更新与代码质量优化文档更新并新增贡献者致谢名单
Rust Coreutils 0.1 Released with Big Performance Gains – Matches or Exceeds GNUa year agohttps://www.phoronix.com/news/Rust-Coreutils-0.1-ReleasedRust Coreutils 0.1 版本发布,性能大幅提升。wc、ls、cat、tail 和 seq 等命令的性能达到或超过 GNU Coreutils。为 cp、mkdir、ls 和 install 等命令添加了 SELinux 集成支持。GNU Coreutils 兼容性改进,现已通过 GNU 测试套件中的 522 项测试(之前为 507 项)。Ubuntu 25.10 计划默认搭载基于 Rust 的 Coreutils (uutils)。
Btrfs to See More Performance Improvements with Linux 6.16a year agohttps://www.phoronix.com/news/Linux-6.16-Btrfs-PerformanceLinux 6.16中Btrfs性能改进包括将extent buffer转换为xarray,使元数据密集型操作的吞吐量提升50%,运行时间减少33%。Extent IO树的清理和优化通过避免不必要的搜索带来性能提升。在事务提交期间更高效的extent unpinning操作预计可减少3-5%的运行时间。用户可见变更:移除已弃用的'nologreplay'挂载选项、更新scrub报告功能、恢复设备统计信息显示。核心更新:增强subpage模式、改进zoned模式对ENOSPC的处理、简化scrub位图、为large folio做准备。新增支持:压缩、缓冲写入、碎片整理、打洞操作、subpage及send操作。错误修复:确保无硬链接文件的fsync持久性、拒绝非节点大小对齐的树块。代码清理:优化事务中止位置、移除struct bio_vec内部结构使用、简化extent map、增强ASSERT()宏。
Improving performance of original dav1d video decodera year agohttps://code.videolan.org/videolan/dav1d/-/merge_requests/1788通过将结构体大小缩减至64字节或更小,优化CPU缓存行的内存组织手动将枚举对齐到严格值以适配1字节空间并优化存储利用率将结构体中的'int'压缩为'uint16_t'(2字节)以减少内存浪费使用'pahole'工具识别并优化结构体空洞,提升缓存效率实现性能提升:1080p分辨率下约3%,4K分辨率下约1%将'Dav1dFrameContext'结构体从5648字节缩减至5384字节,节省4个缓存行通过新旧服务器上的'hyperfine'基准测试,显示出稳定的性能增益强调了数据对齐和结构优化对64位处理器的重要性论证了优化现有C/C++项目比用Rust等新语言重写更具实用性
Calendars, Contacts and Files in Stalwarta year agohttps://stalw.art/blog/collaboration/Stalwart v0.12版本新增对日历、联系人和文件存储的原生支持,无需再依赖第三方集成服务该版本包含CalDAV、CardDAV和WebDAV协议支持,可实现事件、联系人及文档的无缝管理全面支持共享资源(如团队日历和可协作访问的文件文件夹),显著提升协作效率改进的垃圾邮件过滤功能与用户个人通讯录联动,降低误判率并实现贝叶斯分类器的自动训练性能优化包含增量缓存和零拷贝反序列化技术,有效降低系统负载并提升响应速度集群协调机制升级,适配多种协议:小规模部署采用Eclipse Zenoh,大型环境可选Kafka/Redpanda/NATS/Redis未来更新将包含CalDAV日程安排(RFC 6638)、事件通知提醒,以及日历/联系人/文件存储的JMAP协议支持
Yes-rs: A fast, memory-safe rewrite of the classic Unix yes commanda year agohttps://github.com/jedisct1/yes-rsyes-rs 是用 Rust 语言重写的 Unix 'yes' 命令,具有内存安全性和极快的速度。原始的 C 语言版 'yes' 命令容易发生缓冲区溢出,且缺乏现代的错误处理机制。yes-rs 具有零成本抽象、无畏并发特性,且不含任何非安全代码块。可通过 'cargo install yes-rs' 安装或从源代码构建。基准测试显示 yes-rs 明显快于 GNU 的 'yes' 命令。项目鼓励遵循 Rust 内存安全性和性能原则的贡献。建议在 Hacker News 等平台推广以提高知名度。
LumoSQLa year agohttps://lumosql.org/src/lumosql/doc/trunk/README.mdLumoSQL是SQLite的改进版本,新增了安全性、隐私性、性能优化和度量功能它支持可插拔后端存储引擎,包括SQLite Btree、LMDB和伯克利数据库LumoSQL引入了现代加密技术(如基于属性的加密)和行级校验和以实现错误检测该项目采用MIT许可证,并得到NLNet基金会的支持LumoSQL可运行于x86、ARM-32、RISC-V架构及各类Linux/BSD操作系统使用'非分叉'工具追踪上游变更,避免直接分叉SQLite代码库基准测试是其核心特性,支持不同配置间的性能对比项目通过Fossil仓库维护,鼓励开发者通过论坛参与贡献旨在展示那些可能不符合SQLite保守发展路线的改进方案当前限制包括部分后端支持不完善及测试覆盖率不足