lsr: ls with io_uring10 months agohttps://tangled.sh/@rockorager.dev/lsrlsr是一个类似ls的命令行工具,但通过io_uring进行了性能优化安装需要Zig 0.14.0版本,可通过带特定参数的`zig build`命令完成使用方式支持多种显示选项,如`--all`、`--long`及各类排序参数基准测试表明lsr在速度和系统调用效率上优于ls、eza、lsd和busybox等工具性能指标展示了不同文件数量下的表现,突显lsr结合io_uring的高效性
Fcrand (Go language): drop-in replacement for crypto/rand, up to 10x faster10 months agohttps://github.com/sdrapkin/fcrandfcrand 是 Go 语言 crypto/rand 的高性能直接替代方案对于≤512字节的随机数据请求,它提供高达10倍的性能提升,同时保持加密安全性100% API 兼容 crypto/rand,实现真正的无缝替换与 crypto/rand 相同,零配置且线程安全通过 `go get -u github.com/sdrapkin/fcrand` 安装,导入方式为 `rand "github.com/sdrapkin/fcrand"`支持 FIPS-140 标准,通过环境变量 `GODEBUG=fips140=on` 启用性能基准测试显示小数据请求有显著加速,512+字节时回退至 crypto/rand 的性能水平包含增强功能方法如 `.Text()` 和 `.Prime()`
Subreply – an open source text-only social network10 months agohttps://github.com/lucianmarin/subreply微型但强大的社交网络,访问地址:subreply.com使用命令 pip3 install -r requirements.txt 安装依赖运行数据库迁移命令:python3 manage.py migrate创建 project/local.py 文件并用 cryptography.fernet 生成 SIGNATURE性能目标:每个页面请求速度在50毫秒或更低代码质量:干净、易读且易于修改
Optimizations That Aren't10 months agohttps://zeux.io/2010/11/29/optimizations-that-arent/优化不应为了优化而优化,否则会降低代码可读性并引入错误遵循结构化优化流程:确保代码正常工作 -> 精确测量性能 -> 验证是否符合需求 -> 记录结果 -> 实施优化 -> 重新验证每次优化前后必须进行性能分析,以确认改进效果并避免性能倒退一个COLLADA导出器的实际案例警示:未经性能分析的优化会导致算法复杂度暴增至平方级缺乏优化前后性能分析的改进是无效的,反而可能导致性能严重劣化
RE#: high performance derivative-based regex matching with intersection, complem10 months agohttps://arxiv.org/abs/2407.20479RE#是一款基于符号导数的正则表达式匹配工具它避免了回溯问题,支持补集、交集以及环视等高级操作该匹配算法在理论和实验上均具有输入线性复杂度在基准测试中,RE#比Rust语言中第二快的正则引擎提速超71%在扩展测试集上,其性能通常以数量级优势超越现有最先进的引擎
Show HN: Pogocache – Fast caching software10 months agohttps://github.com/tidwall/pogocachePogocache是一款专为低延迟和CPU效率设计的高速缓存软件,性能卓越。在速度和效率方面,它超越了Memcache、Valkey、Redis、Dragonfly和Garnet等其他缓存解决方案。Pogocache支持多种通信协议,包括Memcache、Valkey/Redis、HTTP和Postgres,具有高度通用性。可作为独立服务器程序运行,也能直接嵌入现有软件中以获得更高性能。针对单线程和多线程场景均进行了优化,能充分利用多核CPU的算力优势。安全功能包括TLS支持和可选的连接认证机制。该软件专为64位Linux和MacOS系统设计。具备内存回收策略、条目过期机制和高效内存管理等特性。未来规划包括领域专用集成、共享内存访问和企业级工具支持。采用AGPL开源协议,同时提供商业支持选项。
Common Expression Language – Fast, safe expression language10 months agohttps://cel.dev/通用表达式语言(CEL)是一种快速、便携且安全的表达式语言。CEL专为嵌入具有特定扩展功能的应用程序而设计。非常适合在性能关键型应用中扩展声明式配置。典型用例包括列表过滤器、验证约束和授权规则。CEL能安全快速地进行求值,适合高频评估场景。最适合表达式频繁求值但很少修改的应用程序。示例用例:根据安全策略评估HTTP请求。可查阅CEL概述和语言定义以进一步探索。
Show HN: Go Command-streaming lib for distributed systems (3x faster than gRPC)10 months agohttps://github.com/cmd-stream/cmd-stream-gocmd-stream-go 是一个基于命令模式的高性能、模块化Go语言客户端-服务器库支持通过TCP/TLS实现高效低延迟的流式通信与可观测性客户端向服务器发送命令,由调用者执行,接收器提供服务器端功能特性包括:TCP/TLS/mTLS支持、异步客户端、服务器流式传输、重连、保活、熔断器模式、OpenTelemetry集成和模块化设计子模块代码覆盖率高达90%,主模块包含基础集成测试性能优化建议:使用N个并行连接、预建立连接、保持长连接可作为现有RPC系统的更快速传输层模块化架构包含core-go、delegate-go、handler-go和transport-go子模块设计上支持轻松替换库的任何组件
Pogocache 1.0 – Claims Better Performance Than Memcache, Valkey and Redis10 months agohttps://www.phoronix.com/news/Pogocache-1.0-ReleasedPogocache 1.0作为一款快速开源缓存软件发布宣称性能优于Memcache、Valkey、Redis、Garnet和Dragonfly支持多协议:Memcache、Valkey、Redis、HTTP及Postgres采用C语言编写并以AGPLv3协议开源与竞品的性能基准测试及未来发展仍有待观察
Hyperpb: 10x faster dynamic Protobuf parsing that's faster than generated code10 months agohttps://buf.build/blog/hyperpbhyperpb是一个完全动态的Protobuf解析器,其速度比dynamicpb快10倍,比使用生成代码解析快3倍。在基准测试中,它匹配甚至超越了vtprotobuf生成代码的性能,同时不牺牲正确性。hyperpb能以类型感知的方式处理和验证大量任意流式数据。该项目是为解决构建Bufstream时遇到的性能瓶颈而开发,实现了基于Protobuf的代理端验证。hyperpb全面支持proto2、proto3和editions模式的所有模式,与Protobuf Go完美兼容。该解析器需要在运行时编译(类似正则表达式库),并包含配置文件引导优化等高级功能。hyperpb已开源以促进Protobuf的广泛采用,并邀请社区参与共同改进。Buf公司正在招聘有意从事hyperpb等创新项目的开发者。
Show HN: Quite Fast, sharded cache for Go with LRU/LFU, TTL and object pooling10 months agohttps://github.com/unkn0wn-root/kioshunKioshun缓存库基准测试结果显示GET操作性能高达3.26亿次/秒通过`go get github.com/unkn0wn-root/kioshun`即可简单安装快速入门示例演示了Set、Get、Delete等基础缓存操作配置选项包含MaxSize(最大容量)、ShardCount(分片数)、CleanupInterval(清理间隔)、DefaultTTL(默认存活时间)和EvictionPolicy(淘汰策略)采用分片架构减少锁竞争,支持根据CPU核心数自动分片及最优分片数量API参考包含Set、Get、Delete、Exists、Clear、Size、Stats、Close等方法HTTP中间件兼容多种框架(Gin/Echo/Chi/Gorilla Mux),支持可配置的缓存策略缓存失效设置需基于路径的键生成器才能实现模式匹配失效功能
XOR_singleheader: Header-only binary fuse and XOR filter library10 months agohttps://github.com/FastFilter/xor_singleheader布隆过滤器用于快速检查集合成员关系,但异或过滤器和二进制保险丝过滤器是更快速、更简洁的替代方案。二进制保险丝过滤器和异或过滤器天然具有可压缩性,且比布谷鸟过滤器更小巧。该库仅需头文件即可使用,同时实现了二进制保险丝和异或过滤器,并在Apache许可证下开源。基本用法包括通过`binary_fuse8_allocate`、`binary_fuse8_populate`和`binary_fuse8_contain`等函数分配、填充和查询过滤器。提供8位和16位版本,其中16位版本以更多内存为代价提供更低的误报概率。序列化选项包含解包(更快)和打包(更小但更慢)两种格式。构建二进制保险丝过滤器需要临时内存(约每个条目24字节),但也可以通过较慢的速度使用最小临时内存完成。该库包含测试和基准测试工具,用于评估性能和正确性。欢迎提交错误报告和修复,但本项目不追求在所有静态分析工具下完全无警告。
New Aarch64 Back End10 months agohttps://ziglang.org/devlog/2025/#2025-07-23Andrew Kelley和Jacob Young引入的新Aarch64后端,通过79%的行为测试并带来显著性能提升在预定的Zig SHOWTIME节目中讨论了2026年Zig发展路线图实现并行自托管代码生成,编译速度提升5%至50%自托管x86后端现成为Debug模式默认选项,编译速度超越LLVMLoris Cro发布Zig构建系统入门视频,详解软件包创建与模块导入新增FreeBSD和NetBSD交叉编译支持,可为目标系统构建二进制文件网站升级至Zine 0.10.0版本,转型为具备新功能的独立可执行程序改进的UBSan错误信息为C语言交互中的未定义行为提供清晰诊断无Libc的Zig现已在内存分配和性能基准测试中超越Glibc版ZigAlex Rønne Petersen开发的LLDB分支增强了自托管后端的调试支持
High-Performance Shell Kit10 months agohttps://tinyidea.net/idea/idea-m8kq7px3ps开发者面临命令行工具运行缓慢且臃肿的问题。Oh My Zsh等流行框架导致启动延迟和复杂性增加。用户不得不在性能低下和手动配置之间做出选择。高性能Shell工具包提供开箱即用的轻量级解决方案。内置提示符定制、模糊搜索和自动补建议等一流工具。提供快速、强大且即装即用的终端体验。通过简易安装程序消除臃肿组件和繁琐的手动配置。
Final Benchmarks of Clear Linux on Intel: ~48% Faster Than Ubuntu Out-of-the-Box10 months agohttps://www.phoronix.com/review/clear-linux-48p-ubuntu英特尔已终止Clear Linux项目,这是一个针对x86_64处理器优化的高性能Linux发行版Clear Linux曾以激进的编译器调优、内核补丁和全系统优化著称,在英特尔和AMD硬件上均保持性能领先最终基准测试显示,在英特尔至强Max服务器上,Clear Linux开箱即用的性能比Ubuntu 25.04快约48%Clear Linux针对AVX-512及更新的英特尔指令集架构特性进行了深度优化,使其成为高性能计算的理想选择基准测试在搭载双路至强Max 9468处理器、512GB内存和NVMe存储的超微Hyper SuperServer上进行Clear Linux 43760采用Linux 6.15.5内核、GCC 15.1.1和Python 3.13,而Ubuntu 25.04使用Linux 6.14、GCC 14.2和Python 3.13Ubuntu 25.04默认使用'schedutil'调控器,与Clear Linux的'performance'调控器相比可能影响性能表现测试过程中监测了功耗数据,以评估Clear Linux优化对CPU能效的影响
Breaking the WASM/JS communication performance barrier10 months agohttps://github.com/ealmloff/sledgehammer_bindgenSledgehammer bindgen为JS代码提供更快的Rust批量绑定生成wasm-bindgen更通用,支持返回值处理和多类型交互,适合大多数用户Sledgehammer专为需要底层快速DOM访问的Web框架设计Sledgehammer可与wasm-bindgen同时使用字符串解码开销大:wasm-bindgen每字符串调用TextDecoder.decode,而Sledgehammer每批次调用一次对小字符串,在JavaScript中解码可避免TextDecoder.decode的开销附性能对比基准测试链接在JavaScript中缓存字符串可避免重复解码Sledgehammer的静态字符串通过指针而非值哈希Sledgehammer的操作被编码为字节序列并打包成数组操作以四个为一组按u32类型批处理,优化读取成本附操作编码效率基准测试链接
Constrained languages are easier to optimize10 months agohttps://jyn.dev/constrained-languages-are-easier-to-optimize/现代低级语言由于复杂的别名分析和内存分配/释放机制而难以优化Haskell的引用透明性允许更轻松的优化(如流融合),而C语言则受困于指针别名问题函数式并行语言Futhark通过使用未装箱的固定大小整数和静态数组尺寸约束实现高性能SQL的声明式特性使其能随时间推移获得显著的性能提升(如Postgres基准测试所示)原始指针有时对特定内存优化是必要的,但在通用编程语言中应尽量减少使用Rust通过可选原始指针和函数式范式实现了优化友好的设计,代表着正确的发展方向未来属于能轻松实现专业语言互操作的元语言系统,这将带来最佳性能
Disabling telemetry in ByteDance's VSCode fork increases data sent to its server10 months agohttps://github.com/segmentationf4u1t/trae_telemetry_research字节跳动分叉版VS Code编辑器Trae IDE存在资源过度消耗问题,33个进程数量远超原版VSCode的9个即使用户禁用设置,仍持续向字节跳动服务器回传遥测数据社区管理存在审查行为,诸如'track'等关键词会触发自动禁言机制遥测系统收集详细设备信息、使用习惯、性能指标及唯一识别码资源占用达VSCode的6倍,且遥测功能关闭选项实际无效数据收集过程不透明,所有信息均被传输至字节跳动基础设施
The Useless UseCallback10 months agohttps://tkdodo.eu/blog/the-useless-use-callback文章讨论了在React中过度且经常不必要地使用`useCallback`和`useMemo`来进行性能优化的问题。记忆化主要用于两个目的:通过避免不必要的重新渲染来优化性能,以及通过保持引用稳定性来防止副作用过于频繁地触发。文章指出了记忆化无用的场景,例如将回调函数传递给未记忆化的组件或不依赖引用稳定性的React内置组件时。一个常见的陷阱是在内部钩子中使用非原始值作为依赖项,如果这些依赖项不稳定,会导致记忆化失效,从而引发不必要的重新渲染或副作用执行。文章以Sentry代码库中的一个真实案例为例,展示了嵌套依赖如何破坏记忆化链,使得最初的记忆化变得毫无意义。针对过度记忆化的问题,文章提出了替代方案,包括'最新引用模式'和即将推出的React特性`useEffectEvent`,该特性旨在简化副作用中的依赖管理,无需手动记忆化。作者主张减少对记忆化的依赖,因为其复杂性和脆弱性,并建议未来的编译器优化或React特性可能会更有效地处理这些情况。
Lance v2: A columnar container format for modern data (2024)10 months agohttps://blog.lancedb.com/lance-v2/Lance v2的推出旨在解决现有格式(如Parquet)在处理AI/ML工作负载时效率低下的问题。Lance v2的关键用例包括点查询、宽列、超宽模式、灵活编码和灵活元数据。Lance v2取消了行组概念,通过优化理想页大小和解耦I/O与计算来提升性能。该格式允许各列长度不同,支持'逐数组'或'逐批'的数据写入方式。Lance v2将编码视为扩展功能,无需修改文件格式即可轻松添加新编码。该格式不强制类型系统,保持规范简洁并避免生态系统碎片化。数据放置的灵活性(页缓冲/列缓冲/文件缓冲)支持传统表格数据之外的新用例。Lance v2的统计信息作为编码过程的一部分,支持区域映射、布隆过滤器等多种形式。Lance v2的初始实现已发布,其性能可与最佳Parquet阅读器相媲美。社区正在寻求帮助以扩展用例、基准测试、集成测试和生态系统整合。