Hasty Briefsbeta

全部标签

#performance

共 528 篇

双语

lsr: ls with io_uring
10 months ago
- lsr是一个类似ls的命令行工具，但通过io_uring进行了性能优化
- 安装需要Zig 0.14.0版本，可通过带特定参数的`zig build`命令完成
- 使用方式支持多种显示选项，如`--all`、`--long`及各类排序参数
- 基准测试表明lsr在速度和系统调用效率上优于ls、eza、lsd和busybox等工具
- 性能指标展示了不同文件数量下的表现，突显lsr结合io_uring的高效性
Fcrand (Go language): drop-in replacement for crypto/rand, up to 10x faster
10 months ago
- fcrand 是 Go 语言 crypto/rand 的高性能直接替代方案
- 对于≤512字节的随机数据请求，它提供高达10倍的性能提升，同时保持加密安全性
- 100% API 兼容 crypto/rand，实现真正的无缝替换
- 与 crypto/rand 相同，零配置且线程安全
- 通过 `go get -u github.com/sdrapkin/fcrand` 安装，导入方式为 `rand "github.com/sdrapkin/fcrand"`
- 支持 FIPS-140 标准，通过环境变量 `GODEBUG=fips140=on` 启用
- 性能基准测试显示小数据请求有显著加速，512+字节时回退至 crypto/rand 的性能水平
- 包含增强功能方法如 `.Text()` 和 `.Prime()`
Subreply – an open source text-only social network
10 months ago
- 微型但强大的社交网络，访问地址：subreply.com
- 使用命令 pip3 install -r requirements.txt 安装依赖
- 运行数据库迁移命令：python3 manage.py migrate
- 创建 project/local.py 文件并用 cryptography.fernet 生成 SIGNATURE
- 性能目标：每个页面请求速度在50毫秒或更低
- 代码质量：干净、易读且易于修改
Optimizations That Aren't
10 months ago
- 优化不应为了优化而优化，否则会降低代码可读性并引入错误
- 遵循结构化优化流程：确保代码正常工作 -> 精确测量性能 -> 验证是否符合需求 -> 记录结果 -> 实施优化 -> 重新验证
- 每次优化前后必须进行性能分析，以确认改进效果并避免性能倒退
- 一个COLLADA导出器的实际案例警示：未经性能分析的优化会导致算法复杂度暴增至平方级
- 缺乏优化前后性能分析的改进是无效的，反而可能导致性能严重劣化
RE#: high performance derivative-based regex matching with intersection, complem
10 months ago
- RE#是一款基于符号导数的正则表达式匹配工具
- 它避免了回溯问题，支持补集、交集以及环视等高级操作
- 该匹配算法在理论和实验上均具有输入线性复杂度
- 在基准测试中，RE#比Rust语言中第二快的正则引擎提速超71%
- 在扩展测试集上，其性能通常以数量级优势超越现有最先进的引擎
Show HN: Pogocache – Fast caching software
10 months ago
- Pogocache是一款专为低延迟和CPU效率设计的高速缓存软件，性能卓越。
- 在速度和效率方面，它超越了Memcache、Valkey、Redis、Dragonfly和Garnet等其他缓存解决方案。
- Pogocache支持多种通信协议，包括Memcache、Valkey/Redis、HTTP和Postgres，具有高度通用性。
- 可作为独立服务器程序运行，也能直接嵌入现有软件中以获得更高性能。
- 针对单线程和多线程场景均进行了优化，能充分利用多核CPU的算力优势。
- 安全功能包括TLS支持和可选的连接认证机制。
- 该软件专为64位Linux和MacOS系统设计。
- 具备内存回收策略、条目过期机制和高效内存管理等特性。
- 未来规划包括领域专用集成、共享内存访问和企业级工具支持。
- 采用AGPL开源协议，同时提供商业支持选项。
Common Expression Language – Fast, safe expression language
10 months ago
- 通用表达式语言（CEL）是一种快速、便携且安全的表达式语言。
- CEL专为嵌入具有特定扩展功能的应用程序而设计。
- 非常适合在性能关键型应用中扩展声明式配置。
- 典型用例包括列表过滤器、验证约束和授权规则。
- CEL能安全快速地进行求值，适合高频评估场景。
- 最适合表达式频繁求值但很少修改的应用程序。
- 示例用例：根据安全策略评估HTTP请求。
- 可查阅CEL概述和语言定义以进一步探索。
Show HN: Go Command-streaming lib for distributed systems (3x faster than gRPC)
10 months ago
- cmd-stream-go 是一个基于命令模式的高性能、模块化Go语言客户端-服务器库
- 支持通过TCP/TLS实现高效低延迟的流式通信与可观测性
- 客户端向服务器发送命令，由调用者执行，接收器提供服务器端功能
- 特性包括：TCP/TLS/mTLS支持、异步客户端、服务器流式传输、重连、保活、熔断器模式、OpenTelemetry集成和模块化设计
- 子模块代码覆盖率高达90%，主模块包含基础集成测试
- 性能优化建议：使用N个并行连接、预建立连接、保持长连接
- 可作为现有RPC系统的更快速传输层
- 模块化架构包含core-go、delegate-go、handler-go和transport-go子模块
- 设计上支持轻松替换库的任何组件
Pogocache 1.0 – Claims Better Performance Than Memcache, Valkey and Redis
10 months ago
- Pogocache 1.0作为一款快速开源缓存软件发布
- 宣称性能优于Memcache、Valkey、Redis、Garnet和Dragonfly
- 支持多协议：Memcache、Valkey、Redis、HTTP及Postgres
- 采用C语言编写并以AGPLv3协议开源
- 与竞品的性能基准测试及未来发展仍有待观察
Hyperpb: 10x faster dynamic Protobuf parsing that's faster than generated code
10 months ago
- hyperpb是一个完全动态的Protobuf解析器，其速度比dynamicpb快10倍，比使用生成代码解析快3倍。
- 在基准测试中，它匹配甚至超越了vtprotobuf生成代码的性能，同时不牺牲正确性。
- hyperpb能以类型感知的方式处理和验证大量任意流式数据。
- 该项目是为解决构建Bufstream时遇到的性能瓶颈而开发，实现了基于Protobuf的代理端验证。
- hyperpb全面支持proto2、proto3和editions模式的所有模式，与Protobuf Go完美兼容。
- 该解析器需要在运行时编译（类似正则表达式库），并包含配置文件引导优化等高级功能。
- hyperpb已开源以促进Protobuf的广泛采用，并邀请社区参与共同改进。
- Buf公司正在招聘有意从事hyperpb等创新项目的开发者。
Show HN: Quite Fast, sharded cache for Go with LRU/LFU, TTL and object pooling
10 months ago
- Kioshun缓存库基准测试结果显示GET操作性能高达3.26亿次/秒
- 通过`go get github.com/unkn0wn-root/kioshun`即可简单安装
- 快速入门示例演示了Set、Get、Delete等基础缓存操作
- 配置选项包含MaxSize（最大容量）、ShardCount（分片数）、CleanupInterval（清理间隔）、DefaultTTL（默认存活时间）和EvictionPolicy（淘汰策略）
- 采用分片架构减少锁竞争，支持根据CPU核心数自动分片及最优分片数量
- API参考包含Set、Get、Delete、Exists、Clear、Size、Stats、Close等方法
- HTTP中间件兼容多种框架（Gin/Echo/Chi/Gorilla Mux），支持可配置的缓存策略
- 缓存失效设置需基于路径的键生成器才能实现模式匹配失效功能
XOR_singleheader: Header-only binary fuse and XOR filter library
10 months ago
- 布隆过滤器用于快速检查集合成员关系，但异或过滤器和二进制保险丝过滤器是更快速、更简洁的替代方案。
- 二进制保险丝过滤器和异或过滤器天然具有可压缩性，且比布谷鸟过滤器更小巧。
- 该库仅需头文件即可使用，同时实现了二进制保险丝和异或过滤器，并在Apache许可证下开源。
- 基本用法包括通过`binary_fuse8_allocate`、`binary_fuse8_populate`和`binary_fuse8_contain`等函数分配、填充和查询过滤器。
- 提供8位和16位版本，其中16位版本以更多内存为代价提供更低的误报概率。
- 序列化选项包含解包（更快）和打包（更小但更慢）两种格式。
- 构建二进制保险丝过滤器需要临时内存（约每个条目24字节），但也可以通过较慢的速度使用最小临时内存完成。
- 该库包含测试和基准测试工具，用于评估性能和正确性。
- 欢迎提交错误报告和修复，但本项目不追求在所有静态分析工具下完全无警告。
New Aarch64 Back End
10 months ago
- Andrew Kelley和Jacob Young引入的新Aarch64后端，通过79%的行为测试并带来显著性能提升
- 在预定的Zig SHOWTIME节目中讨论了2026年Zig发展路线图
- 实现并行自托管代码生成，编译速度提升5%至50%
- 自托管x86后端现成为Debug模式默认选项，编译速度超越LLVM
- Loris Cro发布Zig构建系统入门视频，详解软件包创建与模块导入
- 新增FreeBSD和NetBSD交叉编译支持，可为目标系统构建二进制文件
- 网站升级至Zine 0.10.0版本，转型为具备新功能的独立可执行程序
- 改进的UBSan错误信息为C语言交互中的未定义行为提供清晰诊断
- 无Libc的Zig现已在内存分配和性能基准测试中超越Glibc版Zig
- Alex Rønne Petersen开发的LLDB分支增强了自托管后端的调试支持
High-Performance Shell Kit
10 months ago
- 开发者面临命令行工具运行缓慢且臃肿的问题。
- Oh My Zsh等流行框架导致启动延迟和复杂性增加。
- 用户不得不在性能低下和手动配置之间做出选择。
- 高性能Shell工具包提供开箱即用的轻量级解决方案。
- 内置提示符定制、模糊搜索和自动补建议等一流工具。
- 提供快速、强大且即装即用的终端体验。
- 通过简易安装程序消除臃肿组件和繁琐的手动配置。
Final Benchmarks of Clear Linux on Intel: ~48% Faster Than Ubuntu Out-of-the-Box
10 months ago
- 英特尔已终止Clear Linux项目，这是一个针对x86_64处理器优化的高性能Linux发行版
- Clear Linux曾以激进的编译器调优、内核补丁和全系统优化著称，在英特尔和AMD硬件上均保持性能领先
- 最终基准测试显示，在英特尔至强Max服务器上，Clear Linux开箱即用的性能比Ubuntu 25.04快约48%
- Clear Linux针对AVX-512及更新的英特尔指令集架构特性进行了深度优化，使其成为高性能计算的理想选择
- 基准测试在搭载双路至强Max 9468处理器、512GB内存和NVMe存储的超微Hyper SuperServer上进行
- Clear Linux 43760采用Linux 6.15.5内核、GCC 15.1.1和Python 3.13，而Ubuntu 25.04使用Linux 6.14、GCC 14.2和Python 3.13
- Ubuntu 25.04默认使用'schedutil'调控器，与Clear Linux的'performance'调控器相比可能影响性能表现
- 测试过程中监测了功耗数据，以评估Clear Linux优化对CPU能效的影响
Breaking the WASM/JS communication performance barrier
10 months ago
- Sledgehammer bindgen为JS代码提供更快的Rust批量绑定生成
- wasm-bindgen更通用，支持返回值处理和多类型交互，适合大多数用户
- Sledgehammer专为需要底层快速DOM访问的Web框架设计
- Sledgehammer可与wasm-bindgen同时使用
- 字符串解码开销大：wasm-bindgen每字符串调用TextDecoder.decode，而Sledgehammer每批次调用一次
- 对小字符串，在JavaScript中解码可避免TextDecoder.decode的开销
- 附性能对比基准测试链接
- 在JavaScript中缓存字符串可避免重复解码
- Sledgehammer的静态字符串通过指针而非值哈希
- Sledgehammer的操作被编码为字节序列并打包成数组
- 操作以四个为一组按u32类型批处理，优化读取成本
- 附操作编码效率基准测试链接
Constrained languages are easier to optimize
10 months ago
- 现代低级语言由于复杂的别名分析和内存分配/释放机制而难以优化
- Haskell的引用透明性允许更轻松的优化（如流融合），而C语言则受困于指针别名问题
- 函数式并行语言Futhark通过使用未装箱的固定大小整数和静态数组尺寸约束实现高性能
- SQL的声明式特性使其能随时间推移获得显著的性能提升（如Postgres基准测试所示）
- 原始指针有时对特定内存优化是必要的，但在通用编程语言中应尽量减少使用
- Rust通过可选原始指针和函数式范式实现了优化友好的设计，代表着正确的发展方向
- 未来属于能轻松实现专业语言互操作的元语言系统，这将带来最佳性能
Disabling telemetry in ByteDance's VSCode fork increases data sent to its server
10 months ago
- 字节跳动分叉版VS Code编辑器Trae IDE存在资源过度消耗问题，33个进程数量远超原版VSCode的9个
- 即使用户禁用设置，仍持续向字节跳动服务器回传遥测数据
- 社区管理存在审查行为，诸如'track'等关键词会触发自动禁言机制
- 遥测系统收集详细设备信息、使用习惯、性能指标及唯一识别码
- 资源占用达VSCode的6倍，且遥测功能关闭选项实际无效
- 数据收集过程不透明，所有信息均被传输至字节跳动基础设施
The Useless UseCallback
10 months ago
- 文章讨论了在React中过度且经常不必要地使用`useCallback`和`useMemo`来进行性能优化的问题。
- 记忆化主要用于两个目的：通过避免不必要的重新渲染来优化性能，以及通过保持引用稳定性来防止副作用过于频繁地触发。
- 文章指出了记忆化无用的场景，例如将回调函数传递给未记忆化的组件或不依赖引用稳定性的React内置组件时。
- 一个常见的陷阱是在内部钩子中使用非原始值作为依赖项，如果这些依赖项不稳定，会导致记忆化失效，从而引发不必要的重新渲染或副作用执行。
- 文章以Sentry代码库中的一个真实案例为例，展示了嵌套依赖如何破坏记忆化链，使得最初的记忆化变得毫无意义。
- 针对过度记忆化的问题，文章提出了替代方案，包括'最新引用模式'和即将推出的React特性`useEffectEvent`，该特性旨在简化副作用中的依赖管理，无需手动记忆化。
- 作者主张减少对记忆化的依赖，因为其复杂性和脆弱性，并建议未来的编译器优化或React特性可能会更有效地处理这些情况。
Lance v2: A columnar container format for modern data (2024)
10 months ago
- Lance v2的推出旨在解决现有格式（如Parquet）在处理AI/ML工作负载时效率低下的问题。
- Lance v2的关键用例包括点查询、宽列、超宽模式、灵活编码和灵活元数据。
- Lance v2取消了行组概念，通过优化理想页大小和解耦I/O与计算来提升性能。
- 该格式允许各列长度不同，支持'逐数组'或'逐批'的数据写入方式。
- Lance v2将编码视为扩展功能，无需修改文件格式即可轻松添加新编码。
- 该格式不强制类型系统，保持规范简洁并避免生态系统碎片化。
- 数据放置的灵活性（页缓冲/列缓冲/文件缓冲）支持传统表格数据之外的新用例。
- Lance v2的统计信息作为编码过程的一部分，支持区域映射、布隆过滤器等多种形式。
- Lance v2的初始实现已发布，其性能可与最佳Parquet阅读器相媲美。
- 社区正在寻求帮助以扩展用例、基准测试、集成测试和生态系统整合。

About|Login

#performance

lsr: ls with io_uring

Fcrand (Go language): drop-in replacement for crypto/rand, up to 10x faster

Subreply – an open source text-only social network

Optimizations That Aren't

RE#: high performance derivative-based regex matching with intersection, complem

Show HN: Pogocache – Fast caching software

Common Expression Language – Fast, safe expression language

Show HN: Go Command-streaming lib for distributed systems (3x faster than gRPC)

Pogocache 1.0 – Claims Better Performance Than Memcache, Valkey and Redis

Hyperpb: 10x faster dynamic Protobuf parsing that's faster than generated code

Show HN: Quite Fast, sharded cache for Go with LRU/LFU, TTL and object pooling

XOR_singleheader: Header-only binary fuse and XOR filter library

New Aarch64 Back End

High-Performance Shell Kit

Final Benchmarks of Clear Linux on Intel: ~48% Faster Than Ubuntu Out-of-the-Box

Breaking the WASM/JS communication performance barrier

Constrained languages are easier to optimize

Disabling telemetry in ByteDance's VSCode fork increases data sent to its server

The Useless UseCallback

Lance v2: A columnar container format for modern data (2024)