DuckLake v1.0
4 days ago
- #database
- #lakehouse
- #data-lake
- DuckLake v1.0 是一款生产就绪的湖仓格式规范,它将元数据存储在数据库中,而非对象存储中的分散文件里。
- DuckDB 的 ducklake 扩展作为参考实现,支持 SQLite、PostgreSQL 和 DuckDB 作为目录,现已成为 DuckDB 十大核心扩展之一。
- v1.0 版本的关键功能包括针对小型操作的数据内联、用于性能优化的排序表、桶分区、几何与变体类型支持,以及实验性的删除向量。
- 社区采用情况包括 Apache DataFusion、Apache Spark、Trino 和 Pandas 的客户端支持,已在数十家公司投入生产使用,并由 MotherDuck 提供托管服务。
- DuckLake v1.1 的未来计划包括变体内联和多删除向量 puffin 文件,而 v2.0 版本可能侧重于类似 Git 的分支、基于权限的角色和增量物化视图。